Assemblage du génome du cultivar canadien d’orge brassicole à deux rangs AAC Synergy

Citation

Xu, W., Tucker, J.R., Bekele, W.A., You, F.M., Fu, Y.B., Khanal, R., Yao, Z., Singh, J., Boyle, B., Beattie, A.D., Belzile, F., Mascher, M., Tinker, N.A., Badea, A. (2021). Genome assembly of the canadian two-row malting barley cultivar AAC synergy. G3: Genes, Genomes, Genetics, [online] 11(4), http://dx.doi.org/10.1093/g3journal/jkab031

Résumé en langage clair

L’orge (Hordeum vulgare L.) est l’une des cultures les plus importantes à l’échelle mondiale. Le génome de référence du cultivar Morex à six rangs (dont tous les épillets sont fertiles), qui constitue une base de données de séquences d’acides nucléiques assemblée à titre d’exemple représentatif de l’ensemble des gènes d’un organisme, a été utilisé par la communauté internationale des chercheurs spécialisés dans l’orge. Cependant, ce génome de référence peut présenter des limites lorsqu’il est utilisé pour des analyses génomiques et génétiques avec du matériel génétique d’orge à deux rangs (dont seul l’épillet central est fertile), ce qui est plus courant dans le cas de l’orge brassicole au Canada. Dans les présents travaux, nous avons assemblé pour la première fois la séquence du génome d’une orge brassicole canadienne à deux rangs, à savoir le cultivar AAC Synergy. Nous avons évalué l’exhaustivité et l’annotation (c.-à-d. la détermination de l’emplacement des gènes) de l’assemblage en le comparant à la version mise à jour de l’assemblage du génome du cultivar Morex (six rangs) et de l’assemblage du génome du cultivar Golden Promise (deux rangs), qui ont été récemment publiés.

Résumé

L’orge (Hordeum vulgare L.) est l’une des cultures les plus importantes à l’échelle mondiale. Le génome de référence du cultivar Morex à six rangs a été utilisé par la communauté de la recherche sur l’orge dans le monde entier. Cependant, ce génome de référence peut présenter des limites lorsqu’il est utilisé pour des études d’analyse génomique et de diversité génétique, pour la découverte de gènes ou pour la mise au point de marqueurs dans le cadre de travaux sur du matériel génétique d’orge à deux rangs, soit le type d’orge brassicole le plus courant au Canada. Dans les présents travaux, nous avons assemblé pour la première fois la séquence du génome d’une orge brassicole canadienne à deux rangs, à savoir le cultivar AAC Synergy. Nous avons eu recours à un séquençage Illumina profond de type « paired-end », à des lectures longues de type « mate-pair », à des séquences PacBio, à des banques de lectures liées 10X et au séquençage de capture de conformation chromosomique (Hi-C) pour générer un assemblage contigu. Le génome assemblé à partir de super-échafaudages avait une taille de 4,85 Gb, un N50 de 2,32 Mb et, selon les estimations, 93,9 % de l’ensemble des gènes d’une base de données végétales (BUSCO, benchmarking universal single copy orthologues genes). Après le retrait des petits échafaudages (< 300 Kb), l’assemblage a été organisé en pseudomolécules de 4,14 Gb, avec sept chromosomes et des échafaudages non ancrés. Nous avons évalué l’exhaustivité et l’annotation de l’assemblage en le comparant aux assemblages actuels du génome des cultivars Morex et Golden Promise.