Physical mapping and BAC-end sequence analysis provide initial insights into the flax (Linum usitatissimum L.) genome

Citation

Ragupathy, R., Rathinavelu, R., et Cloutier, S. (2011). « Physical mapping and BAC-end sequence analysis provide initial insights into the flax (Linum usitatissimum L.) genome. », BMC Genomics, 12:217. doi : 10.1186/1471-2164-12-217

Résumé

Contexte. L’huile de lin (Linum usitatissimum L.) est une importante source d’acides gras oméga‑3, dont les effets bénéfiques pour la santé sont bien connus. Ces acides gras servent également de matières premières industrielles. Outre l’huile, les graines de lin contiennent aussi des lignanes, des substances associées à la réduction du risque de certains types de cancers. Les fibres libériennes de la plante ont aussi différentes applications industrielles. Comme il n’existait pas d’outils génomiques pour l’amélioration moléculaire du lin, le projet TUFGEN (Total Utilization Flax GENomics) a été entrepris. Nous présentons, ici, la première carte physique du génome du lin ainsi que l’analyse des séquences BES (BAC-end sequences ou extrémités des séquences BAC) issues de 43 776 clones.
Résultats. La carte génomique consiste en 416 contigs qui s’étendent sur ~368 Mb, assemblés de 32 025 empreintes, et représentant 54,5 % à 99,4 % du génome haploïde estimé (370-675 Mb). Le N50 des contigs a été estimé à ~1 494 kb, le plus long ayant ~5 562 kb et comprenant 437 clones. Il y avait 96 contigs qui contenaient plus de 100 clones; environ 54,6 Mb, représentant 8 à 14,8 % du génome, provenaient de 80 337 BES. L’annotation révèle qu’une grande partie du génome consiste en ADN ribosomique (~13,8 %) et en éléments transposables connus (6,1 %). De plus, ~7.4 % de la séquence contiendrait de nouveaux éléments répétés. La recherche d’homologie dans les bases de données flax-EST et NCBI-EST a montré que ~5,6 % du transcriptome du lin est spécifique. En tout, 4 064 SSR génomiques putatifs ont été identifiés et font actuellement l’objet de travaux pour qu’on puisse les utiliser comme marqueurs moléculaires pour l’amélioration des végétaux.
Conclusion. La première carte génétique à l’échelle du génome du lin construite avec des clones BAC fournit une base d’accès aux loci présentant une importance économique dans le cadre de la mise au point de marqueurs et le clonage positionnel. L’analyse des BES permet de mieux comprendre le caractère unique du génome du lin. Comparativement au génome d’autres plantes, la proportion d’ADNr du génome du lin est très élevée alors que la proportion d’éléments transposables connus est faible. Les SSR identifiés à l’aide des BES seront utiles pour compléter les cartes de liaisons existantes de même que les cartes physiques et génétiques du lin. La carte physique et les lectures d’extrémités appariées des clones BAC serviront à établir et à valider l’assemblage du génome déterminé par séquençage global (shotgun).