Raffinement de pseudomolécules à l’échelle chromosomique par cartes optiques, physiques et génétiques chez le lin

Citation

You, F.M., Xiao, J., Li, P., Yao, Z., Jia, G., He, L., Zhu, T., Luo, M.C., Wang, X., Deyholos, M.K., Cloutier, S. (2018). Chromosome-scale pseudomolecules refined by optical, physical and genetic maps in flax. Plant Journal, [online] 95(2), 371-384. http://dx.doi.org/10.1111/tpj.13944

Résumé en langage clair

Le lin est une espèce annuelle à pollinisation directe de la famille des Linacées qui a été domestiquée il y a environ 7000 ans pour l’huile de ses graines et les fibres de sa tige. Les cartes génétiques des plantes cultivées d’importance économique, comme le lin, sont une ressource précieuse pour les sélectionneurs qui utilisent des stratégies de sélection moléculaire et qui étudient l’évolution et la diversification. Aujourd’hui, il est possible d’aller au-delà de la cartographie et de déchiffrer la séquence d’ADN d’un organisme. Nous avons utilisé ici une méthode dite de séquençage de nouvelle génération pour produire une grande quantité de séquences d’ADN à partir du cultivar de lin CDC Bethune. Le principal inconvénient de cette approche est la courte longueur des séquences produites par cette méthode de séquençage, ce qui complique la détermination de leur position sur les chromosomes. Pour résoudre ce problème, nous avons mis au point une carte optique du génome du lin CDC Bethune que nous avons combinée avec des cartes génétiques obtenues à partir de plusieurs croisements. Les cartes optiques sont des cartes physiques qui fournissent des informations sur de longs assemblages. Dans ce cas, de grosses molécules d’ADN sont digérées sur des surfaces de verre ouvertes et visualisées par microscopie à fluorescence pour générer des cartes de restriction ordonnées. Ce système à molécule unique fournit des codes-barres de signature, particulièrement utiles pour l’alignement et la validation des séquences de courtes lectures. Les cartes génétiques reflètent les taux de recombinaison le long des chromosomes et, en tant que telles, fournissent des informations complémentaires pour faciliter l’attribution, l’assemblage et l’orientation des séquences. Les trois types de données ont été analysés à l’aide d’une série d’analyses bioinformatiques pour générer la première séquence à l'échelle chromosomique du génome du lin. Le lin a été le premier génome végétal entièrement séquencé par une équipe canadienne. Il s’agissait du 10e séquençage du génome d’une plante, et ce rapport est le premier de son raffinement en 15 chromosomes ordonnés et orientés.

Résumé

Des génomes de différentes tailles ont été séquencés à l’aide de plateformes de séquençage de nouvelle génération. Cependant, la plupart des séquences de référence comprennent des ébauches d'échafaudages non ordonnés contenant des chimères causées par un mauvais assemblage des échafaudages. Nous avons construit une carte optique BioNano du génome (BNG) pour peaufiner la séquence du génome du lin (Linum usitatissimum L., 2n = 30, ~373 Mb), qui comprenait 3852 échafaudages de plus de 1 kb et totalisant 300,6 Mb. La carte BNG à haute résolution du cultivar CDC Bethune totalisait 317 Mb et consistait en 251 contigs BNG avec un N50 de 2,15 Mb. Un total de 622 échafaudages (286,6 Mb, 94,9 %) ont été alignés sur 211 contigs BNG (298,6 Mb, 94,2 %). De ceux-ci, 99 échafaudages, pour lesquels on avait diagnostiqué des erreurs d’assemblage, ont été raffinés en 225 nouveaux échafaudages. À l’aide des séquences d’échafaudage nouvellement affinées et de la carte physique validée fondée sur le chromosome bactérien artificiel (BAC) du CDC de Béthune, les 211 contigs BNG ont été échafaudés en 94 super contigs BNG (N50 de 6,64 Mb) qui ont ensuite été assignés aux 15 chromosomes du lin à l’aide de la carte génétique. Les pseudomolécules totalisent ~316 Mb, avec des chromosomes individuels de 15,6 à 29,4 Mb, et couvrent 97 % des gènes annotés. Les données sur les pseudomolécules à l’échelle des chromosomes semblent indiquer que le lin a subi des événements de paléopolyploïdisation et de mésopolyploïdisation, suivis de réarrangements et de délétions ou de fusions de bras chromosomiques d’un ancêtre ancien comportant un nombre haploïde de chromosomes de huit.

Date de publication

2018-07-01