Genome-wide single nucleotide polymorphism and Insertion-Deletion discovery through next-generation sequencing of reduced representation libraries in common bean
Citation
Zou, X., Shi, C., Austin, R.S., Merico, D., Munholland, S., Marsolais, F., Navabi, A., Crosby, W.L., Pauls, K.P., Yu, K., et Cui, Y. (2014). « Genome-wide single nucleotide polymorphism and Insertion-Deletion discovery through next-generation sequencing of reduced representation libraries in common bean. », Molecular Breeding, 33(4), p. 769-778. doi : 10.1007/s11032-013-9997-7
Résumé
Les polymorphismes mononucléotidiques (SNP, pour single nucleotide polymorphisms) et les insertions-délétions (indel) sont des marqueurs moléculaires précieux pour les études de génomique et de génétique de même que pour les projets d’amélioration moléculaire. Les techniques de séquençage de nouvelle génération ont permis aux chercheurs de mettre au point des méthodes à haut débit et à faible coût pour la recherche de SNP et d’indel à l’échelle du génome. Dans les travaux que nous présentons ici, nous avons utilisé 36 génotypes du haricot commun cultivés au Canada pour construire des banques à « représentation réduite » en vue du séquençage de nouvelle génération. En utilisant 76 millions de lectures de séquence générées par le système Illumina HiSeq 2000, nous avons identifié 43 698 SNP présumés et 1 267 indel présumées. Parmi les SNP, 43 504 étaient bi-alléliques et 194 étaient tri-alléliques, tandis que les indel comprenaient 574 insertions et 693 délétions. Les SNP bi-alléliques étaient répartis sur les 11 chromosomes, le nombre le plus élevé (4 788) se trouvant sur le chromosome 2 et le nombre le plus faible (2 941), sur le chromosome 10. Avec la publication récente de la première version chromosomique du Phaseolus vulgaris, nous avons localisé 24 907 SNP bi-alléliques, 79 SNP tri-alléliques, 315 insertions et 377 délétions dans 8 758, 77, 273 et 364 gènes, respectivement. Parmi les 24 907 SNP bi-alléliques, 7 168 étaient non synonymes et concernaient 4 303 gènes. Nous avons choisi au hasard 113 SNP présumés que nous avons cherché à valider au moyen de l’analyse haute résolution des courbes de fusion. Sur ces 113 SNP, 105 (92,9 %) contenaient le polymorphisme prévu.