Génotypage par séquençage de faible profondeur (GBS) d'une population bovine: stratégies pour maximiser la sélection des génotypes de haute qualité et la précision de l'imputation

Citation

Brouard et al. 2017. Génotypage par séquençage de faible profondeur (GBS) d'une population bovine: stratégies pour maximiser la sélection des génotypes de haute qualité et la précision de l'imputation. BMC Genetics 18:32.

Résumé en langage clair

Les avancées techniques dans les méthodes de séquençage et les progrès en génomique ont eu un impact majeur dans l’évaluation génétique et la sélection des animaux d’élevage comme le bovin laitier. Dans les années qui ont suivies le séquençage du génome bovin en 2004, des puces électroniques de génotypage comme la puce Illumina SNP50 ont été commercialisées. Cette puce permet de tester la présence de 50 000 variations génétiques potentielles chez les animaux testés. Plus récemment, une nouvelle technique appelée Génotypage-par-Séquençage (GBS) a été développée. Cette technique fait appel au séquençage du génome et à des enzymes qui le fragmente de manière reproductible. En utilisant cette approche, on peut vérifier la présence de variations génétiques sur des dizaines de milliers de fragments du génome. Dans cette étude, nous avons comparé la performance de deux versions de cette technique : la méthode conventionnelle et une méthode plus sélective. Cette dernière vise à diminuer le nombre de fragments pour en augmenter le niveau de séquençage. Ainsi, on pourrait s’attendre à de meilleurs niveaux de séquençage en raison du nombre réduit de fragment que génère cette technique. En faisant appel à des outils bio-informatiques, nous décrivons également différentes procédures de sélection visant à obtenir des informations génétiques qui soient de la meilleure qualité possible.
Les résultats ont montré que la méthode conventionnelle de la technique GBS permettait d’identifier environ 272 000 variations comparativement à environ 123 000 pour la méthode sélective. La justesse de l’information produite par ces deux méthodes a été évaluée en comparant les résultats obtenus avec ceux produits par la puce SNP50. De manière surprenante, les résultats indiquent que l’information génétique produit par la méthode conventionnelle plus juste que celle provenant de la méthode sélective. La méthode conventionnelle demeure plus performante même si elle produit en moyenne des niveaux de séquençage plus faibles que la méthode sélective. Nos résultats montrent en outre qu’une analyse de données GBS faite avec des critères de contrôle de qualité judicieux permet d’obtenir une information génétique de grande qualité avec des niveaux de séquençage relativement faibles. Nous identifions également des facteurs qui contribuent à améliorer la justesse de l’information génétique obtenue lors de l’extrapolation des données manquantes associées à la méthode GBS.
Dans l’ensemble, les résultats ont révélé que la version conventionnelle de la méthode GBS avait le potentiel de tester un nombre considérable de variations sur le génome bovin et que l’information génétique obtenue par cette méthode pouvait être de grande qualité pour autant que des critères de sélection judicieux soient appliqués. Les résultats présentés dans cet article proposent un cadre pratique pour l'analyse des données de GBS et fournissent des stratégies pour maximiser le rendement de cette technique dans les populations animales, notamment chez le bovin. Nous démontrons que la technique GBS est une alternative crédible à la puce de génotypage SNP50 pour identifier des variations génétiques associés à nos populations et à la problématique étudiée. En effet, le GBS permettra de tester à moindre coût des variations génétiques chez le bovin laitier atteint de paratuberculose.

Résumé

Contexte
Le génotypage par séquençage (GBS) est apparu comme une approche puissante et rentable pour la découverte et le génotypage des polymorphismes à un seul nucléotide. La technique GBS a été largement utilisée pour les plantes où sa faible couverture de séquence n'est pas un inconvénient pour l'appel des génotypes, car les lignées sont presque homozygotes. En revanche, seules quelques études ont utilisé la technique GBS dans les populations animales (avec des taux d'hétérozygotie importants) et beaucoup de ceux qui ont été publiés n'ont pas considéré la qualité des génotypes produits par les pipelines bioinformatiques. Pour améliorer la couverture séquentielle des fragments, un nouveau protocole de préparation de GBS qui comprend des amorces sélectives pendant l'étape d'amplification par PCR a été récemment proposé. Dans cette étude, nous avons comparé ce protocole modifié avec le protocole GBS à deux enzymes conventionnel. Nous avons également décrit diverses procédures pour maximiser la sélection de génotypes de haute qualité et pour augmenter la précision de l'imputation.
Résultats
Les digestions in silico du génome bovin ont montré que la combinaison de PstI et MspI est plus appropriée pour le séquençage des bibliothèques bovines GBS que l'utilisation de digestions simples avec PstI ou ApeKI. La sortie séquentielle des bibliothèques GBS a généré un total de 123 666 variantes avec l'approche amorce sélective et 272,103 variantes avec l'approche conventionnelle. En validant nos données avec les génotypes obtenus à partir de la spectrométrie de masse et du réseau SNP50 bovin d'Illumina, nous avons constaté que les génotypes produits par la méthode GBS classique étaient concordants avec ceux produits par ces méthodes de génotypage alternatives, alors que la méthode d'amorçage sélectif n'a pas réussi à appeler les hétérozygotes en toute confiance. Nos résultats indiquent qu'une grande précision dans l'appel de génotypes (> 97%) peut être obtenue en utilisant des seuils de faible profondeur de lecture (3 à 5 lectures) à condition que les marqueurs soient simultanément filtrés pour les scores de qualité génotypique. Nous montrons également que des facteurs tels que le taux d'appel minimum et la fréquence de l'allèle mineur influencent positivement la précision de l'imputation des données GBS manquantes. Les précisions les plus élevées (environ 85%) des marqueurs GBS imputés ont été obtenues avec le programme FIMPUTE lorsque les génotypes généraux GBS et SNP50 ont été combinés (80,190 à 100,297 marqueurs) avant imputation.
Conclusions
Nous avons découvert que le protocole conventionnel GBS à deux enzymes pourrait produire un grand nombre de génotypes de haute qualité à condition que des critères de filtration appropriés soient utilisés. En revanche, l'approche de l'amorçage sélectif a entraîné une proportion importante de génotypes mal appelés et devrait être évitée pour les études de génotypage du bétail. Dans l'ensemble, notre étude démontre que l'ajustement soigneux des différents paramètres de filtrage appliqués aux données GBS est essentiel pour maximiser la sélection des génotypes de haute qualité et pour augmenter la précision de l'imputation des données manquantes. Les stratégies et les résultats présentés ici fournissent un cadre pour maximiser la sortie de la technique GBS dans les populations animales et ont qualifié le dosage PstI / MspI GBS en tant que plate-forme de génotypage à haute densité à faible coût. Les conclusions présentées ici concernant la profondeur de la lecture et le filtrage de la qualité du génotype pourraient bénéficier à de nombreuses applications GBS, notamment des études d'association à l'échelle du génome, où il est nécessaire d'augmenter la densité des marqueurs génotypés dans toute la population cible tout en préservant la qualité des génotypes.