SnpRecode : une fonction de recodage et de corrélation de génotypes polyvalente et rapide

Citation

2021 Marete, A. and N. Bissonnette. SnpRecode: A Versatile and Fast Genotype Recoding and Correlation Function. Research Square. doi.org/10.21203/rs.3.rs-95704/v3.

Résumé en langage clair

L'imputation du génotype est un outil essentiel utilisé dans la sélection génomique chez les plantes et les animaux. Un outil d'imputation populaire utilisé en génomique animale est FImpute. FImpute, cependant, accepte un génotype en format spécifique et produit des dosages dont la conversion s'effectue dans un format qui n'est pas évidente lorsqu'on doit traiter l'information avec d'autres logiciels. Cela nécessite d'autre action qui occasionne un temps de traitement important. Nous avons développé SnpRecode en tant qu'outil d'aide qui comble le fossé entre les fichiers de génotypes réguliers et le logiciel d'imputation FImpute. Les performances de SnpRecode sont modestes à 10 secondes/1 000 échantillons. Ce logiciel est écrit en langage de programmation Python. Le logiciel SnpRecode offre aux utilisateurs une grande flexibilité dans la mise en œuvre avec d'autres packages logiciels dans un pipeline.

Résumé

L'imputation du génotype est un outil essentiel utilisé dans la sélection génomique chez les plantes et les animaux. Un outil d'imputation populaire utilisé en génomique animale est FImpute. FImpute, cependant, accepte un génotype spécifique
format et produit des dosages dont la conversion au format VCF ou Plink nécessite plusieurs progiciels dans un pipeline avec un temps de traitement important. Nous avons développé SnpRecode en tant qu'outil d'aide qui comble le fossé entre les fichiers de génotypes réguliers et le logiciel d'imputation FImpute en permettant une conversion rapide et transparente des génotypes vers et depuis le format FImpute. SnpRecode implémente également une fonction de corrélation de génotype rapide pour estimer et tracer la précision de l'imputation. Nous effectuons des tests sur 6 000 échantillons avec un pas de 1 000 pour déterminer les performances de SnpRecode sur différentes tailles d'échantillons et l'utilisation de l'exécution et de la mémoire utilisées comme mesures de performances. Les performances de SnpRecode étaient modestes à 10 secondes/1 000 échantillons. Écrit en langage de programmation Python, SnpRecode offre aux utilisateurs une grande flexibilité dans la mise en œuvre avec d'autres packages logiciels dans un pipeline.

Date de publication

2021-07-08

Profils d'auteurs