Les pseudogènes et leur prédiction pangénomique chez les végétaux

Citation

Xiao J, Sekhwal MK, Li P, Ragupathy R, Cloutier S, Wang X, You FM (2016) Pseudogenes and Their Genome-Wide Prediction in Plants. Int J Mol Sci. 17(12). pii: E1991.

Résumé en langage clair

Les pseudogènes sont des copies de gènes produites à partir de gènes fonctionnels ancestraux durant l’évolution du génome. Ces gènes ont subi une accumulation de mutations de leurs séquences codantes, comme des mutations du cadre de lecture et l’insertion de codons d’arrêt prématurés, qui peuvent nuire à leur transcription ou à leur traduction. Généralement, les pseudogènes sont non fonctionnels, mais des recherches récentes montrent que certains d’entre eux pourraient jouer des rôles dans la régulation. Il existe des outils de bioinformatique destinés à la prédiction des pseudogènes, notamment PseudoPipe, PSF et le pipeline de Shiu. Nous avons comparé ces trois outils en nous servant des 924 pseudogènes connus de l’Arabidopsis thaliana comme ensemble de données témoin. PseudoPipe et le pipeline de Shiu ont repéré ~80 % des pseudogènes de l’A. thaliana, mais PSF n’a pas donné de résultats adéquats. Des outils de bioinformatique de pointe sont donc nécessaires pour améliorer le niveau de précision de la prédiction des pseudogènes et de l’annotation génomique chez les végétaux.

Résumé

Les pseudogènes sont des paralogues issus de gènes fonctionnels ancestraux (parentaux) qui ont subi des modifications au cours de l’évolution du génome et présentent des défauts majeurs dans leur séquence, par exemple l’absence d’un promoteur, la présence d’un codon d’arrêt prématuré ou des mutations du cadre de lecture. Généralement, les pseudogènes sont non fonctionnels, mais des recherches récentes montrent que certains d’entre eux pourraient jouer des rôles dans la régulation. La majorité des pseudogènes résultent de la duplication (pseudogènes dupliqués) ou de la rétrotransposition (pseudogènes processés) de gènes fonctionnels. La principale façon de cerner les pseudogènes consiste à les comparer aux gènes parentaux. Des outils de bioinformatique ont été mis au point pour prédire les pseudogènes, dont certains sont accessibles publiquement, comme PseudoPipe, PSF et le pipeline de Shiu. Nous avons comparé ces trois outils au moyen du génome abondamment annoté de l’Arabidopsis thaliana, qui compte 924 pseudogènes connus. PseudoPipe et le pipeline de Shiu ont repéré ~80 % des pseudogènes de l’A. thaliana, dont 94 % étaient communs aux deux outils, et PSF n’a pas donné de résultats adéquats. Ces résultats montrent qu’il est nécessaire d’améliorer le niveau de précision des outils de bioinformatique pour la prédiction des pseudogènes dans les génomes des végétaux, ce qui permettrait en fin de compte d’améliorer la qualité de l’annotation génomique chez les végétaux.