LTR Annotator: Automated Identification and Annotation of LTR Retrotransposons in Plant Genomes.
Citation
You, F.M., Cloutier, S., Shan, Y.F., et Ragupathy, R. (2015). « LTR Annotator: Automated Identification and Annotation of LTR Retrotransposons in Plant Genomes. », International Journal of Bioscience, Biochemistry and Bioinformatics, 5(3), p. 165-174. doi : 10.17706/ijbbb.2015.5.3.165-174
Résumé
Les éléments transposables à longue répétition terminale (LTR, pour Long Terminal Repeat) sont un type important d’éléments mobiles que l’on retrouve dans tous les génomes d’eucaryotes. Ils représentent une grande proportion du génome de nombreuses plantes et ont un effet notable sur l’évolution de la taille, de la structure et de la fonction du génome. Même si certains outils de bio-informatique ont été mis au point pour l’identification de novo de LTR dans des séquences génomiques, un logiciel automatisé et normalisé pour l’identification et l’annotation des LRT serait très utile et essentiel pour comparer les génomes de végétaux séquencés. Nous présentons ici un pipeline basé sur la programmation Java, désigné LTR Annotator, pour l’identification et l’annotation de novo automatisées et uniformes de LTR dans les séquences génomiques de végétaux. Le pipeline commence par identifier les LTR avec LTR_FINDER et LTR harvest, puis il procède aux annotations en profondeur et, finalement, il élimine les LTR faussement positifs. Nous avons évalué le pipeline avec le génome bien organisé d’Arabidopsis. Nous avons obtenu une grande sensibilité (> 0,9) avec LTR harvest ou LTR harvest+LTR_FINDER. Dix nouveaux LTR potentiels ont été découverts. Ce pipeline est un outil indéniable pour comparer les LTR des génomes de végétaux, annoter des ressources génomiques destinées, entre autres, à des études épigénétiques. Le système d’annotation des LTR est gratuit et disponible sur demande.