PIPE4 : Prédicteur rapide d’IPP pour des interactions interspécifiques et interspécifiques complètes

Citation

Dick, K., Samanfar, B., Barnes, B., Cober, E.R., Mimee, B., Tan, L.H., Molnar, S.J., Biggar, K.K., Golshani, A., Dehne, F., Green, J.R. (2020). PIPE4: Fast PPI Predictor for Comprehensive Inter- and Cross-Species Interactomes. Scientific Reports, [online] 10(1), http://dx.doi.org/10.1038/s41598-019-56895-w

Résumé en langage clair

Le soja est l’une des plus importantes sources d’huile et de protéines végétales dans le monde et une légumineuse importante pour l’économie canadienne. Pour étendre la culture du soja plus au nord et à l’ouest du Canada, il est essentiel d’identifier et de caractériser les gènes conférant la résistance au nématode à kyste du soja. Cependant, on comprend mal le mécanisme génétique global de la résistance au nématode à kyste du soja. Il existe une lacune particulière dans les connaissances sur la façon dont les protéines interagissent à l’intérieur des espèces et entre celles produites par le soja et celles produites par ses ravageurs. Les interactions protéine-protéine sont des interactions moléculaires essentielles qui définissent la biologie d’une cellule, son développement et ses réponses à divers stimuli. Dans le cadre de la présente étude, les auteurs ont mis au point un outil informatique capable de prédire les interactions protéine-protéine à l’échelle du génome du soja. Cet outil a été utilisé pour prédire les interactions protéine-protéine pertinentes aux effets que le nématode à kystes du soja a sur le soja et pour identifier les gènes candidats pour la résistance au nématode à kystes du soja, ce qui pourrait avoir un impact agricole et économique de grande envergure pour faciliter l’expansion des cultures de soja dans canadienne. De plus, les outils mis au point pour prédire les interactions protéine-protéine peuvent être largement appliqués à d’autres espèces et interactions.

Résumé

© 2020, Les auteurs. La nécessité d’effectuer des tâches de prédiction de l’interaction protéine-protéine (IPP) à plus grande échelle et de plus en plus complexes exige que les prédicteurs de pointe soient hautement efficaces et adaptés aux prédictions interspécifiques et interspécifiques. De plus, la capacité de générer des interactomes complets a permis d’évaluer chaque IPP dans le contexte de toutes les prédictions, ce qui a permis d’améliorer encore la performance de classification face à un déséquilibre de classe extrême à l’aide du cadre de la perspective réciproque. Nous décrivons ici l’algorithme PIPE4. L’adaptation de l’étape de prétraitement de la séquence PIPE3/MP-PIPE a permis une accélération de plus de 50 fois, et le nouveau score de similarité pondéré normalise de manière appropriée la fréquence de la fenêtre lorsqu’il est appliqué à des schémas de prédiction interspécifiques et interspécifiques. Nous générons des interactomes complets pour trois schémas de prédiction : (1) des prédictions interspécifiques, où Arabidopsis thaliana est utilisé comme approximation pour prédire l’interactome complet de Glycine max, (2) des prédictions interspécifiques entre l’Homo sapiens-HIV1, et (3) un schéma combiné faisant intervenir des prédictions interspécifiques et interspécifiques , où Arabidopsis thaliana et Caenorhabditis elegans sont utilisés comme espèces substitutives pour prédire l’interactome entre Glycine max (la légumineuse du soja) et Heterodera glycines (le nématode à kyste du soja). La comparaison de PIPE4 avec l’état de l’art a permis d’améliorer la performance, ce qui indique qu’il devrait s’agir de la méthode de choix pour les schémas de prédiction d’IPP complexes.