John Healy

Je suis mathématicien et scientifique des données à l’Institut Tutte pour les Mathématiques et le Calcul (ITMC). J'aime identifier les problèmes mathématiques fondamentaux qui sous-tendent une variété de problèmes du monde réel et travailler avec une équipe pour concevoir des algorithmes pour les résoudre. J'aime ensuite boucler la boucle en rapportant ces solutions aux clients et en les aidant à comprendre comment les utiliser pour faire la différence.
J'ai travaillé avec une grande variété de techniques d'apprentissage automatique et de statistiques au fil des ans, des réseaux de neurones artificiels à l'analyse relationnelle ou graphique. Plus récemment, mon travail s'est concentré sur l'apprentissage non supervisé et particulièrement sur les algorithmes de groupement, la détection d’anomalies, la réduction de dimension et la visualisation interactive.
Recherche et / ou projets en cours
Les projets où j'ai me suis le plus impliqué sont le développement d'une version rapide de l'algorithme de clustering basé sur la densité, HDBSCAN, qui est actuellement dans scikit-learn-contrib; l'invention et le développement d'un algorithme de réduction de dimension appelé Uniform Manifold Approximation and Projection (UMAP); et une programmathèque Python pour vectoriser des séquences de longueur variable, appelée Vectorizers.
Le thème de mon travail actuel consiste à développer un pipeline de calcul pratique et robuste pour vectoriser, explorer et étiqueter des données dans des cartes interactives de petite dimension. J'ai un intérêt particulier pour les données de cyberdéfense.
Énoncés de recherches/projets
Activités professionnelles / intérêts
Je participe activement à la promotion et à l'accompagnement en termes de science des données lors des ateliers de cyber défense Geek Week.
Liens additionnels
Principales publications
- McInnes, L, Healy, J, UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction, ArXiv e-prints 1802.03426, 2018
- Etienne Becht, Leland McInnes, John Healy, Charles-Antoine Dutertre, Immanuel WH Kwok, Lai Guan Ng, Florent Ginhoux, Evan W Newell, Dimensionality reduction for visualizing single-cell data using UMAP, Nat Biotechnol 37, 38–44 (2019)
- McInnes L, Healy J. Accelerated Hierarchical Density Based Clustering In: 2017 IEEE International Conference on Data Mining Workshops (ICDMW), IEEE, pp 33-42. 2017
- Xin Li, Ondrej E. Dyck, Mark P. Oxley, Andrew R. Lupini, Leland McInnes, John Healy, Stephen Jesse & Sergei V. Kalinin, Manifold learning of four-dimensional scanning transmission electron microscopy, npj Comput Mater 5, 5 (2019)
- M. Dewar, J. Healy, X. Perez-Gimenez, P. Pralat, J. Proos, B. Reiniger and K. Ternovsky, "Subhypergraphs in non-uniform random hypergraphs", Internet Mathematics, 2018 (2018).
- M. Dewar, J. Healy, X. Perez-Gimenez, P. Pralat, J. Proos, B. Reiniger and K. Ternovsky, "Subhypergraphs in non-uniform random hypergraphs", Lecture Notes in Computer Science, vol. 10088: Proceedings fro the 13th International Workshop on Algorithms and Models for the Web Graph, eds. Anthony Bonato, Fan Chung Graham and Pawel Pralat, Springer, New York, 2016.