^-A ⁺A

L’intelligence artificielle apporte de nouveaux outils à l'astronomie

Une équipe de recherche vient de publier les résultats de son étude dans la revue scientifique Astrophysical Journal. Dans cette nouvelle étude, les chercheurs ont utilisé des simulations informatiques de la formation de galaxies pour entrainer un algorithme d'apprentissage profond afin d’identifier des processus physiques dans des images des galaxies prises avec le télescope spatial Hubble.

Dans cette étude, l’équipe de recherche a utilisé les résultats des simulations informatiques très haute résolution pour générer des images simulées de galaxies jeunes, à l’image de ce qu’ils feraient dans les observations du télescope spatial Hubble. Les images simulées ont ensuite été utilisées pour former le système d'apprentissage profond afin de reconnaître trois phases clés de l'évolution des galaxies précédemment identifiées dans les simulations. Les galaxies sont des phénomènes complexes qui changent d'apparence au fil des milliards d’années. Alors que dans les simulations toute l’histoire de formation des galaxies est connue car codée avec nos connaissances de la physique dans les programmes informatiques, dans les observations nous ne sommes en mesure que d’obtenir des instantanées de la vie d’une galaxie.

“La comparaison entre la théorie imprimée dans les simulations et les observations est toujours affectée par cette limitation intrinsèque” dit M. Huertas-Company, auteur principal de l'étude, chercheur à l'Observatoire de Paris, professeur à l'université Paris Diderot et membre de l'Institut Universitaire de France.

Le défi et la nouveauté était donc de savoir si un algorithme d’apprentissage profond, comme ceux largement utilisés dans la reconnaissance faciale et d'autres applications de reconnaissance d'images et de parole, était capable d’extraire automatiquement des traceurs permettant d’identifier la phase évolutive d’une galaxie à partir des images obtenues avec des telescopes.

Dans ce premier travail de nature exploratrice, les chercheurs se sont particulièrement intéressés à un phénomène observé dans les simulations au début de l'évolution des galaxies riches en gaz, lorsque des flux importants de gaz dans le centre d'une galaxie alimentent la formation d'une petite région dense et étoilée. Cette phase a été baptisée comme phase “blue-nugget” (pépite bleue en français). Les étoiles jeunes et chaudes émettent en effet de courtes longueurs d'onde "bleues" de lumière, de sorte que le bleu indique une galaxie avec formation active d'étoiles, alors que les étoiles plus anciennes et plus froides émettent plus de lumière “rouge". L’idée était donc de classer les galaxies entre celles qui ne sont pas encore passées par la phase “blue-nugget” (pre-blue-nugget), celles qui sont entrain de la traverser (“blue-nugget”) et celles qui l’ont déjà passée (“post-blue-nugget”).

Notamment, le programme informatique a permis de révéler que la phase “blue-nugget" existe dans les observations et qu’elle se produit généralement dans des galaxies ayant une masse caractéristique. Ceci est une découverte passionnante, parce qu'elle suggère que l'algorithme d'apprentissage profond “est susceptible d’établir des contraintes temporelles à partir des seules images” déclare M. Huertas-Company.

”Il se peut que, dans une certaine gamme de tailles, les galaxies aient juste la bonne masse pour que ce processus physique se produise ", a déclaré David Koo, professeur émérite d'astronomie et d'astrophysique à l'UC Santa Cruz.

“Nous allons continuer à réaliser des tests, mais cette étude de concept prouve que les techniques actuelles d’intelligence artificielle peuvent en effet extraire des marqueurs complexes permettant d’identifier des phases évolutives des galaxies. Ceci ouvre une toute nouvelle voie pour comparer les observations et la théorie et avancer ainsi dans notre compréhension de la formation de ces systèmes complexes que sont les galaxies.” déclare M. Huertas-Company

Les chercheurs ont utilisé des simulations de galaxies de pointe (les simulations VELA) développées par Primack et une équipe internationale de collaborateurs, dont Daniel Ceverino (Université de Heidelberg), qui a réalisé les simulations, et Avishai Dekel (Université hébraïque), qui a piloté l’analyse et l’interprétation des simulations et développé de nouveaux concepts physiques à partir de celles-ci. Toutes ces simulations sont cependant limitées dans leur capacité à capturer la physique complexe de la formation des galaxies.

Pour les données d'observation, l'équipe a utilisé des images de galaxies obtenues dans le cadre du projet CANDELS (Cosmic Assembly Near-infrared Deep Extragalactic Legacy Survey), le plus grand projet de l'histoire du télescope spatial Hubble. Le premier auteur, Marc Huertas-Company, astronome à l'Observatoire de Paris et à l'Université Paris Diderot, avait déjà fait œuvre de pionnier en appliquant des méthodes d'apprentissage approfondi à la classification des galaxies à l'aide de données CANDELS accessibles au public.

Auteurs

En plus de Primack, Koo et Huertas-Company, les co-auteurs du document incluent Avishai Dekel de l'Université hébraïque de Jérusalem (et chercheur invité à l'UC Santa Cruz) ; Sharon Lapiner de l'Université hébraïque ; Daniel Ceverino de l'Université de Heidelberg ; Raymond Simons de l'Université Johns Hopkins ; Gregory Snyder du Space Telescope Science Institute ; Mariangela Bernardi et H. Dominquez Sanchez de l'Université de Pennsylvanie ; Zhu Chen de l'Université normale de Shanghai ; Christoph Lee de l'UC Santa Cruz ; et Berta Margalef-Bentabol et Diego Tuccillo de l'Observatoire de Paris.

FinancementS

Les auteurs sont reconnaissants à Google pour le don sans restriction fait à l'Université de Californie Santa Cruz pour la réalisation du projet : "deep learning for Galaxies" qui a grandement contribué à rendre ce travail possible. Ils apprécient également les discussions utiles avec Sander Dielemann, Daniel Freedman, Eric Hayashi et Jon Shlens chez Google.

Ils remercient également Frederic Bournaud d'avoir arbitré ce travail et d'avoir fourni des suggestions intéressantes.

Ces travaux ont été en partie soutenus par les subventions France-Israël PICS, US-Israel BSF 2014-273, et NSF AST-1405962. La CEC reconnaît le soutien de HST-AR-14578.001-A. AD reconnaît également le soutien de GIF I-1341-303.7/2016, DIP STE1869/2-1 GE625/17-1 et I-CORE PBC/ISF 1829/12.
Le MHC reconnaît le soutien de l'ANR ASTROBRAIN. DC a été financé par une ERC Advanced Grant, STARLIGHT : Formation des premières étoiles. Les simulations VELA ont été effectuées au National Energy Research Scientific Computing Center (NERSC) au Lawrence Berkeley National Laboratory, et au NASA Advanced Supercomputing (NASA) au NASA Ames Research Center.