Grâce à une architecture Big data, Thales a fourni au CNES une infrastructure de calcul complète, du matériel au logiciel, permettant de répondre aux besoins de la mission Gaia partie cartographier un milliard d’étoiles.

Lancé en décembre 2013 par l’Agence Spatiale Européenne (ESA), l’ambitieux satellite Gaia, aussi appelé l’arpenteur de la galaxie, s’apprête à révolutionner l’astrométrie contemporaine.

Thales Group - gaia
Lancement de Gaia depuis le Centre spatial guyanais de Kourou le 19 décembre 2013

 

Durant ses cinq années de mission, Gaia caractérisera un milliard d’étoiles avec une précision de localisation sans précédent : 20 µas pour les étoiles de magnitude 15 (soit l'épaisseur d'un cheveu vu à 1 000 km). En orbite autour du point de Lagrange L2, le satellite Gaia détermine les paramètres astrométriques et astrophysiques fondamentaux des objets observés grâce à trois instruments : un spectrophotomètre, un spectromètre et un instrument astrométrique. Chaque étoile sera observée environ 80 fois au cours de la mission. 

Une cartographie tridimensionnelle de notre galaxie pourra être ainsi dressée, permettant d’élargir les connaissances scientifiques sur la structure et l’évolution de la voie lactée. Gaia apportera également des contributions significatives dans les domaines des exo-planètes, du système solaire, des galaxies extérieures et de la physique fondamentale. 

Au vu du nombre important d’observations, le satellite Gaia produit environ 50 Go de données par jour soit plus de 100 To de données brutes à la fin de la mission. Après traitement le catalogue de données final est de l’ordre du pétaoctet (1015 octets)  et implique la mise en place d’une véritable stratégie d’exploitation pour l’obtenir. 

Devant l’inflation des spécifications d’entrée dues à la nature « recherche » du projet (multiplication par 30 du volume de données à traiter), les technologies classiques ont dû être abandonnées en faveur d’une technologie plus adaptée à la problématique Gaia. 

Grâce à une architecture Big data, Thales a fourni au CNES un système de calcul complet, du matériel au logiciel, permettant de répondre aux besoins de la mission. Ces besoins peuvent être résumés par les quatre points suivants :

  • Stockage et traitement d’un volume de données estimé entre 1 et 3 pétaoctets,
  • Traitement scientifique à appliquer sur des tables pouvant contenir jusqu'à 280 milliards d’objets,
  • Manipulation complexe de gros volumes de données : jointure, filtrage, transformation…
  • Enchainement et parallélisation complexes des traitements, besoin d’orchestration et d’ordonnancement.


La véritable innovation a été d’utiliser des outils très liés au monde du web (analyse de logs, base de données textuelles) dans un contexte scientifique.
 

Gaia voit défiler toute la galaxie

Le satellite Gaia a été envoyé dans l'espace le 19 décembre 2013 depuis le centre spatial guyanais de Kourou. Un mois plus tard, il atteignait le point de Lagrange L2. Ce point très spécial du système solaire se trouve à l’opposé du Soleil par rapport à la Terre, à 1,5 million de km de la Terre, soit 5 fois la distance Terre-Lune. Ce point tourne avec la Terre autour du Soleil avec la même période. Un an après son lancement, Gaia aura vu défiler toute la galaxie devant lui. Le centre spatial de Toulouse du CNES abrite un des 6 centres de calcul européens de la mission Gaia qui doit durer 5 ans.
 

Un très beau succès

Pour Brigitte Béhal, Responsable de la Sous-Direction Produits et Segments Sol au sein de la Direction du Centre de Toulouse (DCT) du CNES, « lorsque le développement a été lancé, nous ne savions pas si les technologies sauraient traiter le volume de données nécessaire à la constitution d'un catalogue d'un milliard d'étoiles et les problématiques de stockage de ces données étaient très importantes. Les propositions de Thales – nouvelles technologies, bases de données, … - ont permis la réalisation d’un centre de traitement de données dont la fiabilité et la robustesse ont été attestées. C’est un très beau succès ! »