Vers un modèle de prévision régional basé sur l’intelligence artificielle ?

L’équipe projet PN-IA nous explique comment fonctionne un modèle de prévision utilisant l’IA et quels sont ses atouts, avant de nous présenter les travaux en cours pour développer un modèle IA régional entraîné sur des données AROME.
Comment fonctionne un modèle de prévision utilisant l’IA et quels sont ses atouts ?
Depuis 2022, plusieurs publications ont montré qu’il est possible de repenser le processus de prévision numérique du temps sous l’angle de l’intelligence artificielle, et plus précisément de l’apprentissage profond (Lguensat 2023). Tandis que les modèles actuels résolvent un ensemble d’équations issues de la connaissance physique du fonctionnement de l’atmosphère, un modèle IA apprend directement depuis de très grands jeux de données les liens entre un état à l’instant t et un état à l’instant futur t+dt, sans qu’aucune connaissance physique ne soit injectée. C’est un changement de paradigme, dont les premiers résultats sont très prometteurs. Ces nouveaux modèles ont des performances proches, voire meilleures, que celles des modèles classiques sur un grand nombre de paramètres et d’échéances, et sont aussi capables d’anticiper des événements à fort impact tels que les dépressions hivernales (Pardé et al., 2024) et les cyclones tropicaux. Un autre avantage est leur temps d’exécution extrêmement rapide en comparaison de celui des modèles physiques.
Les modèles IA planétaire: AIFS du CEPMMT et PanguWeather opéré à MF
Le Centre Européen de Prévision Météorologique à Moyen Terme (CEPMMT) a été le premier service météorologique à mettre en œuvre son propre modèle IA, AIFS, un réseau de neurones profond opérant sur des graphes. Ce modèle est entraîné sur les réanalyses ERA5 et disponible depuis fin 2023.
À Météo-France, le CNRM et le LabIA travaillent sur ce sujet depuis plusieurs mois. À partir du modèle global PanguWeather, aussi entraîné sur ERA5, des prévisions sont produites 4 fois par jour depuis fin 2023, de façon expérimentale, à partir de l’analyse Arpège.
Bientôt un modèle IA pour la prévision régionale à Météo-France ?
Des travaux sont également en cours depuis le début de l’année pour développer un modèle IA régional directement entraîné sur des données AROME. Pour cela, le LabIA et le CNRM ont développé le cadre logiciel py4cast, qui a récemment permis de réaliser les premières expériences d’entraînement en utilisant différentes architectures de réseaux de neurones. Les résultats préliminaires sont encourageants, et confirment la capacité de ces nouveaux modèles à faire évoluer les structures météorologiques de façon cohérente.
Dans l’exemple ci-dessous, nous pouvons visualiser la prévision du modèle AROME ainsi qu’une prévision d’un modèle IA à 12 heures d’échéance, sur une situation d’orages violents le 18 juin 2023, pour la température à 2 mètres (à gauche) et l’humidité relative à 2 mètres (à droite). Le modèle IA présenté ici est un réseau de neurones convolutif avec un mécanisme d’attention, optimisé sur l’erreur quadratique moyenne. Il a été entraîné sur deux ans d’analyses AROME à résolution 2,5 km, et est capable de réaliser des prévisions pour 9 variables météorologiques, cinq niveaux verticaux, et jusqu’à n’importe quelle échéance souhaitée. Une prévision à 12h, initialisée avec l’analyse AROME, est calculée en quelques secondes sur une carte GPU. Pour comparaison, une prévision à 12h avec le modèle AROME opérationnel est calculée en environ 15 minutes sur 21 nœuds (architecture CPU) du supercalculateur de Météo-France.


À la suite de ces premières réalisations, il reste plusieurs étapes à franchir avant de proposer des prévisions avec un niveau de réalisme comparable à AROME, et un démonstrateur qui puisse être visualisable en temps réel. Pour faire évoluer les limites actuelles, les travaux se poursuivent avec plusieurs objectifs à court terme :
- Quantifier le gain d’un entraînement sur des jeux de données homogènes et de plus longue profondeur temporelle (telle que la réanalyse ARRA, basée sur AROME, en cours de production), en particulier sur la représentation des situations extrêmes ;
- Évaluer différentes manières de spécifier les conditions aux limites latérales ;
- Améliorer le réalisme structurel et physique des prévisions, en adaptant l’optimisation du modèle et la stratégie d’entraînement ;
- Il sera aussi essentiel d’évaluer objectivement les performances de ces nouveaux modèles sur plusieurs mois ainsi que sur des situations à enjeux, et de les comparer aux performances d’AROME.
Le développement des modèles IA régionales fait l’objet, depuis juin 2024, d’une collaboration européenne pilotée par le CEPMMT, à laquelle Météo-France contribue activement.
Les questions de recherche mentionnées ci-dessus seront pour partie explorées avec les partenaires de cette collaboration. L’explicabilité du processus d’apprentissage, ou comment mieux comprendre ce que le modèle apprend, est un autre sujet prioritaire, qui sera instruit dans le cadre de la chaire EXPLEARTH, portée par le CNRM au sein du Cluster IA Toulousain ANITI.
L’équipe projet PN-IA
- DESR/CNRM/GMAP : Sara Akodad, Clément Brochet, Vincent Chabot, Matthieu Plu, Laure Raynaud, Corentin Seznec ;
- DSM/LabIA : Léa Berthomier, Frank Guibert, Bruno Pradel, Théo Tournier.
Pour en savoir plus :
- Raynaud, L. : L’intelligence artificielle pour la prévision du temps
- Lguensat, R. : Les nouveaux modèles de prévision météorologique basés sur l’intelligence artificielle : opportunité ou menace ? La Météorologie, 121, 11-15, 2023
- Pardé, M., L. Raynaud, et A. Mounier, 2024 : La prévision à moyenne échéance de la tempête Ciaràn par intelligence artificielle. La Météorologie, 125, 36-40, 2024