Inférence causale

L'inférence causale est une démarche scientifique ; elle désigne l'ensemble des méthodes et processus permettant de déduire une relation de causalité entre un élément et ses effets (directs ou indirects, immédiats ou différés...).

C'est un champ de recherche à la croisée des statistiques, de l'économétrie, de l'épidémiologie, de la méthodologie politique et de l'intelligence artificielle (où l'inférence causale est essentielle pour dépasser les limites des approches purement corrélationnelles et rapprocher l’IA d’une compréhension plus profonde et plus explicative du monde).

Histoire

En 1920, Sewall Wright développe la première path analysis. Cette analyse graphique des relations de causalité entre les variables constitue selon Judea Pearl un travail pionnier dans l'inférence causale^[1].

Dans les années 1970, Donald Rubin (Rubin 1974) développe un modèle causal dit modèle à résultat potentiel dans un article intitulé Estimating Causal Effects of Treatments in Randomized and Nonrandomized Studies. Ce modèle est connu sous le nom de modèle causal de Neyman-Rubin^[2]^,^[3].

Rôle de l’inférence causale en intelligence artificielle

Dans le domaine de l’intelligence artificielle, l’inférence causale fournit un cadre mathématique permettant d’identifier les relations de cause à effet plutôt que de simples corrélations, ce qui est essentiel pour construire de bons modèles du monde et des systèmes d’IA capables de correctement raisonner, d’expliquer leurs décisions et de généraliser hors des données d’entraînement.

Les travaux fondateurs de Judea Pearl ont, au début des années 2000, montré que les modèles causaux graphiques et les calculs d’intervention permettent à une machine de répondre à des questions du type « que se passerait‑il si l’on agissait différemment ? (y compris en n'agissant pas) » ou « qu’est‑ce qui a réellement provoqué cet événement ? »^[4].

Cette capacité est cruciale pour la robotique, l’apprentissage par renforcement et les modèles du monde, où un agent doit anticiper les effets de ses actions dans des environnements incertains.
Des recherches récentes démontrent que dans l’apprentissage automatique, l’intégration de structures causales améliore la robustesse, la transférabilité d’un domaine à l’autre, et la capacité d’exploration des agents, notamment en séparant les facteurs pertinents des variations superficielles. La recherche classique en causalité suppose souvent que les variables causales pertinentes sont déjà connues, mais, inversement, pour l’intelligence artificielle, un enjeu central est de les découvrir, elle-même et à partir d’observations brutes : c’est le problème de l’apprentissage de représentations causales. Dans les années 2020, plusieurs pistes sont explorées pour que la causalité puisse renforcer la robustesse, l’interprétabilité et la capacité de généralisation des systèmes d’apprentissage des IA^[5]^,^[6].

Méthodes

Expérience randomisée contrôlée (Randomized Controlled Trial, RCT)

L’expérience randomisée contrôlée est considérée comme la méthode de référence en inférence causale. Elle repose sur l’affectation aléatoire d’individus à un groupe de traitement et à un groupe de contrôle. Grâce à la randomisation, les deux groupes sont en moyenne comparables sur toutes les dimensions observées et non observées, ce qui permet d’attribuer aux différences constatées dans les résultats un lien causal avec le traitement. Cette méthode vise à éliminer les biais de sélection et à fournir une estimation directe de l’effet causal moyen.

Différences en différences (Difference-in-Differences, DiD)

La méthode des différences en différences exploite des données longitudinales portant sur deux groupes : l’un soumis à une intervention (réforme, choc, programme), l’autre non. Elle consiste à comparer l’évolution temporelle des résultats dans le groupe traité avec celle du groupe témoin. L’hypothèse centrale est celle de tendances parallèles : en l’absence de traitement, les deux groupes auraient connu une trajectoire similaire. La méthode permet alors d’isoler l’effet causal associé à l’intervention.

Régression en discontinuité (Regression Discontinuity Design, RDD)

La régression en discontinuité s’applique lorsque l’accès au traitement dépend d’une règle fondée sur un seuil continu, par exemple un score ou un revenu. Les individus situés juste en dessous et juste au-dessus du seuil sont considérés comme très similaires, à l’exception du fait que certains bénéficient du traitement et d’autres non. La comparaison de leurs résultats fournit une estimation locale de l’effet causal. Cette approche exploite ainsi la discontinuité créée par la règle d’éligibilité comme une ‘expérience’ naturelle.

Bibliographie

(en) Donald Rubin, « Estimating Causal Effects of Treatments in Randomized and Nonrandomized Studies », Journal of Educational Psychology, vol. 66, n^o 5,‎ 1974, p. 688–701
(en) Judea Pearl, « Causal inference in statistics: An overview », Statistics Surveys, vol. 3,‎ janvier 2009, p. 96–146 (DOI 10.1214/09-SS057, lire en ligne)
(en) Paul W Holland, « Statistics and causal inference », Journal of the American Statistical Association, vol. 81, n^o 396,‎ 1986, p. 945-960
(en) Judea Pearl, Causality, Cambridge University Press, 2009
(en) MA Hernán et JM Robins, Causal Inference: What If, Barnsley, Boca Raton: Chapman & Hall/CRC, 21 janvier 2020 (lire en ligne)
(en) Judea Pearl et Dana Mackenzie, The Book of Why : The New Science of Cause and Effect, Penguin Books, 2019 (1^re éd. 2018), 432 p. (ISBN 978-0-1419-8241-0 et 0-1419-8241-1)
(en) Scott Cunningham, Causal Inference : The Mixtape, Yale University Press, 2021, 352 p. (ISBN 9780300251685 et 0300251688)

Revues

Journal of Causal Inference