Test d'homogénéité
From Wikipedia, the free encyclopedia
En statistiques, un test d'homogénéité est un test statistique permettant de décider si deux (ou plus) échantillons indépendants proviennent ou non de la même population, c.-à.-d. suivent une même loi de probabilité.
Dans sa forme la plus simple, un test d'homogénéité consiste[1] à déterminer si deux échantillons indépendants et
tirés chacun de manière i.i.d. sont issus de la même distribution de probabilité, c'est-à-dire à tester l'hypothèse nulle
contre une hypothèse alternative
.
Les hypothèses exactes sur les échantillons varient toutefois selon les tests.
La définition peut naturellement être généralisée à plus de deux échantillons.
Liste de tests d'homogénéité
Tests paramétriques
Les tests d'homogénéité paramétriques incluent notamment :
- les tests basés sur la loi t de Student ;
- les tests basés sur la loi T² d'Hotelling.
Tests non paramétriques
Parmi les tests d'homogénéité non-paramétriques, on peut citer :
- le test de Kolmogorov-Smirnov pour deux échantillons et le test de Cramer-Von Mises pour deux échantillons (tous deux pour des données en dimension 1, et basés sur la fonction de répartition empirique) ;
- le test du χ² d'homogénéité ;
- le test de Wilcoxon-Mann-Whitney ;
- Les tests basés sur la distance moyenne maximale à noyau (MMD en anglais) [2], adaptés au cas des espaces euclidiens de dimension supérieure à 1 et qui peuvent être définis sur des espaces plus généraux.
Tests basés sur des distances à noyau
La construction de tests d'homogénéité basés sur des distances à noyau est due à Gretton et. al[3],[2].
La complexité en temps de ces tests étant élevée, de multiples approximations ont en été proposées, basées notamment sur l'utilisation de descripteurs aléatoires[4].
Références
Bibliographie
- E. L. Lehmann, J. P. Romano, Testing statistical hypotheses, Springer, coll. « Springer texts in statistics », , 4ᵉ éd. (ISBN 3-030-70577-3)
Renvois et références
- ↑ Lehmann and Romano 2022, Example 17.2.2, p. 835
- 1 2 A. Gretton, K. M. Borgwardt, M. J. Rasch, B. Schölkopf, A. Smola, « A kernel two-sample test », The Journal of Machine Learning Research, JMLR. org, vol. 13, t. 1,
- ↑ A. Gretton, K. Borgwardt, M. Rasch, B. Schölkopf, A. J. Smola, « A kernel method for the two-sample-problem », Advances in neural information processing systems,
- ↑ J. Zhao, D. Meng, « FastMMD: Ensemble of Circular Discrepancy for Efficient Two-Sample Test », Neural Computation, vol. 27, t. 6, (ISSN 0899-7667, DOI 10.1162/NECO_a_00732)
| Tests de comparaison d'une seule variable |
|
||||||
|---|---|---|---|---|---|---|---|
| Tests de comparaison de deux variables |
|
||||||
| Tests d'adéquation à une loi | |||||||
| Tests d'appartenance à une famille de lois | |||||||
| Autres tests | |||||||