Test de Mantel
From Wikipedia, the free encyclopedia
| Type | |
|---|---|
| Nommé en référence à |
Le test de Mantel est un test statistique permettant de tester la corrélation entre deux matrices. Il a été créé et publié par le biostatisticien Nathan Mantel en 1967 dans la revue Cancer Research[1].
Grossièrement, le principe est le suivant : on évalue une mesure de la similarité des matrices, puis on la compare à la similarité entre la première matrice et des permutations des lignes de la seconde matrice.
Utilisation
Un exemple d'utilisation est la comparaison de distances génétiques et géographiques en écologie, une des bases de la génétique du paysage. On peut étudier un ensemble de espèces, et obtenir deux matrices carrées symétriques de taille , l'une établissant la distance entre chaque paires d'espèces du point de vue génétique, et l'autre du point de vue géographique. On peut ainsi tester l'hypothèse selon laquelle des espèces éloignées géographiquement sont moins proches génétiquement[2].
Principe
Soit et deux matrices de distance (en) entre objets. La statistique de Mantel renormalisée est calculée comme où et sont les moyennes empiriques observées sur les distances et et sont les écart-types estimés.
Le coefficient ne peut être considéré comme un coefficient de corrélation usuel parce que les mesures de distances ne sont pas indépendantes, la position de chaque objet affectant les distances aux autres objets.
La valeur de ce coefficient est donc comparée à celles obtenues après des permutations correspondantes sur les lignes et les colonnes d'une des deux matrices. Il existe permutations possibles. Pour un test exact, on peut calculer la distribution de sur toutes les permutations possibles, mais si est grand, on utilise une méthode de Monte-Carlo pour obtenir une distribution empirique de .
La signification du test de Mantel est alors estimée en comparant aux quantiles observés sous l'hypothèse nulle. En l'absence de corrélation entre les deux matrices de distance, la valeur de devrait suivre la même distribution que celle obtenue avec les permutations. Si une corrélation existe, on s'attend à ce que soit statistiquement différent des valeurs obtenues après permutations. La puissance statistique du test dépend directement du nombre de permutations réalisées[3].