Loi de probabilité composée

From Wikipedia, the free encyclopedia

En probabilités et en statistiques, une loi de probabilité composée (également appelée loi de mélange ou loi contagieuse ) est la loi de probabilité obtenue en supposant qu'une variable aléatoire suit une loi paramétrée, dont certains paramètres sont eux-mêmes des variables aléatoires. Si le paramètre est un paramètre d'échelle, le mélange résultant est également appelé mélange d'échelles.

La loi composée (« loi inconditionnelle ») est le résultat de la marginalisation (intégration) sur la ou les variables aléatoires latentes représentant le ou les paramètres de la loi paramétrée (« loi conditionnelle »).

Une loi de probabilité composée est la loide probabilité qui résulte de l'hypothèse qu'une variable aléatoire suit une loi paramétrée avec un paramètre inconnu qui est à son tour une variable aléatoire suivant une autre loi . La loi résultante est la loi qui résulte de la composition de avec . La distribution du paramètre est parfois appelée loi de mélange ou loi latente . Techniquement, la loi inconditionnelle résulte de la marginalisation de , c'est-à-dire en intégrant le(s) paramètre(s) inconnu(s) . Sa fonction de densité de probabilité est donnée par :

La même formule s'applique de manière similaire si certaines ou toutes les variables sont des vecteurs.

D'après la formule ci-dessus, on peut constater qu'une loi composée est essentiellement un cas particulier de loi marginale : la loi conjointe de et est donnée par , et les résultats composés par sa loi marginale : . Si le domaine de si est discret, alors la loi est à nouveau un cas particulier de loi de mélange.

Propriétés

Généralités

La loi composée dépend de l'expression spécifique de chaque distribution, ainsi que du type de paramètre de qui suit la loi , et les paramètres de comprendra tous les paramètres de qui ne sont ni marginalisés ni intégrés. Le support de est identique à celui de et si cette dernière est une loi paramétrée par la moyenne et la variance, certaines propriétés générales existent.

Moyenne et variance

Les deux premiers moments de la loi composée sont donnés par la loi de l'espérance totale et la loi de la variance totale :

Si la moyenne de est suit une loi , qui à son tour a pour moyenne et pour variance les expressions ci-dessus impliquent et , où est la variance de .

Preuve

Soient et des lois de probabilité paramétrées par leurs moyennes et leurs variances de sorte que en désignant les fonctions de densité de probabilité par et respectivement, et étant la densité de probabilité de on a et on en déduit à partir de la paramétrisation et que et donc la moyenne de la distribution composée vaut conformément à l'expression de son premier moment ci-dessus.

La variance de est donnée par , et étant donné que et Finalement, on obtient

Applications

Tests

Les distributions des statistiques de test courantes se présentent sous forme de distributions composées sous leur hypothèse nulle, par exemple dans le test t de Student (où la statistique de test résulte du rapport d'une variable aléatoire normale et d'une variable aléatoire du χ²), ou dans le test F (où la statistique de test est le rapport de deux variables aléatoires suivant toutes deux une loi du χ²).

Modélisation de la surdispersion

Les lois composées sont utiles pour modéliser des résultats présentant une surdispersion, c'est-à-dire une variabilité supérieure à celle attendue par un modèle donné. Par exemple, les données de comptage sont généralement modélisées à l'aide de la loi de Poisson, dont la variance est égale à sa moyenne. Cette loi peut être généralisée en autorisant une variabilité de son paramètre d'échelle, implémentée via une loi gamma, ce qui donne une loi binomiale négative marginale. Cette loi a une forme similaire à celle de la distribution de Poisson, mais elle peut avoir des variances plus importantes. De même, une loi binomiale peut être généralisée pour permettre une variabilité supplémentaire en la combinant avec une loi bêta pour son paramètre de probabilité de succès, ce qui donne une loi bêta-binomiale.

Inférence bayésienne

Outre les lois marginales omniprésentes, qui peuvent être considérées comme des cas particuliers de lois composées, en inférence bayésienne, les lois composées apparaissent lorsque, dans la notation ci-dessus, F représente la loi des observations futures et G la loi a posteriori des paramètres de F, compte tenu des informations contenues dans un ensemble de données observées. Ceci donne une loi prédictive a posteriori . De même, pour la loi prédictive a priori, F est la loi d'une nouvelle donnée tandis que G est la loi a priori des paramètres.

Convolution

La convolution des lois de probabilité (pour obtenir la loi de probabilité des sommes de variables aléatoires) peut également être considérée comme un cas particulier de composition ; ici, la loi de la somme résulte essentiellement du fait de considérer un terme comme un paramètre de position aléatoire pour l'autre terme[1].

Calcul intégral numérique

Les lois composées dérivées de la famille exponentielle admettent souvent une forme analytique. Si l'intégration analytique est impossible, des méthodes numériques peuvent s'avérer nécessaires.

Les lois composées peuvent être étudiées relativement facilement par des méthodes de Monte Carlo, c'est-à-dire en générant des échantillons aléatoires. Il est souvent aisé de générer des nombres aléatoires à partir des lois ainsi que et ensuite utiliser ces données pour effectuer un échantillonnage de Gibbs réduit afin de générer des échantillons à partir de .

Une loi composée peut généralement aussi être approchée à un degré suffisant par une loi de mélange utilisant un nombre fini de composants de mélange, permettant de dériver une densité approximative, une fonction de distribution, etc. [1]

L'estimation des paramètres (par le maximum de vraisemblance ou le maximum a posteriori ) dans un modèle de distribution composé peut parfois être simplifiée en utilisant l'algorithme espérance-maximisation[2].

Exemples

Termes similaires

La notion de « loi composée », telle qu'utilisée par exemple dans la définition d'une loi de Poisson composée ou d'un processus de Poisson composé, diffère de la définition présentée dans cet article. Le sens donné ici correspond à celui employé, par exemple, dans la modélisation hiérarchique bayésienne.

Le cas particulier des distributions de probabilité composées où la loi paramétrée est la loi de Poisson est également appelée loi de Poisson mixte.

Voir aussi

Références

Bibliographie

Related Articles

Wikiwand AI