Famille exponentielle

From Wikipedia, the free encyclopedia

En théorie des probabilités et en statistique, une famille exponentielle est une classe de lois de probabilité dont la forme générale est la suivante :

dans laquelle est la variable aléatoire, est un réel, est un paramètre, et sont des fonctions réelles et est appelé son «paramètre naturel».

Les familles exponentielles présentent certaines propriétés algébriques et inférentielles particulières.

La caractérisation d'une loi dans la famille exponentielle permet de reformuler ladite loi en utilisant des paramètres naturels spécifiques.

En statistiques inférentielles, ces familles permettent d'obtenir des statistiques d'échantillonnage, à savoir les statistiques suffisantes naturelles de la famille. Celles-ci résument un échantillon de données à l'aide d'un nombre réduit de valeurs, constituant les variables de décision en statistiques inférentielles.

En statistiques bayésiennes, elles possèdent des lois a priori conjuguées qui facilitent la mise à jour des lois dites « subjectives ». En effet, après inférence bayésienne, la distribution a posteriori d'une variable aléatoire de la famille exponentielle avec une loi a priori conjuguée peut toujours être écrite sous une forme analytique fermée à condition que la constante de normalisation de la distribution de la famille exponentielle puisse être exprimée sous une forme analytique fermée. [pas clair]. Voici quelques exemples courants : la loi t de Student, la loi bêta-binomiale ou la loi de Dirichlet multinomiale.

Les familles exponentielles apparaissent de façon naturelle dans la recherche de lois lors d'applications statistiques, en particulier dans les méthodes bayésiennes.

La famille exponentielle comprend une grande quantité de lois parmi les plus courantes : loi normale, loi exponentielle, loi Gamma, loi du χ2, loi bêta, loi de Dirichlet, loi de Bernoulli, loi multinomiale, loi de Poisson, loi de Wishart, loi de Wishart inverse, etc. D'autres lois courantes ne forment une famille exponentielle que si certains paramètres sont fixes et de valeur connue, telles les lois binomiale et multinomiale (pour un nombre de tirages fixe dans les deux cas), et la loi binomiale négative (pour un nombre d'échecs fixe). Parmi les lois d'usage courant qui ne sont pas de famille exponentielle, on peut citer la loi de Student, la plupart des lois de mélange, ainsi que la famille des lois uniformes de bornes non fixées.

Origine et terminologie

La notion de famille exponentielle a été développée aux alentours des années 1935 et 1936 par Georges Darmois[1], Edwin Pitman[2] et B. Koopman [3]. Le terme classe exponentielle est parfois utilisé dans le même sens[4],[5].

Une loi de probabilité est définie par les valeurs spécifiques des constantes utilisées dans sa formulation. Par exemple, la loi normale correspond à une loi normale avec une moyenne et un écart-type . Une « famille » de lois est définie par un ou plusieurs paramètres variables, comme la famille de lois de Poisson . Cette famille est dite exponentielle lorsque la fonction de densité de probabilité présente une forme algébrique particulière entre la variable aléatoire et les paramètres, caractérisée par la séparation des facteurs.

Loi binomiale

La loi binomiale est une famille de lois caractérisée par un paramètre n (nombre de tirages) et un paramètre p (probabilité de succès). Elle peut se décliner en trois cas.

La loi binomiale unique est définie de la façon suivante : si n et p ont des valeurs spécifiques, par exemple , alors est une loi binomiale unique.

La famille de lois binomiales est caractérisée ainsi : si n a une valeur fixe, par exemple , mais que p peut varier, il s'agit d'une famille de lois binomiales caractérisée par le paramètre p, où n est une constante.

La famille de lois binomiales généralisée est caractérisée de façon plus large de la façon suivante : si n et p sont libres de varier, il s'agit d'une famille plus large de lois binomiales, avec n et p comme paramètres.

Les trois situations sont souvent désignées sous le terme « la loi binomiale », mais seule la seconde situation constitue une famille exponentielle.

Cas de la loi uniforme

La loi uniforme continue entre 0 et 1, notée , est parfois appelée « nombre aléatoire tiré d'une loi uniforme ». Cette loi est un cas particulier de la loi bêta. Bien que la loi bêta appartienne à une famille exponentielle, la loi uniforme n'est pas une famille exponentielle puisqu'elle ne représente qu'une seule loi.

La famille de lois uniformes, caractérisée par la variabilité d'une ou des deux bornes, n'appartient pas non plus à la famille exponentielle. Pour qu'une famille de lois soit exponentielle, la densité de probabilité doit pouvoir être exprimée sous une forme exponentielle par rapport à ses paramètres, ce qui n'est pas le cas des lois uniformes avec des bornes variables.

Définition

Une famille exponentielle est un ensemble de lois dont la loi de probabilité (discrète ou continue) peut s'écrire sous la forme de facteurs séparables :

, , et sont précisées.

Souvent, la densité s'écrira sous la forme alternative:

ou même:

La valeur est le paramètre de la famille.

La variable aléatoire peut représenter un vecteur de plusieurs mesures. Dans ce cas, est une fonction de plusieurs variables. Que soit scalaire ou vectoriel, et même s'il y a un paramètre unique, les fonctions et peuvent prendre la forme de vecteurs.

Forme canonique

La famille exponentielle est dite en forme canonique (ou naturelle) lorsque . Il est toujours possible de convertir une famille exponentielle en forme canonique, par la définition d'un paramètre transformé :

La valeur η est un paramètre naturel de la famille.

La forme canonique n'est pas unique, puisque peut être multiplié par une constante non nulle, pourvu que soit multiplié par la constante inverse.

La valeur (alternativement ) se déduit du choix des autres fonctions. En effet, assure que la loi est normalisée, c'est-à-dire que pour tout paramètre , dans le cas continu ou dans le cas discret. On en déduit que dans le cas continu et dans le cas discret. En particulier, si n'est pas injective, alors et ne sont pas injectives.

Famille exponentielle vectorielle

La définition ci-dessus, bien qu'à première vue exprimée en termes d'un paramètre scalaire, reste valable pour un paramètre vecteur de réels . La loi est dite de famille exponentielle vectorielle si la fonction de densité (ou de probabilité, pour les discrètes) s'écrit :

ou, en forme compacte :

La somme est écrite comme le produit scalaire des fonctions-vecteurs et .

On peut également rencontrer une forme alternative du type :

Comme précédemment, la famille exponentielle est sous forme canonique si , pour tout .

Famille exponentielle vectorielle courbe

Une famille exponentielle vectorielle est dite courbe si la dimension du vecteur paramètre est inférieure à la dimension du vecteur , le nombre de fonctions du vecteur paramètre dans la représentation factorisée.

La plupart des lois courantes de famille exponentielle ne sont pas courbes, de sorte que nombre d'algorithmes conçus pour la famille exponentielle supposent implicitement ou explicitement que la loi n'est pas courbe.

La fonction de normalisation ou peut toujours s'écrire en fonction de , quelles que soient les transformations de en . La famille exponentielle suivante est en « forme naturelle » (paramétrée par son paramètre naturel) :

ou :

Variable vectorielle

De même qu'un paramètre scalaire est généralisable à un paramètre vectoriel, une variable aléatoire simple (scalaire) peut se généraliser à une loi conjointe sur un vecteur de variables aléatoires : chaque notation scalaire est alors remplacée par un vecteur . La dimension du vecteur aléatoire ne correspond pas nécessairement à la dimension du vecteur paramètre, ni (pour une fonction exponentielle courbe) à la dimension du paramètre naturel et de la statistique suffisante .

La loi s'écrit alors :

ou :

Propriétés

Les fonctions , et qui apparaissent dans les définitions ne sont pas totalement arbitraires. Elles jouent un rôle important pour l'analyse statistique.

  • T(x) est une statistique suffisante (ou exhaustive) de la loi. Une statistique suffisante est une fonction qui résume parfaitement les données mesurées x dans le cadre d'un échantillon tiré de cette loi : même si un autre jeu de données y diffère complètement de x, mais que T(x) = T(y), alors la densité estimée à partir des observations sera la même, c.à.d. elle aura le même paramètre.

La dimension de T(x) égale le nombre de paramètres de η.

La statistique suffisante d'une collection de données indépendantes et identiquement distribuées (i.i.d.) est la somme des statistiques suffisantes individuelles. En estimation bayésienne, elle contient toute l'information nécessaire au calcul de la loi a posteriori des paramètres, conditionnellement aux observations. En estimation classique, elle suffit pour construire un estimateur des paramètres :

  • η est le paramètre naturel de la loi. L'ensemble des valeurs de η pour lesquelles la fonction fX(x|θ) est finie est appelé l' espace paramétrique naturel. On peut montrer que cet espace paramétrique naturel est toujours convexe.
  • A(η) est parfois appelée la fonction de log-partition parce qu'elle est le logarithme du facteur de normalisation a(η) (la « fonction de partition » des statisticiens) :
ou :
L'utilité de la fonction A apparaît quand il faut calculer la moyenne, la variance et les autres moments de la statistique suffisante T(x) : il suffit de dériver A(η).
Par exemple, on veut calculer l'espérance du logarithme d'une variable aléatoire suivant une loi gamma. Comme ln(x) est une composante de la statistique suffisante de cette loi, l'espérance se calcule aisément en dérivant .
  • b(x) est la mesure de base. Elle sert au calcul d'une prieure non informative (= entropie maximale).

Factorisation

Applications

Notes et références

Related Articles

Wikiwand AI