U-statistique
From Wikipedia, the free encyclopedia
Les U-statistiques, ou U-estimateurs, forment une classe de statistiques introduite par le statisticien finlandais Wassily Hoeffding en 1948, jouant un rôle important en théorie de l'estimation. La lettre U est l'initiale de unbiased en anglais, qui signifie « non biaisé ». Les U-statistiques sont les statistiques qui peuvent s'écrire comme la moyenne empirique d'une fonction symétrique à variables prise sur toutes les sous-parties de taille d'un échantillon. Ces statistiques partagent des propriétés intéressantes et permettent entre autres de construire des estimateurs non biaisés. Les U-statistiques comprennent de nombreux estimateurs classiques tels que la moyenne empirique ou la variance empirique non biaisée .
Définition comme statistique
Soit et une fonction symétrique.
Alors l'application qui à un échantillon de taille associe :
est appelée une U-statistique d'ordre et de kernel [1].
Cette statistique est la moyenne de prise sur toutes les parties de .
Définition en tant que fonctionnelle
On peut aussi définir une U-statistique en tant que fonctionnelle, c'est-à-dire une application partant d'un espace de distributions de probabilité, et à valeurs dans .
Soit l'ensemble des distributions de probabilité sur un ensemble mesurable , une U-statistique est une fonctionnelle de la forme :
Cette définition en tant que fonctionnelle est une généralisation de la première. En effet on remarque que si est la distribution empirique d'un échantillon , alors
C'est-à-dire que la fonctionnelle évaluée en est égale à la statistique appliquée à l'échantillon . La définition par une fonctionnelle permet de parler d'une U-statistique évaluée en une distribution qui ne serait pas une distribution empirique, ce que ne permet pas la première définition.
Si sont des variables aléatoires identiquement distribuées, si est mesurable, par linéarité de l'espérance, est un estimateur non biaisé de . Ce qui explique le nom U-statistique venant de Unbiased.