Le premier résultat concernant l'approximation forte du processus empirique est dû à Brillinger en 1969[3]. Celui-ci établit que si
est une suite de variables i.i.d. de loi uniforme sur
alors il existe une suite de copies
et une suite de ponts browniens
tel que presque-sûrement
![{\displaystyle \sup _{t\in [0,1]}|\alpha _{n}^{\widetilde {U}}(t)-P_{n}(t)|=O\left(n^{-1/4}(\log n)^{1/2}(\log \log n)^{1/4}\right).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9042257da3f6195dd616e355cad811dca4601e3a)
Dans leurs articles[1],[2], Komlós, Tusnády et Major ont établi que si
est une suite de variables i.i.d. de loi uniforme sur
alors il existe une suite de ponts browniens
tel que presque-sûrement
![{\displaystyle \mathbb {P} \left(\sup _{t\in [0,1]}|\alpha _{n}^{U}(t)-P_{n}(t)|>n^{-1/2}(C\log n+x)\right)\leq Le^{-\lambda x}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c310a17ad0da2b18f4e0672c1f702ac10568e892)
où
sont des constantes universelles positives. Ce qui entraîne d'après le lemme de Borel-Cantelli : presque-sûrement,
![{\displaystyle \sup _{t\in [0,1]}|\alpha _{n}^{U}(t)-P_{n}(t)|=O(n^{-1/2}\log n).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a1bd7dd19e8a15c6280864f0ded40957327866e2)
L'approximation du processus empirique fourni par KMT est encore cette fois optimale.
Jack Kiefer fut le premier mathématicien à considérer le processus empirique
comme un processus à deux paramètres et que celui-ci devait par conséquent être approché par un processus gaussien bidimensionnel. Il prouve notamment que si
est une suite de variables i.i.d. de loi uniforme sur
, il existe un processus de Kiefer
vérifiant presque-sûrement[4]
![{\displaystyle \sup _{t\in [0,1]}|{\sqrt {n}}\alpha _{n}(t)-K(t,n)|=O(n^{1/3}(\log n)^{2/3}).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6c4d303bf6e4111715e8e035a464563e46bce54b)
Par la suite, le théorème KMT fournit une meilleure approximation du processus empirique par le processus de Kiefer : si
est une suite de variables i.i.d. de loi uniforme sur
alors il existe un processus de Kiefer
tel que[5]
![{\displaystyle \mathbb {P} \left(\max _{1\leq k\leq n}\sup _{t\in [0,1]}|k^{1/2}\alpha _{k}(y)-K(y,k)|>(C\log n+x)\log n\right)<Le^{-\lambda x}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/35d7e7afe18fa74541c0df29d92e32485411ee4e)
où
sont des constantes universelles positives. Ce qui entraîne d'après le lemme de Borel-Cantelli : presque-sûrement,

Berthet et Mason ont généralisé en 2006[6] l'approximation forte du processus empirique indexé par une classe de fonctions
soumises à des conditions d'entropie. On travaillera avec des variables
i.i.d. de loi
définies sur un espace de probabilité
à valeurs dans un espace
, avec une classe de fonctions
incluses dans l'ensemble des fonctions mesurables de
à valeurs réelles. On pose les hypothèses suivantes :
Hypothèse
:
;
Hypothèse
:
est ponctuellement mesurable, i.e. il existe un sous-ensemble dénombrable
tel que tout élément de
puisse s'écrire comme limite d'une suite d'éléments de
.
Hypothèse VC :
et une enveloppe de fonction
de
tel que

où
- le supremum est pris parmi toutes les mesures de probabilité
de
pour lesquelles
;
est le nombre de recouvrement de
par des boules de rayon
pour une distance
.
est la semi-métrique
avec
une mesure de probabilité sur
.
Hypothèse BR :
où
est l'entropie avec crochets de
de rayon
avec la distance
, c'est-à-dire du log du nombre de recouvrement avec crochets avec les mêmes paramètres.
Si
vérifie les conditions
, VC ou BR alors
, il existe
, une suite
de réels strictement positifs et de limite nulle, des variables
i.i.d. de loi
et une suite indépendante
de processus de
-pont brownien définis sur un même espace de probabilité vérifiant

et

La deuxième relation provient de la première en effectuant un raisonnement par blocs et en appliquant le lemme de Borel-Cantelli.
Remarques :
- L'hypothèse
est une condition sur l'existence d'une enveloppe de la classe de fonction, i.e. d'une fonction mesurable
telle que
;
- La seconde condition
permet de s'assurer de la bonne définition du processus limite ;
- L'hypothèse VC n'est pas la définition d'une classe VC mais une propriété vérifiée par les classes VC à savoir que ce sont des classes polynomiales, c'est-à-dire que le recouvrement d'une classe VC est polynomiale en son rayon
.