Variables aleatorias independientes e idénticamente distribuidas

En teoría de probabilidad y estadística, un conjunto de variables aleatorias se consideran independientes e idénticamente distribuidas si cada variable aleatoria tiene la misma distribución de probabilidad y todas son mutuamente independientes. La suposición de que un conjunto observaciones sean i.i.d. simplifica las operaciones de muchos métodos estadísticos, por lo que es muy común en la estadística inferencial. Aun así, en aplicaciones prácticas de modelación estadística la suposición puede o no puede ser realista. Para probar qué tan realista es en un conjunto de datos dado, se calcula la autocorrelación, mediante correlogramas y otras pruebas estadísticas. Esta suposición es fundamental en la forma clásica del teorema del límite central, el cual afirma que, si una variable aleatoria es de cuadrado integrable, entonces la distribución de probabilidad de dicha variable centrada en su esperanza y normalizada en su desviación típica se aproxima a una distribución normal. From Wikipedia, the free encyclopedia

En teoría de probabilidad y estadística, un conjunto de variables aleatorias se consideran independientes e idénticamente distribuidas (i.i.d., iid o IID) si cada variable aleatoria tiene la misma distribución de probabilidad y todas son mutuamente independientes.^[1]

La suposición (o requisito) de que un conjunto observaciones sean i.i.d. simplifica las operaciones de muchos métodos estadísticos (véase estadística matemática), por lo que es muy común en la estadística inferencial. Aun así, en aplicaciones prácticas de modelación estadística la suposición puede o no puede ser realista. Para probar qué tan realista es en un conjunto de datos dado, se calcula la autocorrelación, mediante correlogramas y otras pruebas estadísticas.^[2]

Esta suposición es fundamental en la forma clásica del teorema del límite central, el cual afirma que, si una variable aleatoria es de cuadrado integrable (Existe el momento no centrado de orden dos), entonces la distribución de probabilidad de dicha variable centrada en su esperanza y normalizada en su desviación típica se aproxima a una distribución normal.

En estadística, usualmente tratamos con muestras aleatorias. Una muestra aleatoria puede ser considerada como un conjunto de objetos que son elegidos aleatoriamente; o, más formalmente, es “una secuencia de variables aleatorias independientes e idénticamente distribuidas (IID)”.

En otras palabras, los términos muestra aleatoria e IID son básicamente lo mismo. En estadística, comúnmente decimos “muestra aleatoria”, pero en probabilidad es más común decir “IID”.

Idénticamente distribuida significa que no existen tendencias generales, es decir, la distribución no varía y todos los elementos en la muestra son tomados de la misma distribución de probabilidad.
Independiente significa que los elementos muestrales son todos eventos (o sucesos) independientes. En otras palabras, no están conectados entre ellos de ninguna forma.^[3] Dicho de otro modo, el conocimiento del valor de una variable no proporciona ninguna información sobre el valor de la otra y viceversa.

Aplicaciones

Las variables aleatorias independientes e idénticamente distribuidas con usadas a menudo como un supuesto, el cual tiende a simplificar las matemáticas subyacentes. En aplicaciones prácticas del modelamiento estadístico, sin embargo, el supuesto puede ser o no ser realista.^[4]

El supuesto de i.i.d. también es usado en el Teorema del límite central, el cual establece que la función de distribución de la suma (o media) de variables i.i.d. con varianza finita se aproxima a una distribución normal.^[5]

A menudo, el supuesto de i.i.d. surge en el contexto de secuencias de variables aleatorias. Por lo que, "independiente e idénticamente distribuida" implica que un elemento en la secuencia es independiente de las variables aleatorias que la precedieron. De este modo, una secuencia i.i.d. es diferente de una secuencia de Markov, donde la distribución de probabilidad para la n-ésima variable aleatoria es una función de las variables aleatorias anteriores en la secuencia (para una secuencia de Markov de primer orden). Una secuencua i.i.d. no implica que las probabilidades para todos los elementos de un espacio muestral o espacio de eventos deben ser iguales..^[6] Por ejemplo, tiradas repetidas de un dado cargado (trucado) producirán una secuencia que es i.i.d., a pesar del hecho de que los resultados sean sesgados.

Definición

Definición para dos variable aleatorias

Suponga que las variables aleatorias $X$ e $Y$ son definidas para asumir valores en $I\subseteq \mathbb {R}$ . Sean $F_{X}(x)=\operatorname {P} (X\leq x)$ y $F_{Y}(y)=\operatorname {P} (Y\leq y)$ las funciones de distribución acumulada de $X$ e $Y$ , respectivamente, y denótese su función de distribución de probabilidad acumulada conjunta como $F_{X,Y}(x,y)=\operatorname {P} (X\leq x\land Y\leq y)$ .

Dos variables aleatorias $X$ e $Y$ son idénticamente distribuídas si y solo si^[7] $F_{X}(x)=F_{Y}(x)\,\forall x\in I$ .

Dos variables aleatorias $X$ e $Y$ son independientes si y solo si $F_{X,Y}(x,y)=F_{X}(x)\cdot F_{Y}(y)\,\forall x,y\in I$ . (Véase también Independencia (probabilidad) § Dos variables aleatorias.)

Dos variables aleatorias $X$ e $Y$ son i.i.d. si son independientes e idénticamente distribuidas, es decir, si y solo si

${\begin{aligned}&F_{X}(x)=F_{Y}(x)\,&\forall x\in I\\&F_{X,Y}(x,y)=F_{X}(x)\cdot F_{Y}(y)\,&\forall x,y\in I\end{aligned}}$

(Eq.1)

Definición para más de dos variables aleatorias

La definición se extiende, naturalmente, para más de dos variables aleatorias. Decimos que $n$ variables aleatorias $X_{1},\ldots ,X_{n}$ son i.i.d. si son independientes (véase también Independencia (probabilidad) § Más de dos variables aleatorias) e idénticamente distribuidas, es decir, si y solo si

${\begin{aligned}&F_{X_{1}}(x)=F_{X_{k}}(x)\,&\forall k\in \{1,\ldots ,n\}{\text{ y }}\forall x\in I\\&F_{X_{1},\ldots ,X_{n}}(x_{1},\ldots ,x_{n})=F_{X_{1}}(x_{1})\cdot \ldots \cdot F_{X_{n}}(x_{n})\,&\forall x_{1},\ldots ,x_{n}\in I\end{aligned}}$

(Eq.2)

donde $F_{X_{1},\ldots ,X_{n}}(x_{1},\ldots ,x_{n})=\operatorname {P} (X_{1}\leq x_{1}\land \ldots \land X_{n}\leq x_{n})$ denota la función de distribución acumulada conjunta de $X_{1},\ldots ,X_{n}$ .

Variables aleatorias independientes e idénticamente distribuidas

Aplicaciones

Definición

Definición para dos variable aleatorias

Definición para más de dos variables aleatorias

Generalizaciones

Variables aleatorias intercambiables

Proceso de Lévy[2]

Referencias

Related Articles