Variables aleatorias independientes e idénticamente distribuidas
En teoría de probabilidad y estadística, un conjunto de variables aleatorias se consideran independientes e idénticamente distribuidas si cada variable aleatoria tiene la misma distribución de probabilidad y todas son mutuamente independientes. La suposición de que un conjunto observaciones sean i.i.d. simplifica las operaciones de muchos métodos estadísticos, por lo que es muy común en la estadística inferencial. Aun así, en aplicaciones prácticas de modelación estadística la suposición puede o no puede ser realista. Para probar qué tan realista es en un conjunto de datos dado, se calcula la autocorrelación, mediante correlogramas y otras pruebas estadísticas. Esta suposición es fundamental en la forma clásica del teorema del límite central, el cual afirma que, si una variable aleatoria es de cuadrado integrable, entonces la distribución de probabilidad de dicha variable centrada en su esperanza y normalizada en su desviación típica se aproxima a una distribución normal.
From Wikipedia, the free encyclopedia
En teoría de probabilidad y estadística, un conjunto de variables aleatorias se consideran independientes e idénticamente distribuidas (i.i.d., iid o IID) si cada variable aleatoria tiene la misma distribución de probabilidad y todas son mutuamente independientes.[1]
La suposición (o requisito) de que un conjunto observaciones sean i.i.d. simplifica las operaciones de muchos métodos estadísticos (véase estadística matemática), por lo que es muy común en la estadística inferencial. Aun así, en aplicaciones prácticas de modelación estadística la suposición puede o no puede ser realista. Para probar qué tan realista es en un conjunto de datos dado, se calcula la autocorrelación, mediante correlogramas y otras pruebas estadísticas.[2]
Esta suposición es fundamental en la forma clásica del teorema del límite central, el cual afirma que, si una variable aleatoria es de cuadrado integrable (Existe el momento no centrado de orden dos), entonces la distribución de probabilidad de dicha variable centrada en su esperanza y normalizada en su desviación típica se aproxima a una distribución normal.
En estadística, usualmente tratamos con muestras aleatorias. Una muestra aleatoria puede ser considerada como un conjunto de objetos que son elegidos aleatoriamente; o, más formalmente, es “una secuencia de variables aleatorias independientes e idénticamente distribuidas (IID)”.
En otras palabras, los términos muestra aleatoria e IID son básicamente lo mismo. En estadística, comúnmente decimos “muestra aleatoria”, pero en probabilidad es más común decir “IID”.
- Idénticamente distribuida significa que no existen tendencias generales, es decir, la distribución no varía y todos los elementos en la muestra son tomados de la misma distribución de probabilidad.
- Independiente significa que los elementos muestrales son todos eventos (o sucesos) independientes. En otras palabras, no están conectados entre ellos de ninguna forma.[3] Dicho de otro modo, el conocimiento del valor de una variable no proporciona ninguna información sobre el valor de la otra y viceversa.
Aplicaciones
Las variables aleatorias independientes e idénticamente distribuidas con usadas a menudo como un supuesto, el cual tiende a simplificar las matemáticas subyacentes. En aplicaciones prácticas del modelamiento estadístico, sin embargo, el supuesto puede ser o no ser realista.[4]
El supuesto de i.i.d. también es usado en el Teorema del límite central, el cual establece que la función de distribución de la suma (o media) de variables i.i.d. con varianza finita se aproxima a una distribución normal.[5]
A menudo, el supuesto de i.i.d. surge en el contexto de secuencias de variables aleatorias. Por lo que, "independiente e idénticamente distribuida" implica que un elemento en la secuencia es independiente de las variables aleatorias que la precedieron. De este modo, una secuencia i.i.d. es diferente de una secuencia de Markov, donde la distribución de probabilidad para la n-ésima variable aleatoria es una función de las variables aleatorias anteriores en la secuencia (para una secuencia de Markov de primer orden). Una secuencua i.i.d. no implica que las probabilidades para todos los elementos de un espacio muestral o espacio de eventos deben ser iguales..[6] Por ejemplo, tiradas repetidas de un dado cargado (trucado) producirán una secuencia que es i.i.d., a pesar del hecho de que los resultados sean sesgados.