Skip to content

2024 S2 C.1 Estadística inferencial

Published: at 05:07 PM

Distribución de Muestreo

Parámetro

Caracteristica de una población. Ejemplos:

Estadística

Estimación del parámetro al calcular en una muestra.

Con los mismos ejemplos:

En estos casos se hace un cálculo sobre los valores de la muestra, que llamamos estadística, con el objetivo de estimar el valor del parámetro.

Distribución de Muestreo

Para una variable aleatoria XX, se puede tomar una muestra de tamaño nn y calcular una estadística sobre la muestra (como x1\overline{x}_1)

Si se hubiera tomado otra muestra 22, se tendría otro x2\overline{x}_2

El conjunto de los {x}\{\overline{x}\} es la distribución de muestreo del promedio.

Ejemplo

Supongamos que el universo es un conjunto de discos. La variable que nos interesa es el radio. Queremos estimar el valor del promedio del radio. Si son muchos discos, no podemos hacer un censo. Como ejemplo, pensemos en los siguientes discos:

alrededor de 50 discos, distribuidos homogéneamente, con 3 diferentes radios, todos son azules

Podemos tomar una muestra, mostrada aquí con rojo, y calcular el radio promedio. Obtenemos r=0.41\overline{r}=0.41:

de los 50 semarcan con rojo 10 al azar de diferentes radios

U otra muestra, mostrada aquí con verde, obteniendo r=0.3625\overline{r}=0.3625

de los 50 semarcan con rojo 10 al azar de diferentes radios

Ninguno de estos promedios es el promedio “real”, pero creemos que están cerca a ese valor. Entonces hacemos un análisis estadístico, en el que la variable es el radio promedio.

¿cómo se distribuye la variable aleatoria X:rX: \overline{r}?

Distribución de Muestreo

Teorema del límite central (TLC)

El TLC nos garantiza la relación entre los estadísticos y el parámetro.

Sea XX una varible aleatoria. Su valor esperado (promedio) es: E(X)=μE(X) = \mu , su varianza es V(X)=σ2V(X) = \sigma^2.

El TLC garantiza que la distribución de los promedios X\overline{X} tiende a una distribución normal cuando crece nn: XnN(μ,σ/n)\overline{X_n} \approx N(\mu,\sigma/\sqrt{n}), cuando nn \to \infty.

¿esto que nos dice?

Suponga que tiene una distribución desconocida. Lo que garantiza el TLC es que al hacer una distribución de los promedios muestrales usted tiene una estimación del promedio de esa distribución desconocida, y la desviación estándar de esa distribución desconocida.

Ejemplo

Supongamos que tenemos una variable aleatoria que queremos caracterizar. Ahora, esa variable puede distribuirse de manera uniforme, pero supongamos que eso no lo sabemos.

Por ejemplo, usted encuentra un problema real, decide usar estadística para caracterizarlo. Define una variable. Pero no sabe si la variable que definió es uniforme o no. ¿cómo encuentra el promedio?

Específicamente, digamos que XX es una variable aleatoria uniforme en (0,10)(0,10). Representamos la variable por el siguiente histograma.

histograma  de una distribución uniforme, en el eje horizontal están los valores de 0 a 10, en el eje vertical su densidad, las barras varían en altura, pero están cerca a 0.1

Si quisieramos saber el promedio de la variable XX, podríamos hacer un censo del valor de la variable y promediar. Si esto es impráctico, podemos tomar una muestra y calcularle el promedio. Pero para tener un valor más cercano al promedio poblacional, podemos hacer esto varias veces, tomar varias muestras y calcular el promedio sobre cada muestra. Nos hacemos la siguiente pregunta:

¿Cómo se distribuye la variable promedios de X\overline{X}?

Tomamos una primera muestra, y obtenemos los valores: 0.6564121 4.7021593 4.9894877 3.3917462 1.7230563 9.4006784 4.6939857 2.3625959 7.1384810 7.2330379.

Al calcular el promedio, obtenemos: X1=4.62164\overline{X_1}= 4.62164

Si tomamos una segunda muestra, con los valores: 8.5333600 0.4704488 5.8710375 6.0414564 4.5583983 9.7168667 6.7065967 2.2844655 3.7532787 9.9928106

Obtenemos el promedio X2=5.792872\overline{X_2}=5.792872

Si tomamos una tercera muestra, con valores: 0.5721976 3.5036649 2.5889360 1.2619283 7.1515359 2.5302950 2.7476769 6.1138531 6.5134797 0.7043770

Obtenemos: X3=3.368794\overline{X_3} =3.368794

Fíjese que esos promedios son distintos. Queremos saber cuál puede ser un buen valor del promedio (estadístico de centro) y de su desviación estándar.

Segun el Teorema del Límite Central, {X}\{\overline{X}\} tiene una distribución normal, y su μ\mu es el de la distribución original. Su desviación estándar es σ/n\sigma/\sqrt{n}, es decir, teniendo la desviación estándar de la distribución de muestreo podemos calcular la de la distribución original.

En este caso la siguiente es la distribución de promedios. ¿que puede decir del promedio de los promedios, comparado con el promedio de la distribución original?

Histograma de la distribución de muestreo de la media. Es una distribución con forma de campana, lo que quiere decir que las clases cercanas al promedio, que es la mitad, son más altas y los valores de las clases bajan hacia los costados de la campana. Es simétrica. Hay 11 clases, que van desde 2.5 hasta 8. El promedio es 5, las clases cercanas a 5 tienen una densidad cercana a 0.4, las de los extremos cercanas a 0.

Recursos


Previous Post
2024 S2 C.2 Intervalo de Confianza
Next Post
2024 S2 B.4 Taller en clase