Table of contents
Open Table of contents
Modelos estadísticos y software especializado para métodos cuantitativos
Muestreo
Suponga que se quiere elegir un único elemento al azar del siguiente conjunto:
🍉 🍉 🍉 🍉 🥝 |
Tenemos que:
Ahora, supongamos que se van a elegir dos elementos. Aquí podríamos hacerlo de dos formas, con reemplazo y sin reemplazo.
En la mayoría de las aplicaciones el cálculo exacto se haría en muestreo sin reemplazo. Pero si la población es grande, la diferencia es pequeña. Como el muestreo con reemplazo es más sencillo que el muestreo sin reemplazo, cuando la población es grande se asume reemplazo.
Muestreo con reemplazo
Para construir la muestra se toma el primer elemento al azar del grupo y para elegir el segundo se usa el mismo conjunto inicial. Es decir:
-
Se empieza con el conjunto: | 🍉 🍉 🍉 🍉 🥝 |
-
Se elije uno al azar, que podría ser 🍉 con una , o ser 🥝 con .
-
Sin importar cual sale, se vuelve a elegir un segundo elemento del mismo conjunto.
Las probabilidades serán:
Podemos revisar que se cumple la regla de ls probabilidad, sumando y comparando con 1.
Por ejemplo si estamos interesados en saber cuál es la probabilidad de que dos personas elegidas al azar tengan la vcuna Covid, dado que la población es muy grande, se puede asumir que se elige con reemplazo.
Muestreo sin reemplazo
-
Se empieza con el conjunto: | 🍉 🍉 🍉 🍉 🥝 |
-
Se elije uno al azar, que podría ser 🍉 con una , o ser 🥝 con . Para el siguiente paso no se devuelve la fruta. Es necesario identificar el subíndice, porque las probabilidades cambiarán.
-
Se elije el segundo. 3.1 Si en el primero se eligió 🍉, entonces ahora el conjunto es: | 🍉 🍉 🍉 🥝 | Y las probabilidades ahora son:
Entonces en este caso tendríamos:
3.2 Si en el primero se eligió 🥝, entonces ahora el conjunto es | 🍉 🍉 🍉 🍉 |, y las probabilidades son:
Entonces en este caso tendríamos:
Finalmente tenemos, entonces:
En este caso, como se trata de una muestra pequeña, hay grandes diferencias entre el muestreo con y son reemplazo.
Distribución Hipergeométrica
(Contento, pg 192)
En un muestreo con reemplazo, la probabilidad está dada por la distribución hipergeométrica. Sus propiedades:
- Experimento consistente en seleccionaruna muestra aleatoria, sin reemplazo, de tamaño , de un conjunto finito de tamaño . El orden de los elementos no importa
- De los objetos, son de tipo I, tienen característica de interés. Los restntes son de tipo II, no tienen la característica.
- La variable aleatoria es: cantidad de elementos seleccionados que tienen el rasgo de interés (están en el grupo I).
Función de probabilidad hipergeométrica
Si una variable aleatoria tiene distribución hipergeométrica de parámetros y , su función de masa de probabilidad es:
Para hacer referencia a una variable aleatoria distribuída hipergeométricamente con parámetros , y , se escribe
Valor esperado y varianza
Si , el promedio y la varianza son:
Cálculo en el software
En R
:
dhyper(x,K,N-K,n)
En Python
:
scipy.stats.hypergeom.pmf(x,N,K,n)
Ejemplo
La cuarta parte de las semillas de un lote de 40 está en mal estado. Se toman 8 semillas y se analizan en laboratorio. Con qué probabilidad de ellas estarán en malas condiciones?
: número de semillas en malas condiciones
: 40 semillas
semillas en malas condiciones
tamaño de la muestra
La probabilida de que 3 de ellas esté en malas condiciones es . Se puede calculr con el software:
dhyper(3,10,30,8)
Se obtiene como resultado 0.2223625
.
En Python
es:
import scipy.stats as st
st.hypergeom.pmf(3,40,10,8)
De nuevo se obtiene 0.22236252576809853
.
Ejercicios
-
Del libro de González, Sección 5.3, página 287, distribución hipergeométrica
-
Del Libro de Contento, página 195.
Recursos Adicionales
-
En el libro de González, Pg. 281.
-
A mayor profundidad, el profesor Ronny Vallejos lo discute en el video https://www.youtube.com/watch?v=YBeL_LxEi40