Hipótesis
Proposiciones acerca de las características de una variable o acerca de la relación entre dos o más variables.
- H. : La edad promedio a la que comienza el consumo de cigarrillo en Colombia es de 15 años
- El cociente intelectual de la población sigue una distribución normal
- El cancer de pulmón es más frencuente entre fumadores que no fumadores.
- El nivel de estrés de una person a se relaciona con el número de horas que trabaja
Características
- Se refieren a una situación real
- Se relacionan con variables concretas, precisas, comprendibles
- Las variables se relacionan de forma clara y lógica
- Se relacionan a variables cuantificables y medibles
- Se pueden probar o desprobar.
Prueba de Hipótesis
-
La alternativa: es nuestra expetativa. Si tenemos un valor umbral, , la hipótesis alternativa puede ser:
-
, la hipótesis es que el valor del parámetro es menor que el valor umbral.
-
, la hipótesis es que el valor del parámetro es igaul al valor umbral
-
, la hipótesis es que el valor del parámetro es mayor al valor umbral
-
-
La hipótesis nula , hipótesis de no efecto, hipótesis de no diferencia.
-
Por ejemplo, si la hipótesis nula es , entonces la hipótesis alternativa es que el valor del parámetro es mayor al umbral , es decir es:
-
Si la hipótesis nula es , entonces la hipótesis alternativa es que , es decir es:
-
Si la hipótesis nula es , entonces la hipótesis alternativa es que el valor del parámetro es menor al umbral , es decir es:
-
-
Región de rechazo: Si no se cumple , la dist. de muestreo dará un valor extremo. Es decir, es poco probable que caiga en ese valor. define un rango donde desestimamos , por improbable.
(como creemos que pasará , esperamos que no pase , luego la estadística de muestreo lleva a rechazo)
-
Estadística de prueba: distribución de muestreo, dado que es cierto. Muestra como se espera que se comporten los datos muestrales si la hipótesis nula fuese cierta.
Ejemplo (Hipótesis)
Un mandatario local dice que durante su mandato por lo menos el 5% de los viajes en la ciudad se harán en bicicleta. Si falla, menos del 5% de los viajes en la ciudad se harán en bicicleta. Se plantea la variable: X: fracción de los viajes que se realizan en bicicleta.
En una investigación se tiene indicios de que no se cumplió la meta (por ejemplo los colectivos ciclistas tienen esa impresión). Plantea la hipótesis: la fracción de los viajes es menor a 0.05.
La hipótesis nula: la fracción de los viajes es mayor a 0.05.
No tenemos toda la información de la realidad, pero sabemos que si el 5% de los viajes son en bicicleta, y si tomamos una muestra suficientemente grande de los viajes muy probablemente encontremos suficientes viajes en Bicicleta.
Prueba de Hipótesis para el promedio,
Como primer caso, piense que la hipotesís nula es que el promedio es igual o mayor a un valor umbral:
En este caso la hipótesis alteranativa es: el parámetro real es menor a ese umbral, es decir que
Valor crítico para región de rechazo
El valor crítico es el valor de la distribución t de student, con parámetros y grados de libertad. Se simboliza como: . En la gráfica es la región azul:
,
Para calcularlo en Python se usa el siguiente código:
from scipy.stats import t
t.ppf(alfa,10)
Atención En el software R se usa .
Estadística de prueba.
La estadística de prueba es una distribución t-student con grados de lib.
Ejemplo, valor del parámetro “promedio” en una prueba médica
Una empresa dice que la potencia de la medicina es del 80%, pero al revisar 100 cápsulas el valor promedio calculado es de 79.7% con una desviación estándar de . ¿hay suficiente evidencia para refutar a la empresa?
Datos
Primero organicemos los datos del enunciado en una tabla.
característica | valor |
---|---|
Variable | X: potencia |
tamaño de la muestra | n=100 |
promedio | |
desviación estándar | |
confianza |
El valor de confianza se toma en 0.05 por defecto (a menos que se nos informe algo diferente)
Hipótesis
En este caso tenemos
- Hipótesis Nula . Se acepta lo que dice la empresa
- Hipótesis alternativa . No se acepta, porque tenemos evidencia de lo contrario, ya que medimos la concentración promedio en 79.7%, que es menor al 80%.
Región de Rechazo
Sabemos que el promedio una muestra aleatoria no necesariamente tendrá 80% de potencia. Ahora, si un valor de promedio es muy pequeño, podemos decir que la empresa no cumple. ¿que tan bajo es bajo? Si cae en la región de rechazo.
Para calcular la región de rechazo necesitamos el valor crítico para defenir la región de rechazo. Se trata de , en este caso
En Python:
from scipy.stats import t
t.ppf(0.95,99)
-1.6603911559963902
Quiere decir que valores el estadístico de prueba a la izquierda de -1.6604 son poco probables, entonces se rechaza la hipótesis nula. En este caso quiere decir que hay evidencia de que la empresa no cumple.
Estadístico de prueba
Es:
Como tenemos que , entonces rechazamos la hipótesis nula.
Tipos de prueba de hipótesis para el promedio
Cuando la hipótesis nula es (promedio mayor o igual a un valor)
- :
- Región de rechazo:
- Estad. de prb.: T-Student:
- Rechazo:
- Python:
t.ppf(alfa,n-1)
- R:
qt(1-alfa,n-1,lower.tail=F)
Cuando la hipótesis nula es (promedio mayor o igual a un valor)
- :
- Región de rechazo:
- Rechazo:
- Python:
t.ppf(alfa/2,n-1)
- Python:
t.ppf(1-alfa/2,n-1)
Cuando la hipótesis nula es (promedio mayor o igual a un valor)
- :
- Región de rechazo:
- Rech.:
- Python:
t.ppf(1-alfa,n-1)
- Python:
Recursos
- Hipótesis https://youtu.be/F5iJBN50mms?si=Qd-wCfM0rvz5XgkE
- Prueba de Hipótesis https://youtu.be/Tt8PIJY-2Pk?si=RoOQ5q1-IBjW6NAV
- Prueba de Hipótesis para el promedio https://youtu.be/764-6M9JPtY?si=I-FCU52Hpl61dJbj
- Prueba de Hipótesis promedio y proporción https://youtu.be/NJioD-owWZU?si=g7mtzlONKCOYIpom
- Tests en python
- Contento, capítulo 5