Skip to content

Prueba de Hipótesis

Published: at 05:10 PM

Hipótesis

Proposiciones acerca de las características de una variable o acerca de la relación entre dos o más variables.

Características

Prueba de Hipótesis

Ejemplo (Hipótesis)

Un mandatario local dice que durante su mandato por lo menos el 5% de los viajes en la ciudad se harán en bicicleta. Si falla, menos del 5% de los viajes en la ciudad se harán en bicicleta. Se plantea la variable: X: fracción de los viajes que se realizan en bicicleta.

En una investigación se tiene indicios de que no se cumplió la meta (por ejemplo los colectivos ciclistas tienen esa impresión). Plantea la hipótesis: HaH_a la fracción de los viajes es menor a 0.05.

La hipótesis nula: H0H_0 la fracción de los viajes es mayor a 0.05.

No tenemos toda la información de la realidad, pero sabemos que si el 5% de los viajes son en bicicleta, y si tomamos una muestra suficientemente grande de los viajes muy probablemente encontremos suficientes viajes en Bicicleta.

Prueba de Hipótesis para el promedio, μ\mu

Como primer caso, piense que la hipotesís nula es que el promedio es igual o mayor a un valor umbral: H0:μμ0H_0: \mu \geq \mu_0

En este caso la hipótesis alteranativa es: el parámetro real es menor a ese umbral, es decir que Ha:μ<μ0H_a: \mu < \mu_0

Valor crítico para región de rechazo

El valor crítico es el valor de la distribución t de student, con parámetros α\alpha y n1n-1 grados de libertad. Se simboliza como: tα;n1t_{\alpha;n-1}. En la gráfica es la región azul:

región de rechazo H_a:\mu < \mu_0, H_0:\mu \geq \mu_0 Ha:μ<μ0H_a:\mu < \mu_0, H0:μμ0H_0:\mu \geq \mu_0

Para calcularlo en Python se usa el siguiente código:

from scipy.stats import t
t.ppf(alfa,10)

Atención En el software R se usa 1α1-\alpha.

Estadística de prueba.

La estadística de prueba es una distribución t-student con n1n-1 grados de lib. tc=xμ0s/nt_c=\frac{\overline{x}-\mu_0}{s/\sqrt{n}}

Ejemplo, valor del parámetro “promedio” en una prueba médica

Una empresa dice que la potencia de la medicina es del 80%, pero al revisar 100 cápsulas el valor promedio calculado es de 79.7% con una desviación estándar de s=0.8%s=0.8\%. ¿hay suficiente evidencia para refutar a la empresa?

Datos

Primero organicemos los datos del enunciado en una tabla.

característicavalor
VariableX: potencia
tamaño de la muestran=100
promediox=79.7\overline{x}=79.7
desviación estándars=0.8s=0.8
confianzaα=0.05\alpha=0.05

El valor de confianza se toma en 0.05 por defecto (a menos que se nos informe algo diferente)

Hipótesis

En este caso tenemos

Región de Rechazo

Sabemos que el promedio una muestra aleatoria no necesariamente tendrá 80% de potencia. Ahora, si un valor de promedio es muy pequeño, podemos decir que la empresa no cumple. ¿que tan bajo es bajo? Si cae en la región de rechazo.

Para calcular la región de rechazo necesitamos el valor crítico para defenir la región de rechazo. Se trata de t1α,n1t_{1-\alpha,n-1}, en este caso t0.95,99t_{0.95,99}

En Python:

from scipy.stats import t
t.ppf(0.95,99)
-1.6603911559963902

Quiere decir que valores el estadístico de prueba a la izquierda de -1.6604 son poco probables, entonces se rechaza la hipótesis nula. En este caso quiere decir que hay evidencia de que la empresa no cumple.

Estadístico de prueba

Es:

t=79.7800.8/1003.75t=\frac{79.7-80}{0.8/\sqrt{100}} -3.75

Como tenemos que ttct \leq t_c, entonces rechazamos la hipótesis nula.

Tipos de prueba de hipótesis para el promedio

Cuando la hipótesis nula es μμ0\mu \geq \mu_0 (promedio mayor o igual a un valor)

región de rechazo H_a:\mu < \mu_0, H_0:\mu \geq \mu_0

Cuando la hipótesis nula es μμ0\mu \neq \mu_0 (promedio mayor o igual a un valor)

región de rechazo H_a:\mu \neq \mu_0, H_0:\mu = \mu_0

Cuando la hipótesis nula es μμ0\mu \neq \mu_0 (promedio mayor o igual a un valor)

región de rechazo H_a:\mu > \mu_0, H_0:\mu \leq \mu_0

Recursos


Previous Post
2024 S2 D. Pandas
Next Post
2024 S2 C.2 Intervalo de Confianza