Archivo para entregar
En grupos de hasta 3 personas.
Reglas para el nombre del archivo
- Comienza con la fecha en formato ISO
- Incluye los primeros apellidos de cada persona del grupo, en mayúscula
- No tiene espacios, en lugar usa barra al piso
Formato del archivo
Puede hacerlo en google colab (nuevo proyecto) o en Anaconda. El
archivo que entregue debe ser un .ipynb
. 🆕
Nombres, correos
Incluya en el texto del archivo los nombres completos de quienes componen el grupo y sus direcciones de correo electrónico
Explicación a sus respuestas
Dentro del texto del archivo use los comentarios, con el símbolo #, para incluir comentarios, que expliquen lo que está haciendo y que respondan las preguntas que sean teóricas.
También puede hacerlo usando bloques de texto en el cuaderno de jupyter. Identifique el número de la pregunta y los valores particulares (por ejemplo ). 🆕
Bloques de instrucciones
Es mejor si incluye varias instrucciones en un sólo bloque de instrucciones, en lugar de un bloque para cada instrucción
Python: librerías
Para incluir una librería se usa el comando import
, seguido por el
nombre de la librería. Para usar un alias (usualmente acordar) se usa
el comando as
, seguido por el alias. Por ejemplo, para uasar la
librería numpy
, con el alias np
, se escribiría el comando:
import numpy as np
Vamos a utilizar las siguientes librerías:
numpy
, con el aliasnp
random
, con el aliasran
matplotlib.pyplot
, con el aliasplt
numpy
Es la librería numérica de python. Usualmente se incluye con el alias
np
. Se importa como:
import numpy as np
np.linspace
Lo usamos para generar números en un intervalo. Por ejemplo,
np.linspace(0,10,11)
genera los números del al
. Devuelve un arreglo.
random
Tiene funciones para números aleatorios. Se usa el alias ran
. Se
importa como:
import random as ran
semilla
Los generadores de números aleatorios realmente no son verdaderamente aleatorios, siguen reglas definidas que pareciera que generan números completamente aleatorios. Ahora, durante la fase de escritura y revisión del código es útil que las funciones generadoras de números aleatorios parezcan aleatorias pero repitan siempre la misma secuencia de números cada vez que se corre de nuevo el código.
Para garantizar que cada vez que se usa el código se generan los mismos valores aleatorios se usa una semilla, que es un valor numérico. Por ejemplo, el código:
ran.seed(3)
Define que la semilla es el número 3.
ran.choice
Lo usamos para elegir elementos al azar, por ejemplo de un arreglo.
Ejemplo
El siguiente código simula un único lanzamiento de un dado de seis caras:
import random as ran
ran.seed(8)
unlance = ran.choice([1,2,3,4,5,6])
- Se avisa que va a usar la librería random, usando el alias ran
- Usa una semilla, en este caso el número 8
- Elige ‘al azar’ un número entre los enteros del 1 al 6, y lo asigna
a la variable
unlance
matplotlib.pyplot
Matplotlib es la librería que se usa para generar las gráficas. Se
suele importar con el alias plt
:
import matplotlib.pyplot as plt
plt.hist
Lo usamos para construir un histograma. Vamos a usarlo con cuatro
argumentos. El primero, la lista de valores que van en el
histograma. El segundo, el rango, una pareja de números para un
histograma de enteros como pareja el 1 y el máximo + 1. El tercero
la palabra clave bins
igual al número de opciones del dado, cuarto
la palabra clave density
en True
, para que se genere un histograma
normalizado.
Por ejemplo, si estamos simulando un dado de tres valores, , y los datos que se obtuvieron del lanzamiento del dado son:
datos = [1,1,2,3,1,3,2,1,1,3,2,1,2]
El histograma se genera así:
plt.hist(datos,range=(1,3),bins=3,density=True)
Taller
Estadísticos de Centro
Construya un histograma con los valores del código de departamento
- Baje los datos del DANE
- De la página de Microdatos https://microdatos.dane.gov.co/index.php/catalog/DEM-Microdatos
- Busque “estadísticas vitales” del año que eligió (por ejemplo para 2019 el enlace sería: https://microdatos.dane.gov.co/index.php/catalog/696)
- Haga click en “Obtener Microdatos”
- Haga click en “Nacimientos”
- Elija dos categorías
- Calcule los estadísticos de Centro y Variabilidad, para esas categorìas
- Responda: ¿qué concluye sobre el comportamiento de las variables que eligió?
- Calcule el valor del percentil 85 para la variable peso_nac
- Calcule el valor del percentil 15 para la variable peso_nac
- Interprete los valores de percentil que calculó anteriormente.
Información
En la pestaña “diccionario de datos” nos explica la información sobre las variables. Por ejemplo, para el año 1988, https://microdatos.dane.gov.co/index.php/catalog/366/data-dictionary/F1?file_name=Nacimientos_1998 tenemos la siguiente información para la variable talla_nac
Talla del nacido vivo, al nacer (talla_nac) archivo de datos: Nacimientos_1998 Información general Válido: 0 Inválido: 0 Intervalo: discrete Decimal: 0 loc_width: 1 var_range: - var_format: numeric Preguntas e instrucciones Pregunta literal Talla del nacido vivo, al nacer
- Menos de 20
- 20-29
- 30-39
- 40-49 5 .50-59
- 60 y Más.
- Sin información
Grupos
- Andrea Carolina, Anyela, Gerson, año 2023.
- Carmelo, Deimer, Laura, Año 2022.
- Mailyn, Smith, Sebastián, Año 2021.
- Andrés Felipe, Juan carlos, Año
20242014 - Carlos, Luis Eligio, Pedro Luis, Año 2020
- Fayer Enrique, Rafael Ricardo, año 2019
- Juan David, Luis Alberto, Andrés. Año 2018