Ejemplo: Merge, Salud y Servicios del hogar
Descargamos los datos de salud y servicios del hogar de la página del DANE de la encuesta del 2018: https://microdatos.dane.gov.co/index.php/catalog/607/get-microdata
Importamos las librerías
import pandas as pd
import numpy as np
Cargamos los conjuntos de datos
dfSalud = pd.read_csv("Salud.csv",sep=';')
dfServicios = pd.read_csv("Servicios del hogar.csv",sep=';')
Preguntas:
-
¿con qué comando imprime los primeros registros de estas dos bases de datos?
dfSalud.head() dfServicios.head()
-
¿con qué comandos imprime los nombres de las variables de éstas bases de datos?
dfSalud.columns dfServicios.columns
-
¿con qué comando renombra la variable
secuencia_encuesta
de la tablaServicios del Hogar
al nombreID
?dfServicios.rename(columns={"secuencia_encuesta":"ID"}, inplace=True)
-
¿con qué comando renombra la variable
secuencia_p
de la tablaSalud
al nombreID
?dfSalud.rename(columns={"secuencia_p":ID}, inplace=True)
-
¿con qué comando mezclaria los dos conjuntos de datos?
pd.merge(left=dfServicios, right=dfSalud,how="left", left_on=["DIRECTORIO","ID"],right_on=["DIRECTORIO","ID"])