Skip to content

Visualización

Published: at 12:00 AM

Table of contents

Open Table of contents

Visualización

¿Para Qué? ¡Atención!

¿Para Qué?

¡Cuidado!\color{red}¡Cuidado!

Descripción de los datos

Tipos de Datos

Características de los Datos

Estructuras (o estructurar) los datos

Tipos de Representación

Preparación

Revisión de la Documentación

Preparación

Describiendo las distribuciones

# de registros por valores de Variable categórica

Usando el diccionario que habíamos definido antes:

       region={1:'Western Europe',2:'Northern Europe',
       3:'Southern Europe', 4:'Eastern Europe',5:'Northern Africa',
       6:'Western Africa', 7:'Middle Africa',8:'Eastern Africa',
       9:'Southern Africa',10:'Western Asia',11:'Central Asia',
       12:'East Asia',13:'South-East Asia',14:'South Asia',
       15:'Oceania',16:'North America',17:'Central America',
       18:'South America', 19:'Caribbean'}`

Podemos reemplazar: df.replace({'e_regiongeo': region}, inplace=True)

# regiones por valores de variable categórica

ax = sns.countplot(data=df, y='e_regiongeo',color='darkgray')
ax = sns.countplot(data=df, y='e_regiongeo',color='blue')

Ejercicio

Vamos a trabajar con los datos de Nacimientos del DANE del 1998

Histogramas de una variable

A continuación nombramos los ejes:

     ax.set(xlabel='Egalitarian Democracy Index',ylabel='Count')

Ejercicio

Histogramas de una variable, con estimación de densidad

Por ejemplo, para el índice de democracia igualitaria: ax.set(xlabel='Egalitarian Democracy Index',ylabel='Count')

Se obtiene la figura:

        \eb

Análisis Multivariado

Histogramas Condicionados

Para generar el histograma condicionado se usa la siguiente instrucción:

Con:

ax.set(xlabel='Egalitarian Democracy Index')

Se obtiene:

Diagramas de Dispersión

Se añade el título a los ejes:

ax.set(xlabel=‘Egalitarian Democracy Index’,ylabel=‘Polyarchy Index’)

Y se obtiene la gráfica:

Se puede profundizar en éstos temas en la bibliografía.7

Ejercicio

Referencias

Gráficas

* Traveling Salesmen (Red)  https://networkx.org/documentation/stable/auto_examples/drawing/plot_tsp.html#sphx-glr-auto-examples-drawing-plot-tsp-py
* Harvest https://matplotlib.org/stable/gallery/images_contours_and_fields/image_annotated_heatmap.html#sphx-glr-gallery-images-contours-and-fields-image-annotated-heatmap-py
* Random Graph https://networkx.org/documentation/stable/auto_examples/drawing/plot_random_geometric_graph.html#sphx-glr-auto-examples-drawing-plot-random-geometric-graph-py

Footnotes

  1. Se importan las librerías. Pandas: import pandas as pd Y seaborn: import seaborn as sns Y se carga el dataframe df = pd.read_csv("V-Dem-CY-Full+Others-v13.csv")

  2. Se filtran con rowfilter: rowfilter = df['year'] == 2022 ¡Ojo!\color{red} ¡Ojo! Con esta órden sólo lo creamos, no imprimimos. Para revisar podríamos, por ejemplo, calcular la suma: print(sum(rowfilter))

  3. df2022 = df[rowfilter]

  4. Creamos el filtro: rowfilter1900 = df['year'] == 1900. Filtramos: df1900 = df[rowfilter1900]

  5. Así:

  6. Así:

  7. Específicamente:

    • Histogramas bivariados: McLevey pg.195
    • Estimación Kernel bivariada: McLevey pg.198
    • Ajuste: McLevey pg. 200 y 203
  8. El diagrama es el siguiente:


Previous Post
Evaluación 5
Next Post
Trabajo en Clase: Distribuciones