Introducción a la Visualización de Datos en Python 6 - Ejercicios

Esta vez, ejercicios de visualización de datos.

¿No es aburrido usar siempre los mismos datos?

Utilicemos datos nuevos.

1. Archivo y problema

El archivo es una estadística de la cantidad anual de delitos ocurridos y casos resueltos del portal de datos públicos.

https://earthscience.kr/files/matplotlib/crime_statistics.xlsx

earthscience.kr

Dibujemos el gráfico según las siguientes condiciones.

Visualizar la cantidad de ocurrencias de hackeos (filtraciones de datos) y casos resueltos
Configurar el título, la etiqueta del eje x, la etiqueta del eje y, y la leyenda
Cambiar el estilo de las líneas libremente
Otros estilos son libres

Introducción a la Visualización de Datos en Python 6 - Ejercicios-1

2. Solución del problema

Primero, copiaremos el contenido inicial del artículo anterior, donde lo único que se cambia es la ruta del archivo.

import pandas as pd

# Importar módulos y configurar fuentes en coreano
import matplotlib.pyplot as plt
import matplotlib

# Configuración de fuentes en MacOS
# matplotlib.rcParams["font.family"] = "AppleGothic"

# Configuración de fuentes en Windows
matplotlib.rcParams["font.family"] = "Malgun Gothic"

# Configuración del tamaño de la fuente
matplotlib.rcParams["font.size"] = 13

# Solución al problema de impresión de negativos
plt.rcParams['axes.unicode_minus'] = False

crime = pd.read_excel("./crime_statistics.xlsx")
crime.head(3)

Al revisar los datos, se puede ver que los años están duplicados según la categoría.

Introducción a la Visualización de Datos en Python 6 - Ejercicios-2

Los años duplicados se eliminan usando unique().

Luego, se extraen la cantidad de ocurrencias de hackeos y los casos resueltos utilizando loc y condiciones, y se dibuja un gráfico preliminar.

x = crime.loc[:,"연도"].unique()
y1 = crime.loc[crime.구분=="발생건수","해킹(자료유출)"]
y2 = crime.loc[crime.구분=="검거건수","해킹(자료유출)"]
plt.plot(x,y1)
plt.plot(x,y2)

Introducción a la Visualización de Datos en Python 6 - Ejercicios-3

Agreguemos una leyenda y un título al gráfico.

x = crime.loc[:,"연도"].unique()
y1 = crime.loc[crime.구분=="발생건수","해킹(자료유출)"]
y2 = crime.loc[crime.구분=="검거건수","해킹(자료유출)"]
plt.plot(x,y1,label="발생건수") # <-- añadido
plt.plot(x,y2,label="검거건수") # <-- añadido
plt.legend() # <-- añadido
plt.title("Cantidad de Ocurrencias y Casos Resueltos de Hackeos") # <-- añadido

Introducción a la Visualización de Datos en Python 6 - Ejercicios-4

Además, configurar los nombres de los ejes.

x = crime.loc[:,"연도"].unique()
y1 = crime.loc[crime.구분=="발생건수","해킹(자료유출)"]
y2 = crime.loc[crime.구분=="검거건수","해킹(자료유출)"]
plt.plot(x,y1,label="발생건수")
plt.plot(x,y2,label="검거건수")
plt.legend()
plt.xlabel("Año") # <-- añadido
plt.ylabel("Cantidad") # <-- añadido
plt.title("Cantidad de Ocurrencias y Casos Resueltos de Hackeos")

Introducción a la Visualización de Datos en Python 6 - Ejercicios-5

Finalmente, especificar el estilo de las líneas y agregar una cuadrícula.

x = crime.loc[:,"연도"].unique()
y1 = crime.loc[crime.구분=="발생건수","해킹(자료유출)"]
y2 = crime.loc[crime.구분=="검거건수","해킹(자료유출)"]
plt.plot(x,y1,"^--",label="발생건수") # <-- añadido
plt.plot(x,y2,"o-",label="검거건수") # <-- añadido
plt.legend()
plt.xlabel("Año")
plt.ylabel("Cantidad")
plt.title("Cantidad de Ocurrencias y Casos Resueltos de Hackeos")
plt.grid() # <-- añadido