Esta vez, ejercicios de visualización de datos.
¿No es aburrido usar siempre los mismos datos?
Utilicemos datos nuevos.
1. Archivo y problema
El archivo es una estadística de la cantidad anual de delitos ocurridos y casos resueltos del portal de datos públicos.
Dibujemos el gráfico según las siguientes condiciones.
Visualizar la cantidad de ocurrencias de hackeos (filtraciones de datos) y casos resueltos
Configurar el título, la etiqueta del eje x, la etiqueta del eje y, y la leyenda
Cambiar el estilo de las líneas libremente
Otros estilos son libres

2. Solución del problema
Primero, copiaremos el contenido inicial del artículo anterior, donde lo único que se cambia es la ruta del archivo.
import pandas as pd
# Importar módulos y configurar fuentes en coreano
import matplotlib.pyplot as plt
import matplotlib
# Configuración de fuentes en MacOS
# matplotlib.rcParams["font.family"] = "AppleGothic"
# Configuración de fuentes en Windows
matplotlib.rcParams["font.family"] = "Malgun Gothic"
# Configuración del tamaño de la fuente
matplotlib.rcParams["font.size"] = 13
# Solución al problema de impresión de negativos
plt.rcParams['axes.unicode_minus'] = False
crime = pd.read_excel("./crime_statistics.xlsx")
crime.head(3)Al revisar los datos, se puede ver que los años están duplicados según la categoría.

Los años duplicados se eliminan usando unique().
Luego, se extraen la cantidad de ocurrencias de hackeos y los casos resueltos utilizando loc y condiciones, y se dibuja un gráfico preliminar.
x = crime.loc[:,"연도"].unique()
y1 = crime.loc[crime.구분=="발생건수","해킹(자료유출)"]
y2 = crime.loc[crime.구분=="검거건수","해킹(자료유출)"]
plt.plot(x,y1)
plt.plot(x,y2)
Agreguemos una leyenda y un título al gráfico.
x = crime.loc[:,"연도"].unique()
y1 = crime.loc[crime.구분=="발생건수","해킹(자료유출)"]
y2 = crime.loc[crime.구분=="검거건수","해킹(자료유출)"]
plt.plot(x,y1,label="발생건수") # <-- añadido
plt.plot(x,y2,label="검거건수") # <-- añadido
plt.legend() # <-- añadido
plt.title("Cantidad de Ocurrencias y Casos Resueltos de Hackeos") # <-- añadido
Además, configurar los nombres de los ejes.
x = crime.loc[:,"연도"].unique()
y1 = crime.loc[crime.구분=="발생건수","해킹(자료유출)"]
y2 = crime.loc[crime.구분=="검거건수","해킹(자료유출)"]
plt.plot(x,y1,label="발생건수")
plt.plot(x,y2,label="검거건수")
plt.legend()
plt.xlabel("Año") # <-- añadido
plt.ylabel("Cantidad") # <-- añadido
plt.title("Cantidad de Ocurrencias y Casos Resueltos de Hackeos")
Finalmente, especificar el estilo de las líneas y agregar una cuadrícula.
x = crime.loc[:,"연도"].unique()
y1 = crime.loc[crime.구분=="발생건수","해킹(자료유출)"]
y2 = crime.loc[crime.구분=="검거건수","해킹(자료유출)"]
plt.plot(x,y1,"^--",label="발생건수") # <-- añadido
plt.plot(x,y2,"o-",label="검거건수") # <-- añadido
plt.legend()
plt.xlabel("Año")
plt.ylabel("Cantidad")
plt.title("Cantidad de Ocurrencias y Casos Resueltos de Hackeos")
plt.grid() # <-- añadido
3. Conclusión
En el siguiente artículo, intentaré abordar cómo dibujar varios gráficos a la vez en Matplotlib.
Espero que esto sea de gran ayuda para practicar la visualización de datos.
댓글을 불러오는 중...