Evolución del COVID-19 en México
27 Mar 2020Después de pasar tiempo perdido en el sitio de gob.mx destinado al coronavirus, finalmente un tuit de @lobo_tuerto me hizo encontrar 2 iniciativas de la comunidad para traducir a formato estructurado los PDFs publicados por gobierno.
Tomando como referencia los archivos .XLSX publicados por guzmart logré armar un script que:
- Transforma la carpeta de datos en CSVs usando xlsx2csv, ver Fig 1.
- Mezcla los CSVs en un JSON indexado por fechas, y de paso utiliza el Marco Geoestadístico de INEGI para nombrar los estados, y así hacerlos más fácil de asociar a geometrías (i.e. shapefiles). El resultado se puede ver en series.json y el script en covid19mx-to-jsonseries.js.
find . -name '*.xlsx' | xargs -I {} xlsx2csv {} {}.csv | \
find . -name '*.xlsx.csv' | sed 'p;s/\.xlsx\.csv/\.csv/' | \
xargs -n2 mv
Fig 1. Comando de shell para transformar todos los archivos .xlsx a .csv
Mapa
Usando como base la tasa de casos por población estatal que utilicé en este post logramos armar un mapa choropleth con un slider para visualizar la progresión de los casos a través del tiempo.
Es fácil notar como para el día 20 de marzo, la mayoría de los estados reportaban casos. Resulta también de mi interés el incremento de casos en BCS con relación al resto; uno puede ver como la intensidad de la tasa aumenta para el día 27 de Marzo.
Cabe aclarar que existen ciertas inconsistencias en la publicaciones de la Secretaría de Salud, como han sido expresadas por la comunidad en [1] y [2]; por lo pronto, tomemos estos ejercicios de visualización como un ejercicio meramente ilustrativo.