Actualización: plataforma de visualización de estadísticas delictuales
15/11/2025
Acabo de publicar una actualización a mi app de visualización de estadísticas delictuales. Consiste en la actualización a los datos más recientes a la fecha: junio de 2025, publicados en la plataforma de estadísticas delictuales del Centro de Estudios y Análisis del Delito.
Se trata de una aplicación tipo dashboard que presenta visualizaciones de los datos oficiales de casos policiales, entendidos como:
denuncias formales que la ciudadanía realiza en alguna unidad policial posterior a la ocurrencia del delito, más los delitos de los que la policía toma conocimiento al efectuar una detención en flagrancia, es decir, mientras ocurre el ilícito.
Una de las características principales de la aplicación es facilitar la exploración de datos delictuales a nivel comunal, y además por mes y año, lo cual es complicado y poco amigable de hacer en la plataforma oficial de CEAD. También es posible descargar los datos desde el repositorio.
Los datos de la aplicación se obtienen mediante web scraping, usando código de R que emula las requests internas que la plataforma oficial de CEAD realiza para obtener sus datos. Esto significa que se emulan los miles de requests necesarios para acceder a todas las comunas del país, por todos los años, en todos los meses, solicitando todos los delitos disponibles, dentro de un loop que toma un par de horas en terminar1. El proceso de extracción de datos se explica en este tutorial.
La extracción de datos automatizada recibe las tablas en formato HTML, y las guarda tal cual para luego ser limpiadas en otro script, también automáticamente. En este punto el único inconveniente fue pasar de una tabla con múltiples encabezados, y grupos y subgrupos que solamente se distinguen de las filas de datos por su color o el tamaño de las letras 😣
En el repositorio hay más información sobre el proceso y un breve apartado metodológico sobre los delitos considerados (porque este año actualizaron las categorías de delitos incluidos).
-
debido a la espera ética entre requests que toma en consideración el tiempo de respuesta del servidor para no sobrecargarlo. ↩︎
- Fecha de publicación:
- November 15, 2025
- Extensión:
- 2 minute read, 378 words