Blog

Plataforma de análisis: Índice de Brechas de Género

El Índice de Brechas de Género es un nuevo instrumento estadístico desarrollado por la Subdere, diseñado para medir brechas de género a nivel comunal y regional en el país. El IBG se basa en 52 indicadores de nivel comunal y regional, que abarcan las dimensiones de cultura, educación, salud, laboral, participación y social. Se realizaron búsquedas exhaustivas de datos sociales de nivel comunal que cuenten con desagregación de género, incluyendo múltiples solicitudes de datos por ley de transparencia a servicios públicos. Así, hemos desarrollado una plataforma de visualización de datos única en la cantidad de información con perspectiva de género disponible, además complementada con interpretaciones teóricas y conceptuales de cada indicador.

apps chile datos blog shiny

Galería de libros de Goodreads para tu blog o sitio web con R y Quarto

Para mi blog personal quise crear publicaciones que muestren los libros que he leído cada año, los cuales registro en mi cuenta de Goodreads. Así que usamos R para generar cuadrículas de libros por año, incluyendo la descarga automática de las portadas de los libros. Ésta es una de las gracias de Quarto: incluir código de R dentro de tus documentos, páginas web o publicaciones de blog, para generar contenido basado en datos.

quarto shiny blog web scraping

26/3/2026

Plataforma de visualización de resultados del Estudio de Brechas Comunales

Ya está disponible la plataforma de visualización de los resultados del Estudio de Brechas Comunales de la Subsecretaría de Desarrollo Regional y Administrativo (Subdere). Este proyecto fue desarrollado íntegramente en R, al igual que la plataforma interactiva. Este estudio mide brechas en infraestructura y servicios a través de 59 indicadores de nivel comunal, tomando en consideración las diferencias territoriales de comunas urbanas, mixtas y rurales.

chile datos apps blog Quarto shiny

Actualización del blog: menús, mejoras, y más morado

He estado retocando algunos aspectos de este blog. Quería contarles los principales cambios: tablas de contenido en todas las publicaciones, nuevos shortcodes, nuevo tema de colores para bloques de código, resultados de búsqueda con resúmenes de posts, y más.

blog

3/12/2025

Actualización: plataforma de visualización de estadísticas delictuales

Acabo de publicar una actualización a mi app de visualización de estadísticas delictuales. Es una aplicación tipo dashboard que presenta visualizaciones de los datos oficiales de casos policiales. La app se actualizó a los datos más recientes a la fecha: junio de 2025, publicados en la plataforma de estadísticas delictuales del Centro de Estudios y Análisis del Delito.

blog datos Chile apps

¿Por qué programar para trabajar con datos?

Llevo varios años trabajando con datos, tanto en el sector privado, como independiente y en el sector público, y hay algo que es una constante: siempre te van a pedir hacer cambios! Por eso, para estos trabajos no basta con “hacer” el resultado de principio a fin (un reporte, etc.), porque cualquier cambio (en datos/cálculo/salidas) implicaría “re-hacer” el trabajo…

blog

13/11/2025

Desarrollando un buscador para mi blog con Shiny

En este post innecesariamente largo les comento mi irracional alegría de haber programado en R+Shiny un buscador para este mismo sitio (funcionalidad que ya se estaba volviendo muy necesaria). En menos de media hora ya tenía un producto mínimo funcional gracias a lo simple que es programar con R. Esta funcionalidad nueva va a ayudar a poder encontrar posts sobre cualquier tema, sobre todo para mí, que uso este blog a diario para copiar y pegar mi propio código 😂

blog Shiny

Taller: Compartir y colaborar desde el cruce entre las ciencias de datos y las ciencias sociales

El viernes 22 de agosto participé de las clases magistrales del Diplomado de Ciencia de Datos para Ciencias Sociales y Humanidades de la UNAM. En la clase hablo de mi trayectoria, mi salto desde la sociología al análisis de datos, y voy dando consejos (mezclados con ejemplos de código) para tomar una postura participativa y solidaria con respecto a la programación, el trabajo con datos, y la creación de comunidades en torno al código abierto.

videos consejos quarto github blog

Actualización del blog: etiquetas

Por fin tuve un respiro del trabajo, así que aproveché de darle una manito de gato a este sitio. Cambié algunas cosas estéticas menores y algunas funcionalidades que tenía pendientes de hace tiempo.

blog

16/10/2025

Gráfico de mis artistas y géneros musicales más escuchados según Last.fm

Tenía ganas de reproducir en R uno de los gráficos que aparecen en el reporte mensual de Last.fm, una plataforma donde las personas van registrando la música que escuchan diariamente, así que aquí va el proceso y el resultado final. También incluye otras visualizaciones alternativas, y una animación del proceso de visualización de una de ellas!

ggplot2 visualización de datos blog gráficos animaciones

Repositorio de datos sociales

Acabo de publicar una nueva página donde voy a estar recopilando todos los conjuntos de datos sociales con los que trabajo o he trabajado.

La idea de esta página es poder compartir fácilmente datos sociales sobre Chile que vienen limpios y procesados, para facilitar el trabajo de otras personas, y también ayudarles a aprender análisis de datos.

Se trata de una tabla que se genera automáticamente, la cual contiene una lista de repositorios enfocados en datos sociales, con clasificación según la temática del dato, y varias columnas que indican las características del conjunto de datos, como si es que el dato contiene variables de género, si está desagregado a nivel comunal, si existe una aplicación de visualización de datos asociada, la temporalidad (anual/mensual/semanal) de las observaciones, y más.

blog datos tablas quarto Chile

Web scraping de noticias: avances de fin de año

A largo de todo el año 2024 he estado realizando web scraping de distintas fuentes de noticias digitales de Chile. Casi todos los días ejecuto un script que a su vez se ejecuta decenas de otros scripts, que realizan el scraping diario de noticias. El resultado de estos procesos, día tras día, va aumentando la cantidad total de noticias que he ido recolectando. De vez en cuando, algún sitio cambia, o algo falla, y tengo que corregir manualmente los scripts. Cada cierto tiempo ejecuto versiones alternativas de los scripts para hacer una extracción de datos desde fechas anteriores, aumentando la cantidad total de noticias de fechas pasadas, lo que me permite rellenar vacíos en las obtenciones anteriores de noticias diarias, como también aumentar la cantidad total de noticias con datos desde años antes de que empezara este proyecto.

blog ggplot2 web scraping animaciones

Haciendo que un loop muy largo termine sin cancelarlo

Me encuentro en la tarea de tener que procesar cientos de miles de datos, lo cual demorará varios cientos de horas, por lo que necesito que dejar mi computador trabajando durante las noches, por varios días. La idea es que, cada noche, el computador procese de la mayor cantidad de datos posibles, los resultados se guarden, y a la siguiente noche el proceso se repita con datos nuevos, hasta que en algunos días logre procesar todos los cientos de miles de datos que necesito.

consejos curiosidades blog purrr optimización

26/12/2024

Novedades: app de temperaturas extremas, actualizaciones de otras apps

Resumen de las actualizaciones recientes de mis trabajos. Recientemente lancé un visualizador de temperaturas extremas de Chile, que permite ver gráficamente los efectos del calentamiento global medidas por las estaciones meteorológicas del país. Además, actualicé los datos del visualizador de delincuencia, que ahora tiene datos hasta septiembre de 2024, y también del visualizador de femicidios, que también ahora tiene datos hasta la fecha.

En paralelo, otra aplicación que se actualiza frecuentemente es la de análisis de prensa, que se actualiza todos los lunes o martes de la semana con las noticias hasta el domingo anterior; es decir, muestra los datos de la última semana completa hacia atrás (esto porque el visualizador es de datos semanales, no diarios, entonces tienen que estar terminadas las semanas para poder incluirlas en el análisis, de lo contrario las semanas aparecerían con menos datos).

blog

Procesando datos de texto en masa usando modelos de lenguaje (LLM)

Anoche dejé el computador procesando 5000 noticias por 8 horas usando un modelo de lenguaje (LLM) local en R para obtener clasificación, resumen y sentimiento de cada texto.

Esto porque tengo una base de datos de más de 600 mil noticias chilenas, con su texto completo, y quiero empezar a sacarle más provecho. Por ejemplo, saber si noticias que hablan de ciertos temas son positivas o negativas (sentimiento), o simplemente clasificar de manera automatizada las noticias para separar las de política y economía de las de deportes y farándula.

inteligencia artificial blog

20/12/2024

¿Por qué usar R?

Series: Introducción a R

Analizar datos mediante lenguajes de programación (como R u otros) puede sonar complicado, pero trae muchos beneficios para tu análisis. Aquí te dejo algunas de las razones principales.

blog

7/11/2024