Taller: Compartir y colaborar desde el cruce entre las ciencias de datos y las ciencias sociales

El viernes 22 de agosto participé de las clases magistrales del Diplomado de Ciencia de Datos para Ciencias Sociales y Humanidades de la UNAM. En la clase hablo de mi trayectoria, mi salto desde la sociología al análisis de datos, y voy dando consejos (mezclados con ejemplos de código) para tomar una postura participativa y solidaria con respecto a la programación, el trabajo con datos, y la creación de comunidades en torno al código abierto.

videos consejos quarto github blog

Comandos comunes de Git

Colección de comandos de git para realizar acciones comunes y resolver problemas frecuentes. git es una herramienta para el control de versiones de código, respaldo de código, y colaboración.

git programación
27/10/2025

Redactar palabras en plural en R

Cuando desarrollamos reportes, gráficos o aplicaciones en R, necesitamos hacer que nuestros textos se adapten a los datos que estamos analizando. En este post veremos cómo hacer que el texto se adapte según las cantidades para redactar palabras en singular o plural.

texto
21/10/2025

Contar datos perdidos en una o varias columnas

Cuando estamos limpiando datos frecuentemente nos preguntamos cuántos datos perdidos tiene una columna. La respuesta se obtiene pidiendo un resumen (summarize()) que cuente la suma de datos perdidos (sum(is.na())) en una columna específica. ¿Pero qué pasa si tienes muchas columnas? No vas a andar escribiendo las columnas una por una… 😵‍💫 Usando las función across() de {dplyr}, podemos aplicar la misma operación a todas las columnas de un dataframe, y así obtener el conteo de datos perdidos de todas las columnas.

datos perdidos limpieza de datos
21/10/2025

Actualización del blog: etiquetas

Por fin tuve un respiro del trabajo, así que aproveché de darle una manito de gato a este sitio. Cambié algunas cosas estéticas menores y algunas funcionalidades que tenía pendientes de hace tiempo.

blog
16/10/2025

Validación de datos con {testthat} y {pointblank}

La validación de datos sirve para verificar durante el proceso de análisis si los datos cumplen con requerimientos de calidad y con tus expectativas, con el objetivo de evitar problemas futuros relacionados a datos inesperados, incompletos, o erróneos. En este post veremos dos paquetes para validar el funcionamiento de tu código y para validar tus datos.

procesamiento de datos consejos automatización limpieza de datos

Crea un mapa de Chile desde datos geoespaciales oficiales en R

En este tutorial aprenderemos a crear mapas de Chile en R usando datos geográficos o shapes oficiales, obtenidos desde la Subsecretaría de Desarrollo Regional y Administrativo (Subdere) y la Biblioteca del Congreso Nacional de Chile. El objetivo será aprender a visualizar mapas desde shapefiles obtenidos de internet, y a procesar datos geográficos más complejos con R, para generar mapas de Chile con polígonos y límites geográficamente correctos.

mapas ggplot2 gráficos ciencias sociales Chile

Temas de colores personalizados en apps Shiny

En este post muestro lo básico para personalizar la apariencia de tus aplicaciones Shiny con temas de colores personalizados usando el paquete {bslib}, y además cómo hacer que los gráficos {ggplot2} se ajusten automáticamente al tema usando {thematic}. Recuerda que una app con un diseño atractivo puede marcar la diferencia entre que alguien la use o no, o bien, que alguien la recuerde o no!

shiny

Infografía: Violaciones a los Derechos Humanos cometidas por la dictadura cívico-militar chilena

Infografía que recopila visualizaciones de datos acerca de los crímenes de lesa humanidad cometidos por el régimen dictatorial en Chile, entre entre 1973 y 1989. El objetivo es poder compartir información de forma pedagógica y clara, para que las nuevas generaciones puedan comprender la magnitud de las violaciones a los derechos humanos cometidas en ese período, y así contribuir a la memoria histórica del país.

apps Chile

Tipografías personalizadas en gráficos {ggplot2}

¿Quieres darle un toque personalizado a tus gráficos? O tal vez alinearlos mejor al mensaje que quieres entregar, o a los lineamientos estéticos de tu organización. En esta breve guía te explico cómo cambiar las tipografías, tipos de letra o fuentes de tus gráficos hechos en R con {ggplot2}, incluyendo la posibilidad de usar cientos de tipografías web gratuitas directamente desde Google Fonts.

visualización de datos ggplot2

Unir o cruzar datos con left_join()

Un left join realiza una unión o combinación entre dos tablas de datos a partir de una variable en común o clave (key). En otras palabras, un left join toma dos tablas que tienen datos distintos, pero que comparten una variable o columna en común, y usa esta variable en común para unir las observaciones de ambas tablas. En este tutorial explico a hacer left joins con frutas, animales, y uso irregular de licencias médicas.

procesamiento de datos limpieza de datos básico
16/8/2025

Echa un vistazo preliminar a tus datos con {visdat}

El paquete {visdat} tiene funciones para visualizar tus conjuntos de datos completos, para poder entenderlos de manera visual antes de proseguir con la limpieza o análisis. El paquete entrega varias funciones vis_x() para visualzar la tabla de datos entera, destacando distintos aspectos de la misma. En este post muestro ejemplos de uso de este paquete para encontrar datos perdidos, explorar datos, y más.

visualización de datos datos perdidos limpieza de datos consejos
8/8/2025

Crea planillas de Excel con formato personalizado desde R con {openxlsx}

El paquete {openxlsx} nos entrega funciones para generar archivos Excel desde R que contengan todo tipo de formato, estilo de tablas, y manipulación celda por celda del archivo resultante, con lo que podemos generar planillas de Excel atractivas desde R. La gracia es que podremos usar estas herramientas de forma reproducible (poder re-hacer gratis la planilla con datos actualizados o corregidos), y también podremos combinar la programación de R para crear estilos condicionales, crear cientos de archivos Excel, o planillas de cientos de hojas, y mucho más.

limpieza de datos procesamiento de datos automatización tablas Excel

Validación básica de datos con R

Si estás procesando muchos datos y/o datos que vienen de distintas fuentes con R, validarlos puede ayudarte a encontrar problemas antes de que sea tarde! ¿Qué es la validación de datos? Son las distintas pruebas que crearemos para confirmar que nuestros datos cumplen ciertos criterios. El objetivo es entregarnos la certeza de que nuestros datos son como esperamos luego de procesarlos. Para lograrlo, ponemos a prueba nuestros datos en distintos puntos de nuestros procesos de análisis de datos.

procesamiento de datos consejos automatización control de flujo funciones básico
7/8/2025