Tips para limpieza de datos en R
Algunos de los paquetes y funciones que uso frecuentemente al momento de limpiar datos en R.
Algunos de los paquetes y funciones que uso frecuentemente al momento de limpiar datos en R.
Cuando trabajo con R, siempre intento dejar comentarios sobre de las cosas que estoy haciendo, tanto antes como después de cada bloque de código. Así, le hago un favor a mi yo del futuro, dejando una cierta documentación de las cosas que estuve haciendo, los objetivos que tenía, y otras aclaraciones sobre los procesos realizados.
A esta combinación de bloques de código y párrafos de textos se le llama programación literaria, o literate programming.
Para comparar el rendimiento de distintas expresiones en R, realizamos un benchmark, al cual le entregamos las expresiones que queremos comparar, y nos entregará un detalle de su velocidad de ejecución. Así podemos optar por una de las operaciones en base a su mejor rendimiento.
¿Tienes que hacer un loop, pero se detiene porque hay un error en uno de los pasos? Usa try()
para que la ejecución no se detenga, o tryCatch()
para atrapar el error y devolver algo distinto, como un mensaje y un return(NULL) para que no afecte el resultado.
Si tienes que trabajar con bases de datos muy grandes, puedes acelerar el cálculo usando todos los procesadores de tu computador con tan sólo un par de líneas, usando {purrr}
y {furrr}
.