TRANSFORMACIÓN DE DATOS EN R
La transformación de datos comprende técnicas que permiten filtrar datos según condiciones específicas, segmentarlos en grupos más pequeños, ordenarlos de acuerdo con criterios definidos, resumirlos calculando sumas o promedios, y combinar diferentes conjuntos de datos en uno solo
R BASE
Con R base, se pueden realizar tareas de manipulación de datos sin depender de paquetes externos, ofreciendo un conjunto sólido de herramientas para trabajar con conjuntos de datos de manera eficiente, permitiendo realizar diversas operaciones como selección, filtrado, transformación y resumen de datos
Nombres de filas y columnas
rownames() colnames() dimnames()
Subset
subset() $ [] [[]]
Tablas de frecuencias absolutas/relativas y tablas de contingencia
table() prop.table() xtabs() addmargins()
Categorizar variables numéricas
cut()
Dividir datos
split() unsplit()
Resumir datos por grupo
aggregate()
Suma y media de filas y columnas
rowSums() colSums() rowMeans() colMeans()
Las funciones rbind() y cbind()
rbind() cbind()
Unir data frames
merge()
PAQUETE DPLYR
dplyr ofrece una sintaxis clara y concisa para realizar tareas comunes como filtrado, selección, agrupación y combinación de datos, siendo una alternativa más intuitiva y eficiente a las funciones de R base para operaciones de manipulación de datos
Seleccionar columnas con dplyr
select() contains() where() matches() starts_with() ends_with() all_of() any_of()
Filtrar filas con dplyr
filter() slice()
Ordenar filas con la función arrange() de dplyr
arrange() desc()
Renombrar columnas con la función rename() de dplyr
rename() rename_with()
Crear y modificar columnas con la función mutate() de dplyr
mutate() across()
Crea resúmenes estadísticos con la función summarise() de dplyr
summarise() group_by()