MANIPULACIÓN DE DATOS CON R
Seleccionar columnas con dplyr
dplyr
Filtrar filas con dplyr
dplyr
Ordenar filas con la función arrange() de dplyr
dplyr
Renombrar columnas con la función rename() de dplyr
dplyr
Crear y modificar columnas con la función mutate() de dplyr
dplyr
Crea resúmenes estadísticos con la función summarise() de dplyr
dplyr
Tablas con table() y prop.table()
Transformación de datos
Eliminar espacios en blanco con trimws()
Manipulación de texto
Mayúsculas y minúsculas con tolower() y toupper()
Manipulación de texto
Extraer y reemplazar subcadenas con substring() y substr()
Manipulación de texto
Dividir cadenas de texto con strsplit()
Manipulación de texto
Las funciones rbind() y cbind()
Transformación de datos
¿Qué es la MANIPULACIÓN DE DATOS?
La manipulación de datos, también conocida como data wrangling, se refiere al proceso de transformar y limpiar datos brutos en un formato estructurado adecuado para el análisis. Este proceso implica varias operaciones como filtrar, ordenar, agregar, combinar, remodelar y transformar datos para hacerlos más organizados, comprensibles y listos para el análisis. R proporciona varias funciones para realizar estas tareas, pero dplyr
es uno de los paquetes de R más populares y utilizados para la manipulación de datos.
-
R base
La manipulación de datos en R base implica el uso de las funciones y métodos básicos proporcionados por el paquete base de R para manejar, transformar y manipular estructuras de datos como vectores, matrices, arrays, data frames y listas. -
dplyr
dplyr
es un paquete de R diseñado para una manipulación de datos eficiente y fácil de usar. Proporciona un conjunto de funciones que agilizan las tareas de manipulación de datos ofreciendo una gramática coherente para manipular data frames y data tables.