MANIPULACIÓN DE DATOS CON R

Seleccionar columnas con dplyr
dplyr

Filtrar filas con dplyr
dplyr

Ordenar filas con la función arrange() de dplyr
dplyr

Renombrar columnas con la función rename() de dplyr
dplyr

Crear y modificar columnas con la función mutate() de dplyr
dplyr

Crea resúmenes estadísticos con la función summarise() de dplyr
dplyr

Tablas con table() y prop.table()
Transformación de datos

Eliminar espacios en blanco con trimws()
Manipulación de texto

Mayúsculas y minúsculas con tolower() y toupper()
Manipulación de texto

Extraer y reemplazar subcadenas con substring() y substr()
Manipulación de texto

Dividir cadenas de texto con strsplit()
Manipulación de texto

Las funciones rbind() y cbind()
Transformación de datos
¿Qué es la MANIPULACIÓN DE DATOS?
La manipulación de datos, también conocida como data wrangling, se refiere al proceso de transformar y limpiar datos brutos en un formato estructurado adecuado para el análisis. Este proceso implica varias operaciones como filtrar, ordenar, agregar, combinar, remodelar y transformar datos para hacerlos más organizados, comprensibles y listos para el análisis. R proporciona varias funciones para realizar estas tareas, pero dplyr
es uno de los paquetes de R más populares y utilizados para la manipulación de datos.
-
R base
La manipulación de datos en R base implica el uso de las funciones y métodos básicos proporcionados por el paquete base de R para manejar, transformar y manipular estructuras de datos como vectores, matrices, arrays, data frames y listas. -
dplyr
dplyr
es un paquete de R diseñado para una manipulación de datos eficiente y fácil de usar. Proporciona un conjunto de funciones que agilizan las tareas de manipulación de datos ofreciendo una gramática coherente para manipular data frames y data tables.