MANIPULACIÓN DE DATOS CON R
Web scraping con rvest
Importar y exportar datos
Detección de patrones con grepl() y grep()
Manipulación de texto
Reemplazar patrones con gsub() y sub()
Manipulación de texto
Suma y media de filas y columnas
Transformación de datos
Nombres de filas y columnas
Transformación de datos
Concatenar textos con paste y paste0
Manipulación de texto
Contar el número de caracteres con nchar
Manipulación de texto
Leer bases de datos SQL
Importar y exportar datos
Función lapply
Familia apply
Leer Excel
Importar y exportar datos
Aggregate
Transformación de datos
Función merge
Transformación de datos
¿Qué es la MANIPULACIÓN DE DATOS?
La manipulación de datos, también conocida como data wrangling, se refiere al proceso de transformar y limpiar datos brutos en un formato estructurado adecuado para el análisis. Este proceso implica varias operaciones como filtrar, ordenar, agregar, combinar, remodelar y transformar datos para hacerlos más organizados, comprensibles y listos para el análisis. R proporciona varias funciones para realizar estas tareas, pero dplyr
es uno de los paquetes de R más populares y utilizados para la manipulación de datos.
-
R base
La manipulación de datos en R base implica el uso de las funciones y métodos básicos proporcionados por el paquete base de R para manejar, transformar y manipular estructuras de datos como vectores, matrices, arrays, data frames y listas. -
dplyr
dplyr
es un paquete de R diseñado para una manipulación de datos eficiente y fácil de usar. Proporciona un conjunto de funciones que agilizan las tareas de manipulación de datos ofreciendo una gramática coherente para manipular data frames y data tables.