MANIPULACIÓN DE DATOS CON R

¿Qué es la MANIPULACIÓN DE DATOS?

La manipulación de datos, también conocida como data wrangling, se refiere al proceso de transformar y limpiar datos brutos en un formato estructurado adecuado para el análisis. Este proceso implica varias operaciones como filtrar, ordenar, agregar, combinar, remodelar y transformar datos para hacerlos más organizados, comprensibles y listos para el análisis. R proporciona varias funciones para realizar estas tareas, pero dplyr es uno de los paquetes de R más populares y utilizados para la manipulación de datos.

  1. R base

    La manipulación de datos en R base implica el uso de las funciones y métodos básicos proporcionados por el paquete base de R para manejar, transformar y manipular estructuras de datos como vectores, matrices, arrays, data frames y listas.
  2. dplyr

    dplyr es un paquete de R diseñado para una manipulación de datos eficiente y fácil de usar. Proporciona un conjunto de funciones que agilizan las tareas de manipulación de datos ofreciendo una gramática coherente para manipular data frames y data tables.