Gráfico de puntos en R

Un diagrama de puntos o gráfico de puntos es similar a un diagrama de dispersión. La principal diferencia es que el gráfico de puntos en R muestra el índice (cada categoría) en el eje vertical y el valor correspondiente en el eje horizontal, por lo que puedes ver el valor de cada observación siguiendo una línea horizontal desde la etiqueta correspondiente.
El gráfico de puntos en R se puede utilizar como alternativa a los gráficos de barras horizontales. Además, puedes etiquetar los puntos correspondientes en el eje vertical en diferentes grupos e incluso ordenarlos en función de alguna variable.
Ten en cuenta que hay varios tipos de gráficos de puntos. En este tutorial mostraremos cómo crear dot plots de Cleveland y de Dumbbell.
La función dotchart
La función dotchart
permite crear un diagrama de puntos de Cleveland en R. Considera el siguiente conjunto de datos, que representa las ventas esperadas y reales de una empresa para cada mes.
Puedes crear un gráfico de puntos en R de la variable vendido
pasándola a la función dotchart
. También puedes etiquetar cada observación con el argumento labels
y especificar argumentos adicionales, como el símbolo, el tamaño del símbolo o el color del símbolo con los argumentos, pch
, bg
y pt.cex
, respectivamente.
Gráfico de puntos por grupo en R
Si tienes una variable que clasifique los datos en grupos, puedes separar el gráfico de puntos en esos grupos, pasándolos al argumento labels
. También puedes especificar colores para cada grupo si así lo deseas, especificándolos en el argumento color
.
Ordenar el gráfico de puntos por una variable
Además, puedes ordenar un dotchart en R por una variable si previamente ordenas los datos. Para ello puedes escribir:
Gráfico de dumbbell en R
A veces resulta interesante crear un gráfico de puntos con dos variables, que representen los valores mínimos y máximos de algunos eventos o el cambio de algunas observaciones en el tiempo.
En nuestro ejemplo, podría ser interesante representar las variables vendido
y esperado
juntas, para analizar la diferencia entre las ventas esperadas y las reales. Este tipo de gráficos de puntos se conocen como gráficos de Dumbbell.
También puedes agregar segmentos y textos para etiquetar los puntos de la siguiente manera:
Sin embargo, lo anterior no es fácil de manejar y no se puede usar cuando especificas grupos. Como no existe ninguna alternativa gráfica en R que permita esta funcionalidad, hemos desarrollado la función dumbbell
, que funciona con datos agrupados y no agrupados. Los argumentos permiten especificar si quieres agregar los segmentos, el texto, ambos o solo los puntos y además personalizar el diagrama a tu gusto con argumentos adicionales.
Con esta función puedes crear varias combinaciones. Considera el ejemplo donde quieres mostrar la comparación entre ventas reales (azul) y ventas esperadas (negro) para cada mes. Para ello podrías escribir lo siguiente:
Ahora, si prefieres dividir los datos en grupos y también agregar textos con cada valor, puedes escribir:
Además, si quieres agregar colores para cada grupo, puedes usar el argumento colv1
.
Finalmente, como hicimos en la sección anterior, también puedes ordenar los datos para alguna variable:
Observa que los puntos negros están ordenados en orden creciente.