Cuantiles en R

Considerando un valor , siendo , el cuantil de orden es el valor que deja una proporción de los datos por debajo () y el resto por encima de ese valor. Observa que los cuantiles son la generalización de la mediana, que es el cuantil para . En R, se puede hacer uso de la función quantile
para calcular cualquier cuantil de cualquier vector numérico.
Sintaxis
La función quantile
calcula los cuantiles muestrales de un vector numérico (x
). Por defecto, esta función calcula los cuartiles especificados dentro de probs
, pero también puedes introducir cualquier otra probabilidad para calcular cualquier percentil.
Cuartiles
Los cuartiles son cuantiles de orden 0.25, 0.5 y 0.75 y dividen la muestra en cuatro partes con la misma frecuencia. Normalmente, los cuartiles se denotan por , y .
Recuerda que el cuartil 0.5 es igual a la mediana:
Ten en cuenta que puedes eliminar los atributos de nombre de la salida pasando names = FALSE
a la función.
Eliminar datos faltantes
Si tu vector numérico contiene datos faltantes no podrás calcular los cuantiles. Para solucionarlo necesitarás establecer na.rm = TRUE
para eliminar los valores perdidos antes del cálculo.
Algoritmos para estimar cuantiles
El cálculo de los cuantiles se basa en uno de los nueve algoritmos discutidos en Hyndman y Fan (1996). Por defecto, se utiliza el séptimo algoritmo, pero puedes seleccionar otro pasando un entero entre 1 y 9 a type
. Lee la referencia anterior para más información sobre cada algoritmo.
Representación visual
Es importante tener en cuenta que se puedes utilizar un diagrama de caja y bigotes para visualizar los cuartiles, pero el método utilizado dentro de la función boxplot
no es el mismo que el utilizado dentro de quartile
, por lo que la salida puede variar ligeramente.
Deciles
Los deciles son cuantiles de orden 0.1, 0.2, …, 0.9 y dividen la muestra en 10 partes de igual frecuencia. Para calcularlos, puedes introducir una secuencia de 0 a 1 con paso 0.1 en probs
, como se muestra en el siguiente ejemplo.
Percentiles
Los percentiles son cuantiles del orden 0.01, 0.02, … , 0.99 y dividen la muestra en 100 partes de igual frecuencia. Si quieres calcular los percentiles de un vector numérico tendrás que especificar una secuencia de 0 a 1 con paso 0.01 dentro de probs
.