Test de Lilliefors para la normalidad en R

Estad铆stica con R Contrastes de hip贸tesis
Test de Lilliefors para la normalidad en R

La funci贸n lillie.test del paquete nortest se utiliza para realizar el test de Lilliefors, que es una versi贸n modificada del contraste de normalidad de Kolmogorov-Smirnov.

El test de Lilliefors, a pesar de ser una prueba conservadora, se recomienda para muestras de peque帽o tama帽o. V茅ase tambi茅n la prueba de normalidad de Shapiro Wilk.

Hip贸tesis

El contraste de Lilliefors es una variante de la prueba de Kolmogorov-Smirnov dise帽ada espec铆ficamente para comprobar la normalidad. Eval煤a si los datos proceden de una distribuci贸n normal comparando la funci贸n de distribuci贸n emp铆rica de los datos con la funci贸n de distribuci贸n acumulativa normal esperada.

La hip贸tesis nula de esta prueba es que la distribuci贸n de la poblaci贸n es normal, mientras que la hip贸tesis alternativa es que la distribuci贸n de la poblaci贸n no es normal:

  • \(H_0\): la distribuci贸n de la poblaci贸n ES normal.
  • \(H_1\): la distribuci贸n de la poblaci贸n NO ES normal.

Ejemplos e interpretaci贸n

Datos normales

Para este ejemplo, vamos a generar un conjunto de datos de muestra extra铆dos de una distribuci贸n normal. Los datos pueden examinarse visualmente mediante un histograma o un gr谩fico Q-Q para evaluar su normalidad:

# Datos de ejemplo
set.seed(17)
x <- rnorm(20)

# Dos columnas y una fila
par(mfrow = c(1, 2))

# Histograma y densidad
hist(x, freq = FALSE, col = "white")
lines(density(x), lwd = 2, col = "red")

# QQ-plot
qqnorm(x, pch = 16, col = 4)
qqline(x, col = "red", lwd = 2)

Test de Lilliefors en R

Ahora, se puede realizar el contraste de Lilliefors con la funci贸n lillie.test del paquete nortest para evaluar si la distribuci贸n poblacional de la variable x sigue una distribuci贸n normal:

# Datos de ejemplo
set.seed(17)
x <- rnorm(20)

# install.packages("nortest")
library(nortest)

# 驴Sigue 'x' una distribuci贸n normal?
lillie.test(x)
	Lilliefors (Kolmogorov-Smirnov) normality test

data:  x
D = 0.098636, p-value = 0.8775

El p-valor de 0.8775 sugiere que no hay pruebas estad铆sticas significativas para rechazar la hip贸tesis nula, lo que indica que la poblaci贸n probablemente se ajusta a una distribuci贸n normal.

Datos no normales

En este ejemplo vamos a utilizar datos extra铆dos de una distribuci贸n exponencial para comprobar c贸mo funciona la prueba:

# Datos de ejemplo
set.seed(17)
x <- rexp(20)

# Dos columnas y una fila
par(mfrow = c(1, 2))

# Histograma y densidad
hist(x, freq = FALSE, col = "white")
lines(density(x), lwd = 2, col = "red")

# QQ-plot
qqnorm(x, pch = 16, col = 4)
qqline(x, col = "red", lwd = 2)

La funci贸n lillie.test en R del paquete nortest

Con una inspecci贸n visual de los datos es posible ver que los datos podr铆an no seguir una distribuci贸n normal. Para comprobarlo puede realizarse el test de Lilliefors:

# Datos de ejemplo
set.seed(17)
x <- rexp(20)

# install.packages("nortest")
library(nortest)

# 驴Sigue 'x' una distribuci贸n normal?
lillie.test(x)
	Lilliefors (Kolmogorov-Smirnov) normality test

data:  x
D = 0.28833, p-value = 0.0001262

En este caso, el p-valor es inferior a los niveles de significaci贸n habituales (0.1, 0.05 y 0.01), por lo que hay pruebas s贸lidas en contra de la hip贸tesis nula de que los datos provienen de una distribuci贸n normal.

El tama帽o m铆nimo de muestra admitido por la funci贸n lillie.test es 5.