Test para proporciones con prop.test()
La función prop.test
de R se utiliza para probar la hipótesis nula de que las proporciones de dos variables aleatorias independientes \(X\) y \(Y\) son iguales (prueba de proporción de dos muestras) o para examinar una única proporción frente a un valor hipotético (prueba de proporción de una muestra).
Sintaxis
La sintaxis de la función prop.test
es la siguiente:
prop.test(x, n, p = NULL,
alternative = c("two.sided", "less", "greater"),
conf.level = 0.95, correct = TRUE)
Siendo:
x
: Un vector numérico o una matriz de dos columnas. En el caso del vector, representa el número de aciertos; en el caso de la matriz, la primera columna indica el número de aciertos y la segunda, el número de fallos.n
: El número de ensayos para cada proporción.p
: Un vector de probabilidades o un único valor de probabilidad bajo la hipótesis nula. Si no se especifica esp = 0.5
.alternative
: Especifica la hipótesis alternativa. Los posibles valores son:"two.sided"
,"less"
, o"greater"
.conf.level
: Nivel de confianza para el intervalo de confianza devuelto. El valor predeterminado es 0.95.correct
: Valor lógico que indica si se aplica la corrección de continuidad de Yates. Por defecto esTRUE
.
La función devuelve el estadístico Chi-cuadrado, los grados de libertad, el p-valor, la hipótesis alternativa, el intervalo de confianza y la estimación muestral de la proporción.
Test para una proporción
El test de proporción para una muestra compara una proporción muestral con una proporción poblacional conocida o una proporción hipotética.
Si el tamaño de la muestra es pequeño (n < 30) utiliza binom.test
en lugar de prop.test
para calcular un test exacto.
Por defecto, la función prop.test
aplica la corrección de continuidad de Yates cuando es posible. Esta corrección se aplica a la prueba Chi-cuadrado cuando las frecuencias esperadas son inferiores a 5 en tablas 2x2. Si no quieres aplicar esta corrección, establece correct = FALSE
.
Igual a una proporción
Considera las siguientes hipótesis nula y alternativa:
- \(H_0\): la proporción de X ES \(p\).
- \(H_1\): la proporción de X NO ES \(p\).
Para realizar esta prueba deberás especificar el número de aciertos con x
, el número de ensayos con n
y la proporción hipotética con p
. El nivel de confianza por defecto para el intervalo de confianza es del 95%.
# Contraste de hipótesis para una proporción
# 107 ensayos, 42 éxitos. ¿Es la proporción igual a 0.6 para un nivel de confianza del 95%?
prop.test(x = 42, n = 107, p = 0.6, conf.level = 0.95)
# Equivale a introducir una matriz de dos columnas con el número de aciertos (42) y fallos (65)
# prop.test(x = matrix(c(42, 65), ncol = 2), p = 0.6, conf.level = 0.95)
1-sample proportions test with continuity correction
data: 42 out of 107, null probability 0.6
X-squared = 18.337, df = 1, p-value = 1.851e-05
alternative hypothesis: true p is not equal to 0.6
95 percent confidence interval:
0.3009435 0.4919223
sample estimates:
p
0.3925234
El p-valor obtenido (1.851e-05) es mucho menor que los niveles de significación habituales, lo que indica una fuerte evidencia en contra de la hipótesis nula de que la verdadera proporción es igual a 0.6. Por lo tanto, podemos concluir que la verdadera proporción de éxito es significativamente diferente de 0.6. Además, el límite superior del intervalo de confianza (0.4919223) es menor que la proporción hipotética (0.6).
Menor que una proporción
También puedes realizar una test en el que la hipótesis alternativa sea que la proporción es inferior a un valor específico:
- \(H_0\): la proporción de X ES \(p\).
- \(H_1\): la proporción de X ES MENOR que \(p\).
# Contraste de hipótesis para una proporción
# 107 ensayos, 42 éxitos. ¿Es la proporción menor que 0.6?
prop.test(x = 42, n = 107, p = 0.6, alternative = "less")
1-sample proportions test with continuity correction
data: 42 out of 107, null probability 0.6
X-squared = 18.337, df = 1, p-value = 9.255e-06
alternative hypothesis: true p is less than 0.6
95 percent confidence interval:
0.0000000 0.4766163
sample estimates:
p
0.3925234
El p-valor es casi cero, lo que implica que hay pruebas sólidas contra la hipótesis nula. En consecuencia, rechazaríamos la hipótesis nula a favor de la alternativa, concluyendo que la verdadera proporción de éxito es significativamente inferior a 0.6. Además, es importante señalar que el límite superior del intervalo de confianza (0.4766163) cae por debajo de la proporción de la hipótesis nula de 0.6.
Mayor que una proporción
La última opción para una test de proporción para una muestra es examinar si la proporción verdadera es mayor que el valor especificado para la hipótesis alternativa.
- \(H_0\): la proporción de X ES \(p\).
- \(H_1\): la proporción de X ES MAYOR que \(p\).
# Contraste de hipótesis para una proporción
# 107 ensayos, 42 éxitos. ¿Es la proporción mayor que 0.6?
prop.test(x = 42, n = 107, p = 0.6, alternative = "greater")
1-sample proportions test with continuity correction
data: 42 out of 107, null probability 0.6
X-squared = 18.337, df = 1, p-value = 1
alternative hypothesis: true p is greater than 0.6
95 percent confidence interval:
0.3140465 1.0000000
sample estimates:
p
0.3925234
El contraste arroja un p-valor de 1, lo que indica que no hay pruebas para rechazar la hipótesis nula de que la proporción verdadera es \(p\).
Test para dos proporciones (diferencia de proporciones)
El contraste de proporciones para dos muestras compara proporciones entre dos grupos independientes. Evalúa si las proporciones de estos grupos difieren significativamente entre sí.
Igualdad de proporciones
Considera las siguientes hipótesis nula y alternativa:
- \(H_0\): la proporción de X ES igual a la proporción de \(Y\). (O la diferencia de proporciones es 0)
- \(H_1\): la proporción de X ES DISTINTA a la proporción de \(Y\).
Puedes realizar un contraste de proporciones para dos muestras del siguiente modo:
# X
p1 <- 50 # Éxitos
n1 <- 100 # Pruebas
# Y
p2 <- 80 # Éxitos
n2 <- 200 # Pruebas
# ¿Es la proporción de X igual a la proporción de Y?
prop.test(c(p1, p2), n = c(n1, n2))
2-sample test for equality of proportions with continuity correction
data: c(p1, p2) out of c(n1, n2)
X-squared = 2.323, df = 1, p-value = 0.1275
alternative hypothesis: two.sided
95 percent confidence interval:
-0.02671995 0.22671995
sample estimates:
prop 1 prop 2
0.5 0.4
El p-valor es superior a los niveles de significación habituales, por lo que no tenemos pruebas estadísticas suficientes para rechazar la hipótesis nula, es decir, no hay pruebas que sugieran proporciones diferentes entre los grupos.
Menor
También se puede realizar un contraste en el que la hipótesis alternativa sea que la proporción de \(X\) es menor que la proporción de \(Y\), esto es:
- \(H_0\): la proporción de X ES igual a la proporción de \(Y\).
- \(H_1\): la proporción de X ES MENOR que la proporción de \(Y\).
Para realizar este test tendrás que especificar alternative = "less"
, como se muestra a continuación:
# X
p1 <- 50 # Éxitos
n1 <- 100 # Pruebas
# Y
p2 <- 150 # Éxitos
n2 <- 200 # Pruebas
# ¿Es la proporción de X menor que la proporción de Y?
prop.test(c(p1, p2), n = c(n1, n2), alternative = "less")
2-sample test for equality of proportions with continuity correction
data: c(p1, p2) out of c(n1, n2)
X-squared = 17.642, df = 1, p-value = 1.333e-05
alternative hypothesis: less
95 percent confidence interval:
-1.0000000 -0.1460619
sample estimates:
prop 1 prop 2
0.50 0.75
El p-valor es 1.333e-05, cercano a cero, lo que implica que hay pruebas estadísticas para rechazar la hipótesis nula y apoyar la hipótesis alternativa de que la proporción de \(X\) es menor que la proporción de \(Y\). Además, el intervalo de confianza del 95 por ciento oscila entre -1 y -0.1460619, y como no contiene a 0, sugiere que la verdadera diferencia entre las proporciones es significativamente menor que cero.
Mayor
La última alternativa posible es que la hipótesis alternativa sea que la proporción de \(X\) es mayor que la proporción de \(Y\):
- \(H_0\): la proporción de X ES igual a la proporción de \(Y\).
- \(H_1\): la proporción de X ES MAYOR que la proporción de \(Y\).
Para realizar este contraste de hipótesis tendrás que establecer alternative = "greater"
, tal y como se muestra en el siguiente ejemplo:
# X
p1 <- 50 # Éxitos
n1 <- 100 # Pruebas
# Y
p2 <- 150 # Éxitos
n2 <- 200 # Pruebas
# ¿Es la proporción de X mayor que la proporción de Y?
prop.test(c(p1, p2), n = c(n1, n2), alternative = "greater")
2-sample test for equality of proportions with continuity correction
data: c(p1, p2) out of c(n1, n2)
X-squared = 17.642, df = 1, p-value = 1
alternative hypothesis: greater
95 percent confidence interval:
-0.3539381 1.0000000
sample estimates:
prop 1 prop 2
0.50 0.75
En este caso, el p-valor es 1, lo que implica que no hay pruebas que apoyen la afirmación de que la proporción en el primer grupo (\(X\)) es significativamente mayor que la del segundo grupo (\(Y\)).