Contenido
Análisis de supuestos
Pruebas de hipótesis
Pruebas de comparación: Prueba t – ANOVA - TOST
Pruebas de hipótesis
Pruebas de una cola (unilateral)
Pruebas de dos colas (bilateral)
Hipótesis nula
Hipótesis alternativa
Prueba F:
La prueba F se utiliza cuando se desea evaluar si las varianzas de las dos poblaciones X y Y son estadísticamente iguales o diferentes.
Hipótesis:
Bajo Ho, el estadístico de prueba en este caso es:
Esta es una prueba a dos colas, donde se rechaza la Ho si Fcal > Ftab.
Programación:
Código en R:
A continuación se comparte el código en R para la prueba F:
#Cargar los datos
# x=datos con mayor varianza
#Información de cada muestra
var(x)
nx=length(x)
var(y)
ny=length(y)
#Elaboración de la prueba F - manual
alfa<-0.05
#F tabulado
Ftab=qf((1-(alfa/2)),nx-1,ny-1)
Ftab
#F calculado
Fcal=var(x)/var(y)
Fcal
#p-value
p_value<-2*(pf(var(y)/var(x),nx-1,ny-1))
p_value
#IC para la varianza
IC=c((1/qf((1-(alfa/2)),ny-1,nx-1))*(var(x)/var(y)),(1/qf((alfa/2),ny-1,nx-1))*(var(x)/var(y)))
IC
#Prueba F - codigo de R
var.test(x,y, conf.level = 1-alfa)
La prueba t - varianzas iguales se utiliza para comparar las medias de dos poblaciones donde se comprobado previamente que sus varianzas son estadísticamente iguales:
En este caso, se tiene que , por lo que se pueden plantear las siguientes hipótesis de interés para la media:
Para juzgar esta hipótesis, se utiliza el siguiente estadístico de prueba:
donde,
A continuación se comparte el código en R para la prueba t - varianzas iguales:
Comentarios:
Pasos:
1. Plantear las hipótesis: Para comparar dos grupos de datos, x y y, se pueden plantear las siguientes hipótesis de interés:
2. Ingresar los datos a R:
# Datos
x <- c(1.72, 1.88, 2.78, 2.04, 2.06, 2.86, 2.23, 1.37, 1.66, 1.78)
y <- c(3.61, 3.18, 3.20, 3.06, 2.72, 3.89, 3.25, 2.02, 3.35, 2.76)
nx <- length(x) # Número de datos de x
ny <- length(y) # Número de datos de y
3. Definir el alfa, hallar la varianza común y desviación común (pooled), como se muestra a continuación:
## Prueba t - varianzas iguales
alfa<-0.05
# Calculo de la varianza común:
sp2<-(((ny-1)*var(y)+(nx-1)*var(x))/(ny+nx-2))
sp2
# Calculo de la desviación común:
sp<-(((ny-1)*var(y)+(nx-1)*var(x))/(ny+nx-2))^(1/2)
sp
4. Estimar el t calculado y los grados de libertad:
#t calculado
tcal=(mean(x)-mean(y))/(sp*(((1/nx)+(1/nx))^(1/2)))
tcal
#grados de libertad
gl<-(ny+ny-2)
gl
5. Estimar el t tabulado:#t tabulado
ttab<-qt((1-(alfa/2)),gl)
ttab
6. Estimación de los intervalos de confianza:
#IC para la media
IC<-c((mean(x)-mean(y))-qt((1-(alfa/2)),gl)*(((var(y)/ny)+(var(x)/nx))^(1/2)), (mean(x)-mean(y))+qt((1-(alfa/2)),gl)*(((var(y)/ny)+(var(x)/nx))^(1/2)))
IC
7. Estimar el p-value:
#p-value
p_value<-(pt(tcal,gl))*2
p_value
Código en R
Éste código depende de la hipótesis alternativa planteada, es decir:
t.test(x,y,var.equal = T, conf.level = 1-alfa, alternative = "two.sided")
t.test(x,y,var.equal = T, conf.level = 1-alfa, alternative = "less")
t.test(x,y,var.equal = T, conf.level = 1-alfa, alternative = "greater")
***************
A continuación se encuentra el script en R para la prueba t - varianzas diferentes:
Comentarios:
Código en R - manual:
## 1. Plantear las hipótesis
# Si Ha:MUx ≠ MUy
# Si Ha:MUx < MUy
# Si Ha:MUx > MUy
## 2. Ingresar los datos a R, identificados como x y y e ingresar el número de datos de x y de y, así:
# Datos
x <- c(1.72, 1.88, 2.78, 2.04, 2.06, 2.86, 2.23, 1.37, 1.66, 1.78)
y <- c(3.61, 3.18, 3.20, 3.06, 2.72, 3.89, 3.25, 2.02, 3.35, 2.76)
nx <- length(x) # Número de datos de x
ny <- length(y) # Número de datos de y
##3. Definir el alfa, estimar el t calculado y los grados de libertad:
## Prueba t - varianzas iguales
alfa<-0.05
#t calculado
tcal=((mean(x)-mean(y))/(((var(y)/ny)+(var(x)/nx))^(1/2)))
tcal
#grados de libertad
gl<-(((var(y)/ny)+(var(x)/nx))^2)/((((var(y)/ny)^2)/(nx-1))+(((var(x)/nx)^2)/(nx-1)))
gl
##4. Estimar el t tabulado:#t tabulado
ttab<-qt((1-(alfa/2)),gl)
ttab
##5. Estimación de los intervalos de confianza:
#IC para la media
IC<-c((mean(x)-mean(y))-qt((1-(alfa/2)),gl)*(((var(y)/ny)+(var(x)/nx))^(1/2)), (mean(x)-mean(y))+qt((1-(alfa/2)),gl)*(((var(y)/ny)+(var(x)/nx))^(1/2)))
IC
##6. Estimar el p-value:
#p-value
p_value<-(pt(tcal,gl))*2
p_value
Código en R - directo
##Criterio de rechazo
# Si Ha:MUx ≠ MUy
t.test(x,y,var.equal = F, conf.level = 1-alfa, alternative = "two.sided")
# Si Ha:MUx < MUy
t.test(x,y,var.equal = F, conf.level = 1-alfa, alternative = "less")
# Si Ha:MUx > MUy
t.test(x,y,var.equal = F, conf.level = 1-alfa, alternative = "greater")