Farmacia y estadística

Inferencia Conceptos básicos de inferencia

Contenido

Análisis de supuestos
Pruebas de hipótesis
Pruebas de comparación: Prueba t – ANOVA - TOST
Pruebas de hipótesis
Pruebas de una cola (unilateral)
Pruebas de dos colas (bilateral)
Hipótesis nula
Hipótesis alternativa

Prueba F:

La prueba F se utiliza cuando se desea evaluar si las varianzas de las dos poblaciones X y Y son estadísticamente iguales o diferentes.

Hipótesis:

Bajo Ho, el estadístico de prueba en este caso es:

Esta es una prueba a dos colas, donde se rechaza la Ho si Fcal > Ftab.

Programación:

Código en R:

A continuación se comparte el código en R para la prueba F:

#Cargar los datos

# x=datos con mayor varianza

#Información de cada muestra var(x) nx=length(x) var(y) ny=length(y)

#Elaboración de la prueba F - manual alfa<-0.05

#F tabulado Ftab=qf((1-(alfa/2)),nx-1,ny-1) Ftab

#F calculado Fcal=var(x)/var(y) Fcal

#p-value p_value<-2*(pf(var(y)/var(x),nx-1,ny-1)) p_value

#IC para la varianza IC=c((1/qf((1-(alfa/2)),ny-1,nx-1))*(var(x)/var(y)),(1/qf((alfa/2),ny-1,nx-1))*(var(x)/var(y))) IC

#Prueba F - codigo de R var.test(x,y, conf.level = 1-alfa)

La prueba t - varianzas iguales se utiliza para comparar las medias de dos poblaciones donde se comprobado previamente que sus varianzas son estadísticamente iguales:

En este caso, se tiene que , por lo que se pueden plantear las siguientes hipótesis de interés para la media:

Para juzgar esta hipótesis, se utiliza el siguiente estadístico de prueba:

donde,

A continuación se comparte el código en R para la prueba t - varianzas iguales:

Comentarios:

Tener presente que antes de hacer una comparación de medias utilizando la prueba t, es necesario determinar si las varianzas son iguales o diferentes, a través de una prueba F.
Esta prueba se debe solo si las varianzas son iguales. En caso contrario, se debe realizar la prueba t - varianzas diferentes.

Pasos:

1. Plantear las hipótesis: Para comparar dos grupos de datos, x y y, se pueden plantear las siguientes hipótesis de interés:

2. Ingresar los datos a R:

# Datos x <- c(1.72, 1.88, 2.78, 2.04, 2.06, 2.86, 2.23, 1.37, 1.66, 1.78) y <- c(3.61, 3.18, 3.20, 3.06, 2.72, 3.89, 3.25, 2.02, 3.35, 2.76) nx <- length(x) # Número de datos de x ny <- length(y) # Número de datos de y

3. Definir el alfa, hallar la varianza común y desviación común (pooled), como se muestra a continuación:

## Prueba t - varianzas iguales alfa<-0.05 # Calculo de la varianza común: sp2<-(((ny-1)*var(y)+(nx-1)*var(x))/(ny+nx-2)) sp2 # Calculo de la desviación común: sp<-(((ny-1)*var(y)+(nx-1)*var(x))/(ny+nx-2))^(1/2) sp

4. Estimar el t calculado y los grados de libertad:

#t calculado tcal=(mean(x)-mean(y))/(sp*(((1/nx)+(1/nx))^(1/2))) tcal #grados de libertad gl<-(ny+ny-2) gl

5. Estimar el t tabulado:#t tabulado ttab<-qt((1-(alfa/2)),gl) ttab

6. Estimación de los intervalos de confianza:

#IC para la media IC<-c((mean(x)-mean(y))-qt((1-(alfa/2)),gl)*(((var(y)/ny)+(var(x)/nx))^(1/2)), (mean(x)-mean(y))+qt((1-(alfa/2)),gl)*(((var(y)/ny)+(var(x)/nx))^(1/2))) IC

7. Estimar el p-value:

#p-value p_value<-(pt(tcal,gl))*2 p_value

Código en R

Éste código depende de la hipótesis alternativa planteada, es decir:

t.test(x,y,var.equal = T, conf.level = 1-alfa, alternative = "two.sided")

t.test(x,y,var.equal = T, conf.level = 1-alfa, alternative = "less")

t.test(x,y,var.equal = T, conf.level = 1-alfa, alternative = "greater")

***************

A continuación se encuentra el script en R para la prueba t - varianzas diferentes:

Comentarios:

Tener presente que antes de hacer una comparación de medias utilizando la prueba t, es necesario determinar si las varianzas son iguales o diferentes, a través de una prueba F.
Si las varianzas son diferentes, la prueba que se describe a continuación es la que debe realizar, pero si las varianzas son iguales, se debe realizar la prueba t - varianzas iguales.

Código en R - manual:

## 1. Plantear las hipótesis

# Si Ha:MUx ≠ MUy # Si Ha:MUx < MUy # Si Ha:MUx > MUy

## 2. Ingresar los datos a R, identificados como x y y e ingresar el número de datos de x y de y, así:

# Datos

x <- c(1.72, 1.88, 2.78, 2.04, 2.06, 2.86, 2.23, 1.37, 1.66, 1.78) y <- c(3.61, 3.18, 3.20, 3.06, 2.72, 3.89, 3.25, 2.02, 3.35, 2.76) nx <- length(x) # Número de datos de x ny <- length(y) # Número de datos de y

##3. Definir el alfa, estimar el t calculado y los grados de libertad:

## Prueba t - varianzas iguales alfa<-0.05
#t calculado tcal=((mean(x)-mean(y))/(((var(y)/ny)+(var(x)/nx))^(1/2))) tcal #grados de libertad gl<-(((var(y)/ny)+(var(x)/nx))^2)/((((var(y)/ny)^2)/(nx-1))+(((var(x)/nx)^2)/(nx-1))) gl

##4. Estimar el t tabulado:#t tabulado ttab<-qt((1-(alfa/2)),gl) ttab

##5. Estimación de los intervalos de confianza:

#IC para la media IC<-c((mean(x)-mean(y))-qt((1-(alfa/2)),gl)*(((var(y)/ny)+(var(x)/nx))^(1/2)), (mean(x)-mean(y))+qt((1-(alfa/2)),gl)*(((var(y)/ny)+(var(x)/nx))^(1/2))) IC

##6. Estimar el p-value:

#p-value p_value<-(pt(tcal,gl))*2 p_value

Código en R - directo

##Criterio de rechazo # Si Ha:MUx ≠ MUy t.test(x,y,var.equal = F, conf.level = 1-alfa, alternative = "two.sided")

# Si Ha:MUx < MUy t.test(x,y,var.equal = F, conf.level = 1-alfa, alternative = "less")

# Si Ha:MUx > MUy t.test(x,y,var.equal = F, conf.level = 1-alfa, alternative = "greater")

Contenido_inferencia