Ejercicio tomado de: MONTGOMERY D. C. Design and analysis of Experiments. 2013. Octava edición. John Wiley Sons, Inc. Capítulo 6, ejercicio 6.1. Pág. 292
Nota aclaratoria: La solución presentada a continuación es una propuesta de respuesta al ejercicio en mención y no representa la respuesta oficial del autor del ejercicio. Esta solución se proporciona con fines académicos y se recomienda su uso como referencia o punto de partida según las necesidades específicas del lector.
Un ingeniero está interesado en los efectos del corte (FACTOR A - CORTE), la geometría de la herramienta (FACTOR B - GEO_HER) y el ángulo de corte (FACTOR C - ANG_COR) sobre la vida útil (en horas) de una máquina. Se eligen dos niveles por cada factor y se realizan tres réplicas de un diseño factorial de 2 a la 3. Los resultados son los siguientes:
TRAT CORTE GEO_HER ANG_COR REP RTA
l -1 -1 -1 R1 22
a 1 -1 -1 R1 32
b -1 1 -1 R1 35
ab 1 1 -1 R1 55
c -1 -1 1 R1 44
ac 1 -1 1 R1 40
bc -1 1 1 R1 60
abc 1 1 1 R1 39
l -1 -1 -1 R2 31
a 1 -1 -1 R2 43
b -1 1 -1 R2 34
ab 1 1 -1 R2 47
c -1 -1 1 R2 45
ac 1 -1 1 R2 37
bc -1 1 1 R2 50
abc 1 1 1 R2 41
l -1 -1 -1 R3 25
a 1 -1 -1 R3 29
b -1 1 -1 R3 50
ab 1 1 -1 R3 46
c -1 -1 1 R3 38
ac 1 -1 1 R3 36
bc -1 1 1 R3 54
abc 1 1 1 R3 47
(a) Estimar los efectos de los factores. ¿Qué efectos parecen ser grandes?
Para estimar los efectos, se debe determinar el modelo de regresión lineal a partir del siguiente modelo:
Se obtiene:
Los factores que presentan mayor efecto en la variable respuesta son, en su orden:
- La interacción entre los factores A y C (-4.4167
)
- El efecto principal del factor B (5.6667
)
- El efecto principal del factor C (3.4167
)
Se debe dar prioridad a las interacciones frente a los efectos de los factores individuales. Por lo tanto, en este caso, se le da prioridad a la interacción entre los factores A y C, seguido del efecto principal del factor B. Por lo mencionado anteriormente, no se tiene en cuenta el factor del efecto principal C.
Código en R
> MOD2<-lm(RTA~FACT_A*FACT_B*FACT_C, data = datos)
> summary(MOD2)
Call:
lm.default(formula = RTA ~ FACT_A * FACT_B * FACT_C, data = datos)
Residuals:
Min 1Q Median 3Q Max
-5.667 -3.500 -1.167 3.167 10.333
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 40.8333 1.1211 36.421 < 2e-16 ***
FACT_A 0.1667 1.1211 0.149 0.883680
FACT_B 5.6667 1.1211 5.054 0.000117 ***
FACT_C 3.4167 1.1211 3.048 0.007679 **
FACT_A:FACT_B -0.8333 1.1211 -0.743 0.468078
FACT_A:FACT_C -4.4167 1.1211 -3.939 0.001172 **
FACT_B:FACT_C -1.4167 1.1211 -1.264 0.224475
FACT_A:FACT_B:FACT_C -1.0833 1.1211 -0.966 0.348282
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 5.492 on 16 degrees of freedom
Multiple R-squared: 0.7696, Adjusted R-squared: 0.6689
F-statistic: 7.637 on 7 and 16 DF, p-value: 0.0003977
# Gráfica de efectos
> par(mfrow=c(1,1))
> barplot(MOD2$coefficients, names.arg = nombres, horiz = TRUE, xlim=c(-10,50), xlab = "EFECTO", ylab = "FACTORES", main = "EFECTO DE CADA FACTOR", col=3)
> text(MOD2$coefficients, 1:length(MOD2$coefficients), labels = nombres, pos = 4, col = "black")
(b) Utiliza el análisis de varianza para confirmar tus conclusiones de la parte (a).
De acuerdo con el modelo panteado anteriormente, se construye el ANOVA, así:
Código en R
> MOD1<-aov(RTA~FACT_A*FACT_B*FACT_C, data = datos)
> summary(MOD1)
Df Sum Sq Mean Sq F value Pr(>F)
FACT_A 1 0.7 0.7 0.022 0.883680
FACT_B 1 770.7 770.7 25.547 0.000117 ***
FACT_C 1 280.2 280.2 9.287 0.007679 **
FACT_A:FACT_B 1 16.7 16.7 0.552 0.468078
FACT_A:FACT_C 1 468.2 468.2 15.519 0.001172 **
FACT_B:FACT_C 1 48.2 48.2 1.597 0.224475
FACT_A:FACT_B:FACT_C 1 28.2 28.2 0.934 0.348282
Residuals 16 482.7 30.2
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Se confirma que los factores que presentan un efecto estadísticamente significativo en la variable respuesta son la interacción entre los factores A y C, seguido de los efectos principales de los factores B y C. Nuevamente, en este caso, se le da prioridad a la interacción entre los factores A y C, y al efecto individual del factor B.
(c) Escriba un modelo de regresión para predecir la vida útil de la herramienta (en horas) basándose en los resultados de este experimento.
De acuerdo con el ANOVA se observa que hay varios efectos que no son significativos para la variable respuesta evaluada, sin embargo, no se hace ninguna modificación al modelo inicialmente planteado.
(d) Analiza los residuos. ¿Hay algún problema evidente?
En la gráfica de Residuals vs Fitted no se observa ningún patrón característico en los datos, lo que indica que los experimentos fueron realizados aleatoriamente.
En la gráfica Normal QQ, se observa que los residuos estandarizados se adhieren a la línea diagonal, sin embargo, son más los que estan por fuera, sobretodo en las colas.
En la gráfica de Scale-location, no se observa ningún patrón, lo que indica que las observaciones se realizaron de manera independiente.
Para todos los casos, se observan como posibles datos atípicos: 4, 10 y 19.
De acuerdo con el histograma de los residuales estandarizados, no se observa una tendencia propiamente normal. Así mismo, en el Boxplot de los residuales estandarizados, se observa un sesgo relevante.
Ahora, se realizan diferentes test estadísticos, para concluir apropiadamente:
Shapiro-Wilk normality test W = 0.92106, p-value = 0.06166
Anderson-Darling normality test A = 0.67378, p-value = 0.06863
Cramer-von Mises normality test W = 0.11576, p-value = 0.06352
Bartlett test of homogeneity of variances Bartlett's K-squared = 4.0801, df = 7 p-value = 0.7705
De acuerdo con los test realizados, los residuales estandarizados si presentan una distribución normal. También presentan homocedasticidad. Por lo tanto, si se puede confiar en los resultados encontrados en el ANOVA, es decir, se confirma que los factores que presentan un efecto estadísticamente significativo en la variable respuesta son la interacción entre los factores A y C, seguido de los efectos principales de los factores B y C. Nuevamente, en este caso, se le da prioridad a la interacción entre los factores A y C. El factor B presentó significancia, pero ninguna de sus interacciones es significativa, por lo que también debe ser tenido en cuenta a la hora de establecer las mejores condiciones de operación de la máquina.
(e) Sobre la base de un análisis de los gráficos de efectos principales e interacciones, ¿qué niveles codificados de los factores A, B y C recomienda usar?
Teniendo en cuenta que la interacción entre los factores A y C, es significativa y que lo deseable es establecer las condiciones para tener una mayor vida útil de la máquina, se recomienda operar la maquina en el factor A (nivel bajo) conjuntamente con el factor C (nivel alto). Adicionalmente, la maquina se debe operar en el factor B (nivel alto).
Condiciones de operación de la máquina para tener una mayor vida útil:
FACT_A: Corte – Nivel bajo.
FACT_B: Geometría de la herramienta – Nivel alto.
FACT_C: Ángulo de corte – Nivel alto.
Referencias:
(1) MONTGOMERY D. C. Design and analysis of Experiments. 2013. Octava edición. John Wiley Sons, Inc. Capítulo 6, ejercicio 6.1. Pág. 292.