La inferencia estadística permite extraer conclusiones a partir de datos experimentales. Es el método y conjunto de técnicas que se utilizan para obtener conclusiones que sobrepasan los límites de los conocimientos aportados por la muestra. En otras palabras, busca obtener información sobre un colectivo o población mediante un metódico procedimiento de los datos de una muestra tomada del colectivo o de la población.
En cualquier procedimiento de inferencia, siempre existe la posibilidad de error, y nunca se puede asegurar con total certeza una proposición basada en inferencia estadística. En este contexto, siempre habrá incertidumbre sobre el resultado la cual se cuantifica en términos de probabilidad.
Población: Es el conjunto de todos los elementos, medidas, individuos u objetos que tienen una característica común. Se refiere a la totalidad de información que describe un fenómeno, que puede ser un conjunto finito de mediciones o una colección extensa, prácticamente infinita, de datos relevantes.
Muestra aleatoria: Todo subconjunto de una población es una muestra de ese universo o población, por lo tanto, una muestra se refiere a cualquier subconjunto que además, puede tener cualquier tamaño. No obstante, la selección de la muestra puede depender del criterio del inspector de planta, quien puede optar por tomar muestras de los envases más accesibles o de las cápsulas más cercanas. Por lo tanto, una muestra debe cumplir ciertas condiciones, donde cada elemento de la población tiene una oportunidad igual e independiente de ser elegido, es entonces cuando surge el concepto de muestra aleatoria. Para determinar el tamaño de la muestra y la elección aleatoria de sus elementos, seguir el enlace.
Muestreo: El objetivo de las técnicas de muestreo es asegurar que cada observación en la población tiene una oportunidad igual e independiente de ser incluida en la muestra y que por lo tanto, conducen a una muestra aleatoria.
Estadísticos: Hace referencia a las características de la muestra, por lo tanto, estas son conocidas. Se identifican con letras minúsculas: x ̅, s, s2
Parámetros: Hace referencia a las características de la población, las cuáles generalmente son desconocidas y se pretenden estimar a través de los estadísticos de la muestra. Se identifican con letras griegas: μ, σ, σ2
Variable categórica: Es una variable que puede tomar un número limitado y fijo de valores, que representan distintas categorías o grupos. Las variables categóricas se dividen en dos tipos principales:
Variables categóricas nominales: Estas variables representan categorías sin un orden específico o significativo entre ellas. Por ejemplo, la forma de las tabletas (capsular, oblonga, redonda), las formas farmacéuticas (solución oral, ungüento, crema oftálmica).
Variables categóricas ordinales: Estas variables representan categorías con un orden inherente entre ellas, pero la diferencia entre las categorías no es necesariamente uniforme. Por ejemplo, el resultado de una prueba de control de calidad (cumple, no cumple), los tipos de defectos en una revisión de control de calidad (mayor, menor, crítico), severidad de los efectos secundarios (leve, moderado, severo)
Variable aleatoria: Es una función medible que asocia a cada elemento W, un número real. Se define W como todos los posibles resultados que se pueden obtener en el experimento.
Ejemplo 1: Se tiene un proceso de llenado que utiliza un frasco jarabero de 120mL, con una capacidad máxima de 160mL (rebose). Se define W como todos los posibles resultados que puedo obtener durante proceso de llenado, desde el frasco totalmente vacío hasta el frasco rebosado. Nótese que no se está hablando del volumen de envase al que se ajustó la maquina envasadora de acuerdo con las especificaciones del producto sino a todos los posibles resultados que se pueden obtener.
Por lo tanto, la variable aleatoria corresponderá al proceso de asignar un número real a ese elemento de W, donde al frasco vacío se le asignará 0mL y al frasco rebosado se le asignará 160mL.
Variable aleatoria : Volumen de envase en el frasco jarabero.
Ejemplo 2: Se realiza un proceso de inspección visual de partículas a ampollas de una solución estéril, donde si se observa al menos una partícula, esta ampolla será clasificada como "defectuosa" o "con presencia de partículas" y si no se observa ninguna partícula, la ampolla será clasificada como "no defectuosa" o "sin presencia de partículas". En este caso, se define W como todos los posibles resultados que puedo obtener durante el proceso de inspección, es decir, ninguna partícula o más de una partícula.
Por lo tanto, la variable aleatoria corresponderá al proceso de asignar un número real a ese elemento de W, donde a la ampolla sin partículas se le asignará 0 y a las ampollas que contengan una o más partículas, se le asignará 1.
Variable aleatoria : Presencia o ausencia de partículas en la ampolla.
Ejemplo 3: En un proceso de blisteado, la máquina está experimentando fallos que pueden resultar en blísteres con una o más tabletas faltantes. Si consideramos un blíster con 6 alvéolos, definimos W como el conjunto que abarca desde ningún alvéolo vacío hasta todos los alvéolos vacíos. Por consiguiente, la variable aleatoria corresponde al proceso de asignar un número real a cada elemento de W. Cuando no falta ninguna tableta, se asigna el valor 0; cuando faltan todas las tabletas, se asigna el valor 6.
Variable aleatoria : Número de tabletas faltantes en el blister.
Clasificación de las variables aleatorias: Las variables aleatorias se clasifican de acuerdo con su función de distribución acumulada. Si la función de distribución , de la variable aleatoria
, es una función escalonada, entonces se dice que
es una variable aleatoria discreta, si
es continua, entonces, se dice que
es una variable aleatoria continua.
Variable aleatoria discreta:
Si la función de distribución acumulada es escalonada se habla de una variable aleatoria discreta. Estas discontinuidades son llamadas saltos.
Sea una variable aleatoria real y
su función de distribución. Se dice que
presenta un salto en el punto
si
La diferencia se llama magnitud del salto y es igual a
.
Una manera sencilla de identificar una variable aleatoria discreta, es preguntarse si el número real asignado es un entero, se hablará de variable aleatoria discreta, es decir, como aquella que por su concepto en sí mismo no acepta decimales.
Ejemplos:
- Número de quejas recibidas.
- Número de envases obtenidos para calcular un rendimiento del lote.
- Número de cápsulas fabricadas.
- Número de tabletas faltantes en un blister.
Note que en estos ejemplos no es coherente hablar de “queja y media” o registrar un rendimiento de 500,3 envases.
Variable aleatoria continua:
Se dice que es absolutamente continua, si y sólo si, existe una función real no negativa e integrable
tal que, para todo
, se
satisface:
Una forma simple de reconocer una variable aleatoria continua es preguntarse si el número real asignado es un número racional, se hablará de variable aleatoria continua.
Ejemplos:
- pH
- Temperatura
- Masa
Note que en estos ejemplos sí es coherente hablar de pH=7,54 o temperatura de 34,4° C.
Función de distribución acumulada (FDA): Sea una variable aleatoria real. La función
definida sobre
por medio de:
La función de distribución acumulada de las variables aleatorias debe cumplir con las siguientes características:
- Es una función no decreciente y continua a derecha.
- El límite cuando tiende a ∞, en todos los casos es 1.
- El límite cuando tiende a -∞, en todos los casos es igual a 0.
Función de masa (v.a. discreta) o función de densidad (v.a. continua):
Una tabla, una gráfica o expresión matemática (fórmula) que proporcione las probabilidades con que una variable aleatoria toma diferentes valores. Conjunto de pares ordenados donde
es el conjunto de valores de una variable aleatoria
y
las probabilidades asociadas a
.
En el caso de una variable aleatoria discreta se llama función de masa y se satisface que:
a.
b.
En el caso de una variable aleatoria continua se llama función de densidad y se satisface que:
a.
b.
Referencias:
(1) Canavos, G. C., & Medal, E. G. U. (1987). Probabilidad y estadística. México: McGraw Hill. pag.1-3.
(2) Gutiérrez Pulido, H., & De la Vara Salazar, R. (2009). Control estadístico de calidad y seis sigma. México DF: Mc Graw Hill.
(3) Blanco Castañeda, L. (2023). Probabilidad, teoría y práctica. Editorial UN.
(4) Portus, L. (1985). Curso práctico de estadística. McGraw-Hill.