Estadísticas - Muestreo estratificado

Esta estrategia de examen se utiliza como parte de una circunstancia en la que la población puede dividirse sin esfuerzo en reuniones o estratos que no son exactamente iguales entre sí, pero los componentes dentro de una reunión son homogéneos con respecto a algunos atributos, por ejemplo, estudiantes de la escuela. pueden separarse en estratos bajo la premisa de orientación sexual, cursos ofrecidos, edad, etc. En esto, la población se divide inicialmente en estratos y luego se toma una muestra irregular básica de cada estrato. Las pruebas estratificadas son de dos tipos: inspección estratificada proporcional y examen estratificado desproporcionado.

  • Muestreo estratificado proporcional : en este caso, el número de unidades seleccionadas de cada estrato es proporcional a la proporción de estrato en la población, por ejemplo, en una universidad hay un total de 2500 estudiantes, de los cuales 1500 están inscritos en cursos de posgrado y 1000 están inscritos en postgrado cursos. Si se elige una muestra de 100 utilizando un muestreo estratificado proporcional, el número de estudiantes de pregrado en la muestra sería 60 y 40 serían estudiantes de postgrado. Así, los dos estratos están representados en la misma proporción en la muestra que su representación en la población.

    Este método es más adecuado cuando el propósito del muestreo es estimar el valor de la población de alguna característica y no hay diferencia en las variaciones dentro del estrato.

  • Muestreo estratificado desproporcionado : cuando el propósito del estudio es comparar las diferencias entre estratos, entonces es necesario extraer unidades iguales de todos los estratos, independientemente de su participación en la población. A veces, algunos estratos son más variables con respecto a alguna característica que otros estratos, en tal caso, se puede extraer un mayor número de unidades de los estratos más variables. En ambas situaciones, la muestra extraída es una muestra estratificada desproporcionada.

    La diferencia en el tamaño del estrato y la variabilidad del estrato se puede asignar de manera óptima utilizando la siguiente fórmula para determinar el tamaño de la muestra de diferentes estratos

    Fórmula

    $ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + ... + n_k \ sigma_k} \ for \ i = 1,2 ... k} $

    Donde -

    • $ {n_i} $ = el tamaño de muestra de i estratos.

    • $ {n} $ = el tamaño de los estratos.

    • $ {\ sigma_1} $ = la desviación estándar de los estratos i.

    Además de esto, puede haber una situación en la que el costo de recolectar una muestra sea mayor en un estrato que en otro. El muestreo desproporcionado óptimo debe hacerse de una manera que

    $ {\ frac {n_1} {n_1 \ sigma_1 \ sqrt {c_1}} = \ frac {n_2} {n_2 \ sigma_1 \ sqrt {c_2}} = ... = \ frac {n_k} {n_k \ sigma_k \ sqrt { c_k}}} $

    Donde $ {c_1, c_2, ..., c_k} $ se refieren al costo del muestreo en k estratos. El tamaño de la muestra de diferentes estratos se puede determinar utilizando la siguiente fórmula:

    $ {n_i = \ frac {\ frac {n.n_i \ sigma_i} {\ sqrt {c_i}}} {\ frac {n_1 \ sigma_1} {\ sqrt {c_i}} + \ frac {n_2 \ sigma_2} {\ sqrt {c_2}} + ... + \ frac {n_k \ sigma_k} {\ sqrt {c_k}}} \ for \ i = 1,2 ... k} $

Ejemplo

Planteamiento del problema:

Una organización tiene 5000 empleados que se han estratificado en tres niveles.

  • Estrato A: 50 ejecutivos con desviación estándar = 9

  • Estrato B: 1250 trabajadores no manuales con desviación estándar = 4

  • Estrato C: 3700 trabajadores manuales con desviación estándar = 1

¿Cómo se extraerá una muestra de 300 empleados de manera desproporcionada con una asignación óptima?

Solución:

Usando la fórmula de muestreo desproporcionado para una asignación óptima.

$ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + n_3 \ sigma_3}} \\ [7pt] \, para la secuencia A, {n_1 = \ frac {300 (50) (9 )} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {135000} {1950} = {14.75} \ o \ say \ {15}} \\ [7pt] \, para la secuencia B, {n_1 = \ frac {300 (1250) (4)} {(50) (9) + (1250) (4) + (3700) (1 )}} \\ [7pt] \, = {\ frac {150000} {1950} = {163.93} \ o \ say \ {167}} \\ [7pt] \, para la secuencia C, {n_1 = \ frac { 300 (3700) (1)} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {110000} {1950} = { 121.3} \ o \ say \ {121}} $