Estadísticas - Bondad de ajuste

La prueba de bondad de ajuste se utiliza para verificar los datos de la muestra si se ajustan a una distribución de una población. La población puede tener distribución normal o distribución de Weibull. En palabras simples, significa que los datos de muestra representan los datos correctamente que esperamos encontrar de la población real. Las siguientes pruebas son generalmente utilizadas por los estadísticos:

  • Chi-cuadrado

  • Kolmogorov-Smirnov

  • Anderson-Darling

  • Shipiro-Wilk

Prueba de chi-cuadrado

La prueba de chi-cuadrado es la más utilizada para evaluar la bondad de las pruebas de ajuste y se usa para distribuciones discretas como la distribución binomial y la distribución de Poisson, mientras que las pruebas de bondad de ajuste de Kolmogorov-Smirnov y Anderson-Darling se usan para distribuciones continuas .

Fórmula

$ {X ^ 2 = \ sum {[\ frac {(O_i - E_i) ^ 2} {E_i}]}} $

Donde -

  • $ {O_i} $ = valor observado del primer nivel de la variable.

  • $ {E_i} $ = valor esperado del primer nivel de variable.

  • $ {X ^ 2} $ = variable aleatoria chi-cuadrado.

Ejemplo

Una empresa de juguetes construye juguetes para jugadores de fútbol. Afirma que el 30% de las cartas son medio fildeadores, el 60% defensores y el 10% son delanteros. Teniendo en cuenta que una muestra aleatoria de 100 juguetes tiene 50 jugadores de medio campo, 45 defensores y 5 delanteros. Dado el nivel de significancia de 0.05, ¿puede justificar el reclamo de la compañía?

Solución:

Determinar hipótesis

  • Hipótesis Null $ H_0 $ : la proporción de mediocampistas, defensores y delanteros es del 30%, 60% y 10%, respectivamente.

  • Hipótesis alternativa $ H_1 $ : al menos una de las proporciones en la hipótesis null es falsa.

Determinar el grado de libertad

Los grados de libertad, DF es igual al número de niveles (k) de la variable categórica menos 1: DF = k - 1. Aquí los niveles son 3. Así

$ {DF = k - 1 \\ [7pt] \, = 3 -1 = 2} $

Determinar estadística de prueba de chi-cuadrado

$ {X ^ 2 = \ sum {[\ frac {(O_i - E_i) ^ 2} {E_i}]} \\ [7pt] \, = [\ frac {(50-30) ^ 2} {30}] + [\ frac {(45-60) ^ 2} {60}] + [\ frac {(5-10) ^ 2} {10}] \\ [7pt] \, = \ frac {400} {30} + \ frac {225} {60} + \ frac {25} {10} \\ [7pt] \, = 13.33 + 3.75 + 2.50 \\ [7pt] \, = 19.58} $

Determinar el valor p

El valor P es la probabilidad de que una estadística de chi-cuadrado, $ X ^ 2 $ con 2 grados de libertad sea más extrema que 19.58. Use la Calculadora de distribución de chi-cuadrado para encontrar $ {P (X ^ 2 \ gt 19.58) = 0.0001} $.

Interpretar resultados

Como el valor P (0.0001) es bastante menor que el nivel de significancia (0.05), no se puede aceptar la hipótesis null . Por lo tanto, el reclamo de la compañía no es válido.