Estadísticas - Kurtosis

El grado de cola de una distribución se mide por curtosis. Nos dice hasta qué punto la distribución es más o menos propensa a valores atípicos (más pesados o de cola ligera) que la distribución normal. Tres tipos diferentes de curvas, cortesía de Investopedia, se muestran a continuación:

curtosis

Es difícil distinguir diferentes tipos de curtosis de los gráficos de densidad (panel izquierdo) porque las colas están cerca de cero para todas las distribuciones. Pero las diferencias en las colas son fáciles de ver en las gráficas cuantil-cuantil normales (panel derecho).

La curva normal se llama curva mesokurtica. Si la curva de una distribución es más propensa a valores atípicos (o de cola más gruesa) que una curva normal o mesocurtica, entonces se denomina curva Leptokurtic. Si una curva es menos propensa a valores atípicos (o de cola más clara) que una curva normal, se llama curva platykurtic. La curtosis se mide por momentos y viene dada por la siguiente fórmula:

Fórmula

$ {\ beta_2 = \ frac {\ mu_4} {\ mu_2}} $

Donde -

  • $ {\ mu_4 = \ frac {\ sum (x- \ bar x) ^ 4} {N}} $

Cuanto mayor es el valor de \ beta_2, más pico o leptokurtic es la curva. Una curva normal tiene un valor de 3, un leptokurtic tiene \ beta_2 mayor que 3 y platykurtic tiene \ beta_2 menor que 3.

Ejemplo

Planteamiento del problema:

Se dan los datos sobre los salarios diarios de 45 trabajadores de una fábrica. Calcule \ beta_1 y \ beta_2 usando el momento sobre la media. Comenta los resultados.

Salarios (Rs.) Numero de trabajadores
100-200 1
120-200 2
140-200 6 6
160-200 20
180-200 11
200-200 3
220-200 2

Solución:

Salario
(Rs.)
Numero de trabajadores
(F)
Punto medio
metro
m - $ {\ frac {170} {20}} $
re
$ {fd} $ $ {fd ^ 2} $ $ {fd ^ 3} $ $ {fd ^ 4} $
100-200 1 110 -3 -3 9 9 -27 81
120-200 2 130 -2 -4 8 -dieciséis 32
140-200 6 6 150 -1 -6 6 6 -6 6 6
160-200 20 170 0 0 0 0 0 0 0 0 0 0
180-200 11 190 1 11 11 11 11
200-200 3 210 2 6 6 12 24 48
220-200 2 230 3 6 6 18 años 54 162
$ {N = 45} $ $ {\ sum fd = 10} $ $ {\ sum fd ^ 2 = 64} $ $ {\ sum fd ^ 3 = 40} $ $ {\ sum fd ^ 4 = 330} $

Dado que las desviaciones se han tomado de una media supuesta, por lo tanto, primero calculamos los momentos sobre el origen arbitrario y luego los momentos sobre la media. Momentos sobre el origen arbitrario '170'

$ {\ mu_1 ^ 1 = \ frac {\ sum fd} {N} \ times i = \ frac {10} {45} \ times 20 = 4.44 \\ [7pt] \ mu_2 ^ 1 = \ frac {\ sum fd ^ 2} {N} \ veces i ^ 2 = \ frac {64} {45} \ veces 20 ^ 2 = 568.88 \\ [7pt] \ mu_3 ^ 1 = \ frac {\ sum fd ^ 2} {N} \ veces i ^ 3 = \ frac {40} {45} \ veces 20 ^ 3 = 7111.11 \\ [7pt] \ mu_4 ^ 1 = \ frac {\ sum fd ^ 4} {N} \ veces i ^ 4 = \ frac {330} {45} \ veces 20 ^ 4 = 1173333.33} $

Momentos sobre la media

$ {\ mu_2 = \ mu'_2 - (\ mu'_1) ^ 2 = 568.88- (4.44) ^ 2 = 549.16 \\ [7pt] \ mu_3 = \ mu'_3 - 3 (\ mu'_1) (\ mu'_2) + 2 (\ mu'_1) ^ 3 \\ [7pt] \, = 7111.11 - (4.44) (568.88) + 2 (4.44) ^ 3 \\ [7pt] \, = 7111.11 - 7577.48 + 175.05 = - 291.32 \\ [7pt] \\ [7pt] \ mu_4 = \ mu'_4 - 4 (\ mu'_1) (\ mu'_3) + 6 (\ mu_1) ^ 2 (\ mu'_2) -3 (\ mu'_1) ^ 4 \\ [7pt] \, = 1173333.33 - 4 (4.44) (7111.11) +6 (4.44) ^ 2 (568.88) - 3 (4.44) ^ 4 \\ [7pt] \, = 1173333.33 - 126293.31 + 67288.03-1165.87 \\ [7pt] \, = 1113162.18} $

A partir del valor del movimiento sobre la media, ahora podemos calcular $ {\ beta_1} $ y $ {\ beta_2} $:

$ {\ beta_1 = \ mu ^ 2_3 = \ frac {(- 291.32) ^ 2} {(549.16) ^ 3} = 0.00051 \\ [7pt] \ beta_2 = \ frac {\ mu_4} {(\ mu_2) ^ 2 } = \ frac {1113162.18} {(546.16) ^ 2} = 3.69} $

De los cálculos anteriores, se puede concluir que $ {\ beta_1} $, que mide el sesgo es casi cero, lo que indica que la distribución es casi simétrica. $ {\ beta_2} $, que mide la curtosis, tiene un valor mayor que 3, lo que implica que la distribución es leptokurtic.