Estadísticas - Coeficiente de correlación

Coeficiente de correlación

Un coeficiente de correlación es una medida estadística del grado en que los cambios en el valor de una variable predicen el cambio en el valor de otra. En variables positivamente correlacionadas, el valor aumenta o disminuye en tándem. En las variables negativamente correlacionadas, el valor de uno aumenta a medida que disminuye el valor del otro.

Los coeficientes de correlación se expresan como valores entre +1 y -1.

Un coeficiente de +1 indica una correlación positiva perfecta: un cambio en el valor de una variable predecirá un cambio en la misma dirección en la segunda variable.

Un coeficiente de -1 indica un negativo perfecto: un cambio en el valor de una variable predice un cambio en la dirección opuesta en la segunda variable. Los grados menores de correlación se expresan como decimales distintos de cero. Un coeficiente de cero indica que no hay una relación discernible entre las fluctuaciones de las variables.

Fórmula

$ {r = \ frac {N \ sum xy - (\ sum x) (\ sum y)} {\ sqrt {[N \ sum x ^ 2 - (\ sum x) ^ 2] [N \ sum y ^ 2 - (\ sum y) ^ 2]}}} $

Donde -

  • $ {N} $ = Número de pares de puntajes

  • $ {\ sum xy} $ = Suma de productos de puntajes emparejados.

  • $ {\ sum x} $ = Suma de x puntajes.

  • $ {\ sum y} $ = Suma de puntajes y.

  • $ {\ sum x ^ 2} $ = Suma de puntajes al cuadrado x.

  • $ {\ sum y ^ 2} $ = Suma de puntajes al cuadrado y.

Ejemplo

Planteamiento del problema:

Calcule el coeficiente de correlación de lo siguiente:

X Y
1 2
3 5 5
4 4 5 5
4 4 8

Solución:

$ {\ sum xy = (1) (2) + (3) (5) + (4) (5) + (4) (8) = 69 \\ [7pt] \ sum x = 1 + 3 + 4 + 4 = 12 \\ [7pt] \ sum y = 2 + 5 + 5 + 8 = 20 \\ [7pt] \ sum x ^ 2 = 1 ^ 2 + 3 ^ 2 + 4 ^ 2 + 4 ^ 2 = 42 \ \ [7pt] \ sum y ^ 2 = 2 ^ 2 + 5 ^ 2 + 5 ^ 2 + 8 ^ 2 = 118 \\ [7pt] r = \ frac {69 - \ frac {(12) (20)} { 4}} {\ sqrt {(42 - \ frac {(12) ^ 2} {4}) (118- \ frac {(20) ^ 2} {4}}} \\ [7pt] = .866} $