Estadísticas - Análisis residual

El análisis residual se utiliza para evaluar la idoneidad de un modelo de regresión lineal mediante la definición de residuos y el examen de los gráficos de parcela residual.

Residual

Residual ($ e $) se refiere a la diferencia entre el valor observado ($ y $) y el valor pronosticado ($ \ hat y $). Cada punto de datos tiene un residual.

$ {residual = observeValue - predictedValue \\ [7pt] e = y - \ hat y} $

Parcela residual

Un gráfico residual es un gráfico en el que los residuos están en el eje vertical y la variable independiente está en el eje horizontal. Si los puntos se dispersan aleatoriamente alrededor del eje horizontal, entonces un modelo de regresión lineal es apropiado para los datos; de lo contrario, elija un modelo no lineal.

Tipos de parcela residual

El siguiente ejemplo muestra pocos patrones en parcelas residuales.

Parcelas Residuales

En el primer caso, los puntos se dispersan al azar. Por lo tanto, se prefiere el modelo de regresión lineal. En el segundo y tercer caso, los puntos se dispersan de forma no aleatoria y sugiere que se prefiere un método de regresión no lineal.

Ejemplo

Planteamiento del problema:

Verifique dónde es apropiado un modelo de regresión lineal para los siguientes datos.

$ x $ 60 60 70 80 85 95
$ y $ (valor real) 70 sesenta y cinco 70 95 85
$ \ hat y $ (valor predicho) 65,411 71,849 78,288 81,507 87,945

Solución:

Paso 1: Calcular los residuos para cada punto de datos.

$ x $ 60 60 70 80 85 95
$ y $ (valor real) 70 sesenta y cinco 70 95 85
$ \ hat y $ (valor predicho) 65,411 71,849 78,288 81,507 87,945
$ e $ (Residual) 4.589 -6,849 -8,288 13.493 -2,945

Paso 2: - Dibuja el gráfico de trazado residual.

Parcela residual

Paso 3: - Verifique la aleatoriedad de los residuos.

Aquí la gráfica residual presenta un patrón aleatorio: el primer residual es positivo, los dos siguientes son negativos, el cuarto es positivo y el último residual es negativo. Como el patrón es bastante aleatorio, lo que indica que un modelo de regresión lineal es apropiado para los datos anteriores.