GUIA DE INTRODUCCIÓN A LA ECONOMETRÍA UTILIZANDO GRETL

GUIA DE INTRODUCCIÓN A LA ECONOMETRÍA UTILIZANDO GRETL

Mª Isabel Cal Bouzada
Mª Victoria Verdugo Matés
(CV)

Volver al índice

Análisis de los residuos

Una vez estimado el modelo, es importante realizar un diagnóstico del mismo. El análisis de los residuos MCO juega un papel fundamental en esta tarea (puede ayudar a determinar la existencia de valores atípicos, la presencia de problemas de autocorrelación, heterocedasticidad, etc).
La salida asociada al submenú Mostrar variable observada, estimada, residuos del menú Análisis de la Ventana Modelo proporciona información sobre el rango de estimación, el estimador de la desviación tipica de la perturbación y, para cada una de las observaciones muestrales, el valor de la variable dependiente, su valor estimado y el error cometido en su estimación (véase Tabla 3‑2). Además, tal y como puede verse en la parte inferior de la Tabla 3‑2 proporciona algunos estadísticos para la evaluación de la predicción que no serán analizados en este capítulo.


Tabla 3‑2. Salida asociada al submenú Mostrar variable observada, estimada, residuos del menú Análisis de la Ventana Modelo.

 

 

 

 

 

Rango de estimación del modelo: nº observación inicial – nº observación final 

Desviación típica de la regresión =

 

 

 

Observaciones

Y

estimada

residuo

 

1

 

2

 

3

 

 

T

 

 

 

Estadísticos de evaluación de la predicción

 

Error medio

EM

 

Error cuadrático medio

ECM

 

Raíz del Error cuadrático medio

RECM

 

Error absoluto medio 

EAM

 

Porcentaje del error medio

PEM

 

Porcentaje del error absoluto medio

PEAM

 

U de Theil

U

 

 

 

 

 

 

Se denomina residuo o error ( ) a la diferencia entre el valor observado del regresando ( ) y su valor estimado por el modelo ( ).
 
Recuérdese que en modelos formulados con ordenada en el origen, la media residual, es decir, el error medio es nulo.

Análisis de las sumas de cuadrados: tabla ANOVA

Las Tablas ANOVA o Tablas de Análisis de la Varianza proporcionan la descomposición de la variabilidad de la variable dependiente en dos componentes, la información recibida de los regresores y la recibida de los residuos. En la Tabla 3‑3 se recoge la salida asociada al submenú ANOVA del menú Análisis de la Ventana Modelo.


Tabla 3‑3. Salida asociada al submenú ANOVA del menú Análisis de la Ventana Modelo.

 

 

 

 

 

Análisis de Varianza:

 

 

 

 

Suma de cuadrados

gl

Media de cuadrados

 

 

 Regresión

 

K

 

 Residuo

 

T-K-1

 

 

 Total

 

T-1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

En la tabla ANOVA aparece recogida la siguiente información:

  •  La Suma de Cuadrados de la Regresión (SCR), que es la suma de cuadrados de las desviaciones de los valores estimados del regresando () respecto a su media muestral (). Por estar el modelo formulado con ordenada en el origen, la media del regresando estimado coincide con la media del regresando () y, por tanto, se puede calcular como .        
  •  La Suma de Cuadrados de los Errores (SCE),  que es la suma de residuos al cuadrado. En modelos formulados con ordenada en el origen coincide con la suma de cuadrados de las desviaciones de los valores de los residuos ( ) respecto a su media muestral ( ), dado que, en este caso, la media de los residuos es nula.
  • La Suma de Cuadrados Totales (SCT), que es la suma de cuadrados de las desviaciones de los valores observados del regresando ( ) respecto a su media muestral ( ).

Hay que señalar que la tabla ANOVA sólo está disponible si el modelo está formulado con ordenada en el origen. En la penúltima fila se proporciona el cálculo del coeficiente de determinación 1 y en la última, el cálculo del estadístico F2 y su p-valor (que serán comentados en el capítulo dedicado a contrastes de hipótesis).

Análisis gráfico: menú Gráficos de la Ventana Modelo

Para tener una idea inicial de la “calidad” de la estimación, puede resultar interesante la representación gráfica de los valores del regresando y del regresando estimado, así como de los residuos. El menú Gráficos de la Ventana Modelo de la Estimación mínimo cuadrática proporciona entre otras representaciones gráficas: una de los residuos y otra de los valores observados y estimados de la variable dependiente del modelo.
Para modificar las propiedades de dichos gráficos es necesaria su edición, para lo que se hace clic en cualquier parte del gráfico con el botón derecho del ratón y, en el menú emergente se selecciona Editar, con lo que se abrirá la Ventana controladores de gráficos de Gretl, en la cual, de una manera relativamente sencilla, se podrán cambiar algunos de sus atributos: títulos, colores, rango de ejes, añadir lineas, etc.
El gráfico de valores observados y estimados permite analizar, de forma rápida, en que medida los valores estimados por el modelo se ajustan a los valores observados. Por ejemplo, a la vista del gráfico de la Ilustración 3‑5, el modelo parece recoger de forma bastante razonable la evolución de la variable endógena, ya que no se observan grandes errores.
Para facilitar el análisis del gráfico de los residuos resulta conveniente trazar unas líneas adicionales paralelas al eje horizontal:

  • Una línea que pase por el valor medio de los residuos (cero ya que el modelo está formulado con ordenada en el origen). Esta línea permitirá ver de forma rápida en que observaciones se comete un error de estimación mayor y si el error cometido es positivo o negativo.
  • Dos líneas para definir una banda de variación que represente más-menos dos veces la desviación típica. Dicha banda permitirá analizar de forma sencilla si los residuos se distribuyen de acuerdo con una normal, en cuyo caso sus valores estarían con un 95% de probabilidad comprendidos dentro de esta banda.

Además, el gráfico de residuos puede ayudar a determinar la existencia de valores u observaciones anómalas. Por ejemplo, observando el gráfico de la Ilustración 3‑6, dos de los errores supera la banda de confianza y quizás sea necesario darle un tratamiento diferenciado del resto. Además, este gráfico, puede ayudar a sospechar problemas de autocorrelación (se analizará en el capítulo correspondiente).
Aunque se trata de análisis muy intuitivos y poco exactos, pueden dar pistas sobre posibles problemas que se pueden plantear por el incumplimento de las hipótesis básicas, pero difícilmente serán concluyentes.

Estimación MCO de un modelo formulado sin ordenada en el origen

Aunque no es lo habitual, el modelo puede formularse sin ordenada en el origen:

La diferencia con respecto al modelo formulado con ordenada en el origen (epígrafe 3.3. ) es que no aparece el parámetro .
Matricialmente este modelo se puede escribir:

Para estimar un modelo sin ordenada en el origen, en el comando ols no se debe incluir como variable independiente el regresor ficticio (const).
ols Y  X1 X2 … Xk  --opciones
Aparentemente, las salidas del comando ols para un modelo con y sin ordenada en el origen son similares (véase Tabla 3‑4), sin embargo, los cálculos de algunos de los estadísticos difieren de manera importante, cuestión que es necesario tener en cuenta para realizar de forma correcta las interpretaciones.


Tabla 3‑4. Salida asociada al submenú Mínimos Cuadrados Ordinarios del menú Modelo de la Ventana Principal para la estimación MCO de un modelo formulado sin ordenada en el origen.

 

Modelo nº: MCO, usando las observaciones nº observación inicial – nº observación final (n = ($T) Variable dependiente: Y ($depvar)

 

 

 

Coeficiente

Desv. Típica

Estadístico t

Valor p

 

 

 *

 

 **

 

 

 ***

 

 

 

 

Media de la vble. Dep

 

D.T. de la vble. dep.

 

 

Suma de cuad. residuos

($ess)

D.T. de la regresión

($sigma)

 

R-cuadrado

 ($rsq)

R-cuadrado corregido

 

 

F(K, T-K-1)

 ($Fstat)

Valor p (de F)

 

 

Log-verosimilitud

 ($lnl)

Criterio de Akaike

($aic)

 

Criterio de Schwarz

 ($bic

Crit. de Hannan-Quinn

($hqc)

 

 

 

 

 

 

 

Por ejemplo, bajo la denominación R-cuadrado, en este caso Gretl no proporciona el coeficiente de determinación sino el coeficiente de determinación bruto ().
  
En modelos formulados sin ordenada en el origen, no se cumple la descomposición de SCT en SCE y SCR. Por tanto, el coeficiente de determinación deja de estar acotado entre cero y uno y carece de la interpretación habitual, es decir, ya no mide la proporción en que la varianza muestral del regresando (SCT/T) es explicada por la varianza del regresando estimado (SCR/T) y, por tanto, no podrá interpretarse como el porcentaje de variaciones del regresando explicado por las variaciones de las variables explicativas. Por ello, en estos modelos el coeficiente de determinación pierde su atractivo como medida de bondad de ajuste y, Gretl calcula en su lugar el coeficiente de determinación bruto, que aunque carece de la interpretación habitual (puesto que no se basa en la descomposición de SCT en SCE y SCR), está acotado entre cero y uno (ya que se basa en la descomposición de  en  y , descomposición que se cumple independientemente de que el modelo esté formulado con o sin regresor ficticio).
Además, debe de tenerse en cuenta que las expresiones de cálculo de los estadísticos se ven afectadas por el hecho de que el modelo esté formulado sin ordenada en el origen.
  
Al calcular el estimador de la varianza de la perturbación se debe tener en cuenta que los grados de libertad del modelo son T-K, puesto que el número de regresores coincide con el número de variables explicativas.
Debe recordarse que en un modelo formulado sin ordenada en el origen la media del regresando no coincide con la media del regresando estimado .

Los coeficientes estimados recogen el valor de los estimadores de los parámetros que acompañan a cada una de las variables explicativas.

Las desviaciones típicas estimadas de los estimadores miden la precisión con la que son estimados los parámetros, es decir, indican el “grado de confianza” de las estimaciones siempre que los estimadores sean insesgados.
La matriz de varianzas-covarianzas estimada de los estimadores es una matriz de orden KxK, cuyos elementos diagonales son las varianzas estimadas de los estimadores mínimo cuadráticos ordinarios y cuyos elementos no diagonales son las covarianzas estimadas de dichos estimadores.

1 Se puede comprobar, que en modelos formulados con ordenada en el origen SCT es igual a SCE más SCR, lo que hace que el coeficiente de determinación esté acotado entre cero y uno.