GUIA DE INTRODUCCIÓN A LA ECONOMETRÍA UTILIZANDO GRETL

GUIA DE INTRODUCCIÓN A LA ECONOMETRÍA UTILIZANDO GRETL

Mª Isabel Cal Bouzada
Mª Victoria Verdugo Matés
(CV)

Volver al índice

Relación entre los comandos genr, matrix y scalar

En los contextos adecuados, los comandos genr, matrix y scalar se pueden considerar sinónimos. Además, se debe tener en cuenta que no es estrictamente necesario, aunque si conveniente, que dichos comandos aparezcan de forma explícita en las instrucciones de cálculo (sobretodo para el usuario que se inicie en la utilización del programa).


? genr r1 = 3
Se ha generado el escalar r1 = 3

? scalar r2 = 3
Se ha generado el escalar r2 = 3

? matrix r3 = 3
Se ha generado la matriz r3

? r4 = 3
Se ha generado el escalar r4 = 3

Obsérvese que no resulta eficiente utilizar el comando matrix para definir escalares.


? matrix CTC1 = C' * C
Se ha generado la matriz CTC1

? genr CTC2 =  C' * C
Se ha generado la matriz CTC2

? CTC3 =  C' * C
Se ha generado la matriz CTC3

Se debe tener en cuenta que cuando el resultado de la operación matricial es un escalar sólo será considerado como una matriz si para su cálculo se utiliza el comando matrix, en cuyo caso, Gretl creará en la Ventana vista de iconos el icono correspondiente a la matriz de orden 1x1 que contenga dicho escalar.


? genr series h1 =x1
Se ha generado la serie h1 (ID 31)

? series h2 = x1
Se ha generado la serie h2 (ID 32)

? h3 = x1
Se ha generado la serie h3 (ID 33)

¿Cómo calcular los estadísticos descriptivos de las variables?

Existen varias alternativas para calcular los estadísticos descriptivos de las variables:

  • Utilizar el menú Ver de la Barra de Menú de la Ventana Principal.
  • Utilizar el comando summary.

Utilizar el menú Ver

Antes de acceder al menú Ver y seleccionar Estadísticos principales será necesario que en la Ventana Principal se seleccione/n la/s variable/s de la/s que se quiera obtener los estadísticos descriptivos (véase parte superior izquierda de la Ilustración 2‑15).
Otra forma de acceder a los estadísticos descriptivos es a través del botón derecho del ratón y en el menú emergente seleccionar Estadísticos descriptivos (véase parte inferior izquierda de la Ilustración 2‑15).  
Cuando se esté interesado en ver los estadísticos descriptivos de una sola variable, también se podrá utilizar el menú Variable y selecccionar Estadísticos principales.

Utilizar el comando summary

Para visualizar los estadísticos descriptivos se puede utilizar el comando summary, cuyo formato es:
summary  v1 v2 …
Si en el momento de ejecutar el comando summary no se indica un listado de variables, Gretl incluirá todas las variables de la sesión de trabajo.
En la Tabla 2‑1 se recoge la salida estándar de un comando summary en el que interviene una única variable genérica Xi con T observaciones (t=1,2,...,T).

  • Como puede observarse en la salida estándar del comando summary, se muestran estadísticos descriptivos que reflejan algunas de las características de la distribución de la variable. La media, la mediana, los cuartiles y los percentiles son medidas de posición, la desviación típica, el coeficiente de variación y el rango intercuartílico son medidas de dispersión y los coeficientes de asimetria y exceso de curtosis son medidas de forma.
  • Las medidas de posición central dan una idea de la situación o centro de los datos, es decir, proporcionan un “valor representativo” del conjunto de datos. La media es el valor promedio y es un estadístico poco robusto frente a la existencia de valores extremos en la muestra (las observaciones anómalas van a tener una gran influencia en el valor que tome dicho estadístico). La mediana es el valor central de la distribución y no varía mucho ante cambios en los valores de unas pocas observaciones, es decir, que en muestras con observaciones anómalas es más representativa del conjunto de datos la mediana que la media.
  • Para valorar la representatividad de las medidas de posición se utilizan las medidas de dispersión, que informan de lo poco o muy concentradas que están las observaciones entorno a su valor.
  • La desviación típica mide el grado de dispersión de los datos alrededor de su media. En general, cuanto más cercana a cero esté la desviación típica, más concentradas estarán las observaciones alrededor de su media y su grado de representatividad será mayor. No obstante, al depender de las unidades de medida, no es fácil comparar la representatividad de varios conjuntos de datos.
  • El problema anterior se soluciona utilizando el coeficiente de variación, que es adimensional. De manera que si el coeficiente de variación es menor que uno, se considera que la media es bastante representativa del conjunto de datos, puesto que su dispersión es pequeña en relación con el valor de la media.
  • La asimetría de la distribución da una idea de si los datos se distribuyen simétricamente o no entorno a la media. Será negativa cuando la cola izquierda (asociada a valores por debajo de la media) sea más larga que la cola derecha y positiva en caso contrario. Una asimetria negativa se corresponde con una media inferior a la mediana y positiva al contrario.
  • El coeficiente de asimetría mide la cantidad de observaciones que se encuentran en las colas en relación con las situadas alrededor de la media, siendo tres su valor de referencia para una distribución normal. Por tanto, un exceso de curtosis negativo indica un menor número de observaciones en las colas y un menor apuntamiento, mientras que si es positivo indica un mayor peso de las colas y un mayor apuntamiento.
  • En el Cuadro 2‑5 se recogen algunas de las opciones disponibles con el comando summary.

--simple à  muestra una versión restringida de los estadísticos descriptivos, es decir, con esta opción sólo se     calcula  y muestra la media, la desviación típica y los valores máximos y mínimos de las variables que aparezcan en el comando summary  (sin esta opción también se calculan y muestran los coeficientes de variación, asimetria, curtosis, rango intercuartílico, número de observaciones ausentes y los       percentiles del 5%  y del 95% cuando el tamaño muestral es igual o superior a 19).
--by=vi à   calcula y muestra los estadísticos descriptivos de las variables que intervienen en el comando summary para cada uno de los valores de la variable (vi tiene que ser una variable discreta,  por ejemplo, una variable ficticia).

Cuadro 2‑5. Algunas opciones del comando summary.

  • A continuación se muestran algunos ejemplos de ejecución del comando summary con y sin dichas opciones:

# Tabla de estadísticos pricipales para la variable y
? summary y
Estadísticos principales, usando las observaciones 1 - 10
para la variable 'y' (10 observaciones válidas)
  Media                           10.300
  Mediana                         10.500
  Mínimo                          8.0000
  Máximo                          12.000
  Desviación típica               1.3375
  C.V.                           0.12985
  Asimetría                     -0.28196
  Exc. de curtosis               -1.0272
  Rango intercuartílico           2.2500
  Observaciones ausentes               0

# Tabla reducida de estadísticos pricipales para la variable y
? summary y  --simple
Estadísticos principales, usando las observaciones 1 - 10
para la variable 'y' (10 observaciones válidas)
  Media                           10.300
  Mínimo                          8.0000
  Máximo                          12.000
  Desviación típica               1.3375
  Observaciones ausentes               0

# Tabla reducida de estadísticos pricipales para la variable y para cada uno de los valores de la variable ficticia v1
? summary y  --simple --by=v1
Estadísticos principales de y, por valores de v1
  v1 = 0 (n = 8):
    Media                           10.500
    Mínimo                          8.0000
    Máximo                          12.000
    Desviación típica               1.4142
    Observaciones ausentes               0

  v1 = 1 (n = 2):
    Media                           9.5000
    Mínimo                          9.0000
    Máximo                          10.000
    Desviación típica              0.70711
    Observaciones ausentes               0

Cuando en el comando summary interviene más de una variable, el output de dicho comando no hace referencia al rango muestral utilizado:


# Tabla de estadísticos pricipales para las variables x1, x2 e y
? summary x1 x2 y
                    Media        Mediana         Mínimo         Máximo
x1                 2.5560         2.5700         1.9500         2.9800
x2                 1048.1         1068.7         809.62         1164.3
y                  10.300         10.500         8.0000         12.000

            Desv. Típica.           C.V.      Asimetría   Exc. de curtosis
x1                0.28017        0.10961       -0.72470        0.44031
x2                 97.472       0.092996        -1.4868         1.7583
y                  1.3375        0.12985       -0.28196        -1.0272

                  Rango IQ   Observaciones ausentes
x1                0.31000              0
x2                 85.602              0
y                  2.2500              0

Los percentiles aparecen en el output del comando summary cuando el tamaño muestral es igual o superior a 19:


? smpl 1 20
Rango de datos completo: 1 - 60 (n = 60)
Muestra actual: 1 - 20 (n = 20)

? summary x1 x2 y
                    Media        Mediana         Mínimo         Máximo
x1                 2.4630         2.4500         1.9500         2.9800
x2                 1053.5         1068.7         809.62         1314.5
y                  10.650         11.000         8.0000         13.000

            Desv. Típica.           C.V.      Asimetría    Exc. de curtosis
x1                0.22697       0.092153        0.16015        0.46824
x2                 117.19        0.11124       0.058080      -0.021098
y                  1.2258        0.11510       -0.18073       -0.32341

                 Perc. 5%      Perc. 95%        Rango IQ   Observaciones ausentes
x1                 1.9620         2.9685        0.28500              0
x2                 814.66         1308.8         158.98              0
y                  8.0500         12.950         1.7500              0

Hay que señalar que puede ser interesante, sobre todo en estudios de corte transversal, completar el análisis descriptivo individual de las variables con un estudio de la tabla y del histograma de frecuencias, a los que se puede acceder con el menú emergente que aparece cuando en la Ventana Principal, una vez seleccionada la variable, se pincha con el botón derecho del ratón y se selecciona Distribución de frecuencias o bien a través de la opción Distribución de frecuencias del menú Variable (véase Ilustración 2‑16).
Como puede verse en la parte central de la Ilustración 2‑16, se  pueden modificar las características de la tabla y del gráfico de frecuencias realizando las elecciones oportunas en el cuadro de diálogo distribución de frecuencias:

  • Número de intervalos à Gretl sólo permite seleccionar un número impar de intervalos, siendo tres el número mínimo y el máximo T si T es impar y T-1 si T es par, siendo T el tamaño del rango muestral. No obstante, parece conveniente elegir un número entero próximo a  (en el ejemplo de la Ilustración 2‑16, como se está trabajando con un rango de 10 observaciones, se ha elegido como número de intervalos 3).
  • Valor mínimo, intervalo izquierdo y grosor del intervalo à todos los intervalos deben tener la misma amplitud. Por defecto, Gretl los elige de manera que el punto central o marca de clase del primer y último intervalo sean, respectivamente, el valor mínimo y el valor máximo de la variable en el rango muestral utilizado.
  • Mostrar sólo los datos à se debe elegir esta opción cuando se quiera obtener la tabla de frecuencias.
  • Mostrar el gráfico à se debe elegir esta opción cuando se quiera obtener el histograma de frecuencias.

Por defecto, Gretl muestra el histograma de frecuencias, debido a que tiene seleccionado simultáneamente Mostrar sólo los datos y Mostrar el gráfico, por tanto, para visualizar la tabla de frecuencias es necesario no seleccionar Mostrar el gráfico.
La opción Copiar de la Ventana distribución de frecuencias permite importar la tabla de distribución de frecuencias entre otros formatos, como un fichero MS Word. A continuación se muestra en formato MS Word, la tabla de distribución de frecuencias de la variable x1 recogida en la parte superior derecha de la Ilustración 2‑16:


Distribución de frecuencias para x1, observaciones 1-10
número de cajas = 3, media = 2.556, desv.típ.=0.280167

      intervalo     punto medio   frecuencia  rel     acum.

           < 2.2075    1.9500         1     10.00%   10.00% ***
    2.2075 - 2.7225    2.4650         5     50.00%   60.00% ******************
          >= 2.7225    2.9800         4     40.00%  100.00% **************

En la primera columna, denominada intervalo, aparecen los tres intervalos en los que se han dividido los valores que toma la variable x1 y en la segunda, denominada punto medio, aparece la marca de clase de cada intervalo. Bajo la denominación frecuencia se muestra la frecuencia absoluta del intervalo (en este caso, hay 5 observaciones comprendidas entre 2.2075 y 2.7225 €). En la columna rel se muestra la frecuencia relativa de cada intervalo (porcentaje de observaciones que hay en cada tramo) y en la columna acum, aparece la frecuencia relativa acumulada hasta ese intervalo.
Las frecuencias relativas son las que se utilizan para construir el histograma de frecuencias. Por ejemplo, las 5 observaciones que se encuentran en el intervalo [2.2075, 2.7225] constituyen el 50% del total de observaciones y, por tanto, dado que todos los intervalos son de igual amplitud, la altura de la barra central del histograma es su frecuencia relativa asociada en tanto por uno, es decir, 0.5 (véase el gráfico que aparece en la parte inferior derecha de la Ilustración 2‑161 ). Hay que señalar, que en la última columna de la tabla de frecuencias aparecen representadas las frecuencias relativas, no obstante, se trata de una representación de menor calidad puesto que es una plantilla de texto.
Para obtener la tabla de frecuencias con la Consola Gretl o con un fichero de comandos se puede utilizar el comando freq, cuyo formato es:
freq  nombre de la variable

1 Se podrán modificar las características de este gráfico con la opción Editar del menú emergente que aparece al pinchar con el botón derecho del ratón encima del área de dicho gráfico (esta opción será tratada con detalle en el epígrafe relativo a las representaciones gráficas).