GUIA DE INTRODUCCIÓN A LA ECONOMETRÍA UTILIZANDO GRETL

GUIA DE INTRODUCCIÓN A LA ECONOMETRÍA UTILIZANDO GRETL

Mª Isabel Cal Bouzada
Mª Victoria Verdugo Matés
(CV)

Volver al índice

¿Cómo buscar el p-valor y el valor crítico en una distribución?

A la hora de efectuar contrastes de hipótesis resulta imprescindible conocer el valor crítico asociado a un nivel de significación prefijado o el p-valor asociado al valor del estadístico de prueba utilizado en dicho contraste. Ambos valores se buscarán en la distribución de probabilidad que siga el estadístico de prueba de dicho contraste bajo la hipótesis nula.

Valor crítico

Para buscar el valor crítico se puede utilizar el menú Herramientas de la Ventana Principal.
Al seleccionar la opción Tablas estadísticas en dicho menú, se abre el cuadro de diálogo valores críticos, donde pinchando en el botón corresponiente (normal, t, χ2, F) se debe elegir el tipo de distribución  y proporcionar la información que Gretl necesita en cada caso. Como puede verse en los ejemplos de la Ilustración 4‑2, son varias las casillas que se deben ir rellenando, variando su número y contenido de unas distribuciones a otras. En la casilla probabilidad en la cola derecha se debe especificar el nivel de significación  para los contrastes de la cola derecha y el nivel de confianza  para los contrastes de la cola izquierda. En las distribuciones simétricas y para el contraste de ambas colas, se debe especificar la mitad del nivel de significación . En la distribución normal se debe especificar la media y desviación típica1 y, en las distribuciones t, χ2 y F se deben especificar sus grados de libertad.
Una vez que se han rellenado todas las casillas del cuadro de diálogo valores críticos, se selecciona el botón "Aceptar" y aparece el resultado de la búsqueda en la ventana valores críticos, donde se informa (ver Ilustración 4‑2):

  • Del tipo y características de la distribución.
  • De la probabilidad en la cola derecha y de la probabilidad complementaria. Además, en las distribuciones simétricas, informa de la distribución en ambas colas. 
  • Del valor crítico.

Se puede utilizar la función critical del comando genr para guardar el valor crítico y tenerlo disponible para cálculos posteriores:
genr nueva variable = critical(tipo de distribución, parámetros de la distribución, nivel de significación)
El usuario debe tener en cuenta que dicha función hace referencia al área de la cola derecha.
En distribuciones simétricas:
- Para guardar el valor critico en ambas colas:
genr nueva variable = critical(tipo de distribución, parámetros de la distribución, [nivel de significación/2])
y el valor crítico de la cola izquierda:
genr nueva variable =  - critical(tipo de distribución, parámetros de la distribución, nivel de significación)
Algunos ejemplos:


# Valor critico, para un nivel de significación del 5%, de una distribución chi-cuadrado de 1 grados de libertad
? genr vcchi = critical(X,1,0.05)
Se ha generado el escalar vcchi = 3.84146

# Valor critico, para un nivel de significación del 5%, de una distribución F de Snedecor de 1 grados de libertad en el numerador y 16 grados de libertad en el denominador
? genr vcF = critical(F,1,16,0.05)
Se ha generado el escalar vcF = 4.494

# Valor critico, para un nivel de significación del 5% en la cola derecha, de una distribución normal reducida
? genr vczcd = critical(z,0.05)
Se ha generado el escalar vczcd = 1.64485

# Valor critico, para un nivel de significación del 5% en la cola izquierda, de una distribución normal reducida
? genr vczcd = - critical(z,0.05)
Se ha reemplazado el escalar vczcd = -1.64485

# Valor critico, para un nivel de significación del 5% en ambas colas, de una distribución normal reducida
? genr vcz2c = critical(z,0.025)
Se ha generado el escalar vcz2c = 1.95996

# Valor critico, para un nivel de significación del 5% en la cola derecha, de una distribución t de Student de 16 grados de libertad
? genr vct = critical(t,16,0.05)
Se ha generado el escalar vct = 1.74588

# Valor critico, para un nivel de significación del 5% en la cola izquierda, de una distribución t de Student de 16 grados de libertad
? genr vctci = -critical(t,16,0.05)
Se ha generado el escalar vctci = -1.74588

# Valor critico, para un nivel de significación del 5% en ambas colas, de una distribución t de Student de 16 grados de libertad
? genr vct2c = critical(t,16,0.025)
Se ha generado el escalar vct2c = 2.11991

P-valor

Para buscar el p-valor se puede utilizar el menú Herramientas de la Ventana Principal o el comando pvalue.
Al seleccionar la opción buscador de valores-p del menú Herramientas de la Ventana Principal se abre el cuadro de diálogo buscador de valor p, donde se debe elegir el tipo de distribución pinchando en el botón corresponiente (normal, t, χ2, F) y proporcionar la información que Gretl necesita en cada caso. Tal y como puede verse en los ejemplos recogidos en la Ilustración 4‑3, son varias las casillas que se deben ir rellenando, variando su número y contenido de unas distribuciones a otras. En todos los casos, en la casilla valor, se debe especificar el valor del estadístico cuyo p-valor se está buscando. En la distribución normal se debe especificar la media y desviación típica 2. En las distribuciones t, χ2 y F se deben especificar sus grados de libertad.
Una vez que se han rellenado todas las casillas del cuadro de diálogo buscador de valor p, se selecciona el botón "Aceptar" y aparece el resultado de la búsqueda en la ventana valor p donde se informa del tipo y características de la distribución (ver Ilustración 4‑3):

  • En las distribuciones χ2 y F de Snedecor, del área situada a la derecha del valor del estadístico y del área situada a su izquierda.
  • En las distribuciones normal y t de Student (distribuciones simétricas), del área en la cola derecha, en ambas colas y el complemento (área situada entre ambas colas). 

Nótese que la suma de todas estas áreas es siempre la unidad.
La otra opción para obtener los p-valores es escribir directamente el comando pvalue en la Consola Gretl o en un Archivo de comandos, para lo que es necesario que el usuario conozca su formato de escritura y las opciones disponibles.
El formato del comando pvalue es:
pvalue  tipo de distribución  parámetros de la distribución  valor del estadístico
En dicho comando se debe especificar:

  • El tipo de distribución, Gretl identifica la distribución t de Student por t, la por X y la F de Snedecor por F.
  • Los parámetros o grados de libertad de la distribución. Se debe tener en cuenta que en el caso de la distribución F será necesario especificar en primer lugar los grados de libertad del numerador y en segundo lugar los grados de libertad del denominador.
  • El valor del estadístico.

Gretl identifica la distribución normal reducida por z y en el comando pvalue no será necesario especificar ningún parámetro para identificar dicha distribución.
Además, se puede utilizar la función pvalue del comando genr para guardar el p-valor y tenerlo disponible para cálculos posteriores:
genr nueva variable = pvalue(tipo de distribución, parámetros de la distribución, valor del estadístico)
El usuario debe tener en cuenta que dicha función hace referencia al área de la cola derecha, por tanto, para guardar el p-valor para la cola izquierda se debe ejecutar el comando:
genr nueva variable = 1- pvalue(tipo de distribución, parámetros de la distribución, valor del estadístico)
En distribuciones simétricas, para guardar el p-valor en ambas colas:
genr nueva variable = 2* pvalue(tipo de distribución, parámetros de la distribución, valor del estadístico)
Algunos ejemplos :


# P-valor, para un valor de 3.84, de una distribución chi-cuadrado de 1 grado de libertad
? pvalue X 1 3.84
Chi-cuadrado(1): área a la derecha de 3.84 = 0.0500435
(a la izquierda: 0.949956)

? genr pvchi = pvalue(X,1,3.84)
Se ha generado el escalar pvchi = 0.0500435

# P-valor, para un valor de 4.49, de una distribución F de Snedecor de 1 grado de libertad en el numerador y 16 grados de libertad en el denominador
? pvalue F 1 16 4.49
F(1, 16): área a la derecha de 4.49 = 0.0500904
(a la izquierda: 0.94991)

? genr pvF = pvalue(F,1,16,4.49)
Se ha generado el escalar pvF = 0.0500904

 

# P-valor, para un valor de 1.64 en la cola derecha, de una distribución normal reducida
? pvalue z 1.64
Normal estándar: área a la derecha de 1.64 = 0.0505026
(valor a dos colas = 0.101005; complemento = 0.898995)

? genr pvzcd = pvalue(z,1.64)
Se ha generado el escalar pvzcd = 0.0505026

# P-valor, para un valor de 1.64 en la cola izquierda, de una distribución normal reducida
? pvalue z -1.64
Normal estándar: área a la derecha de -1.64 = 0.949497
(a la izquierda: 0.0505026)
(valor a dos colas = 0.101005; complemento = 0.898995)

? genr pvzci = 1-pvalue(z,-1.64)
Se ha generado el escalar pvzci = 0.0505026

# P-valor, para un valor de 1.96 en ambas colas, de una distribución normal reducida
? pvalue z 1.96
Normal estándar: área a la derecha de 1.96 = 0.0249979
(valor a dos colas = 0.0499958; complemento = 0.950004)

? genr pvz2c = 2*pvalue(z,1.96)
Se ha generado el escalar pvz2c = 0.0499958

? genr pvz2c = 2*(1-pvalue(z,-1.96))
Se ha reemplazado el escalar pvz2c = 0.0499958

# P-valor, para un valor de 1.74 en la cola derecha, de una distribución t de Student de 1 grado de libertad en el numerador y 16 grados de libertad en el denominador
? pvalue t 16 1.74
t(16): área a la derecha de 1.74 = 0.0505273
(valor a dos colas = 0.101055; complemento = 0.898945)

? genr pvt = pvalue(t,16,1.74)
Se ha generado el escalar pvt = 0.0505273

# P-valor, para un valor de 1.74 en la cola izquierda, de una distribución t de Student de 1 grado de libertad en el numerador y 16 grados de libertad en el denominador
? pvalue t 16 -1.74
t(16): área a la derecha de -1.74 = 0.949473
(a la izquierda: 0.0505273)
(valor a dos colas = 0.101055; complemento = 0.898945)

? genr pvtci = 1-pvalue(t,16,-1.74)
Se ha generado el escalar pvtci = 0.0505273

# P-valor, para un valor de 2.11 en la cola derecha, de una distribución t de Student de 1 grado de libertad en el numerador y 16 grados de libertad en el denominador
? genr pvt2c = 2*pvalue(t,16,2.11)
Se ha generado el escalar pvt2c = 0.0509572

# P-valor, para un valor de 2.11 en la cola derecha, de una distribución t de Student de 1 grado de libertad en el numerador y 16 grados de libertad en el denominador
? pvalue t 16 2.11
t(16): área a la derecha de 2.11 = 0.0254786
(valor a dos colas = 0.0509572; complemento = 0.949043)

? genr pvt2c = 2*pvalue(t,16,2.11)
Se ha generado el escalar pvt2c = 0.0509572

Regiones de Confianza

Para un subconjunto de (K-h) parámetros (bsub), la región de confianza viene dada por todos aquellos puntos que verifiquen:

En el caso particular de que el subconjunto paramétrico esté formado por un solo parámetro, a la región de confianza se le denomina intervalo de confianza y estará formado por todos aquellos puntos que pertenezcan al intervalo de la recta real:

La construcción de regiones de confianza es una forma alternativa de efectuar contrastes de hipótesis. Si el valor establecido en la hipótesis nula para el subconjunto paramétrico pertenece a la región de confianza se aceptará la hipótesis nula y en caso contrario se rechazará.

¿Cómo calcular intervalos y regiones de confianza en Gretl?

A través de la opción Intervalos de confianza para los coeficientes del menú Análisis de la Ventana Modelo se accede a la ventana intervalos de confianza para los coeficientes en la que Gretl proporciona para un nivel de significación del 5%, el valor crítico de una distribución t de Student cuyos grados de libertad coinciden con los del modelo 3, los estimadores de los parámetros y los intervalos de confianza para todos los parámetros que intervienen en el modelo.
Con la opción Elipse de confianza del menú Análisis de la Ventana Modelo se accede a la ventana contrastes de hipótesis donde, después de elegir dos variables 4 y el nivel de confianza, se accede a la Ventana gráfico, donde se muestra la elipse de confianza y los intervalos marginales de confianza para los parámetros seleccionados. Aunque por defecto, Gretl utiliza un nivel de confianza del 95% para construir la región de confianza, existe la posibilidad de cambiar dicho nivel en la construcción de las regiones de confianza conjunta y marginales.

¿Cómo utilizar el intervalo de confianza en el contraste de hipótesis?

La probabilidad de construir un intervalo de confianza que contenga el verdadero valor del parámetro es igual al nivel de confianza (1-α). Por tanto, construir un intervalo de confianza del (1-α)% para el parámetro genérico βi, significa que si se seleccionan 100 muestras de tamaño T y se construyen 100 intervalos de confianza, se espera que (1-α) de ellos contengan el verdadero valor del parámetro.
Los intervalos de confianza se pueden utilizar en los contrastes bilaterales. De manera que si el valor  que se establece para el parámetro en la hipótesis nula, pertenece al intervalo de confianza se aceptará dicha hipótesis para un nivel de significación α y, en caso contrario, se rechazará dicha hipótesis.
Aceptar una hipótesis no significa necesariamente que sea cierta, puede ocurrir que se tenga gran incertidumbre sobre el verdadero valor del parámetro y, en dicha situación, la aceptación tan sólo significa que con la información de la que se dispone no hay elementos de juicio suficientes para rechazar dicha hipótesis.

1 Por defecto, Gretl tiene seleccionadas las características de la distribución normal reducida, es decir, media nula y desviación típica unitaria.

2 Por defecto, Gretl tiene seleccionadas las características de la distribución normal reducida, es decir, media nula y desviación típica unitaria.

3 (T-K-1) para modelos formulados con ordenada en el origen y (T-K) para modelos formulados sin ordenada en el origen.

4 Las variables disponibles son las incluidas como variables independientes en el modelo.