Regresión con Variables Dummy

BIBLIOTECA VIRTUAL de Derecho, Economía y Ciencias Sociales

MANUAL DE APLICACIÓN DEL MODELO DE REGRESIÓN LINEAL MULTIPLE CON CORRECIONES DE ESPECIFICACIÓN, USOS DE STATA 9.0,STATA 10.0, EVIEWS 5.0, SSPS 11.0

Rafael David Escalante Cortina y otros

Esta página muestra parte del texto pero sin formato.

Puede bajarse el libro completo en PDF comprimido ZIP (67 páginas, 850 kb) pulsando aquí

Regresión con Variables Dummy

Al realizar análisis de regresión, la variable dependiente y las independientes no solamente pueden estar dadas por variables cuantitativas, existen otros tipos de variables de carácter cualitativo. Dichas variables se conocen comúnmente como Variables: Dummys, categóricas, dicótomas, binarias, ficticias o cualitativas.

Usualmente, dichas variables indican la presencia o ausencia de una cualidad o atributo, como por ejemplo sexo, raza, color, religión, etc. Estas son variables que toman valor de 1 en una submuestra y 0 en el resto de la muestra. Si el número de submuestras es mayor a dos, se define una variable ficticia para cada una de ellas, tomando valor de 1 en dicha sudmuestra y el valor de 0 en el resto de las observaciones muéstrales. Las variables ficticias pueden ser nominales y ordinales.

Al incluir variables dummys en un modelo de regresión, estimar sus coeficientes y llevar a cabo los contrastes de significancia de las variables, es equivalente a estimar los modelos restringido y no restringido (Novales, 1993), explicados en la clase anterior.

A continuación, se relacionan ejemplos de modelos estimados con variables cualitativas, con el fin de analizar significancia individual de los betas, y mencionar la interpretación de los coeficientes estimados. Asimismo, se pretende analizar los cambios que se presentan en el intercepto y pendiente de la regresión estimada.

Ejercicios:

1. Modelo de regresión simple con una sola variable dummy

La expresión general de este modelo, esta dada por:

Donde:

, es la variable dependiente.

, es la variable explicativa dummy.

Estimamos en stata el siguiente modelo:

Donde:

, es el salario/hora en dólares.

, es la variable dummy que representa el sexo de las personas, y toma los valores de:

cuando la persona es mujer.

cuando la persona es hombre.

, es el parámetro que define la diferencia entre el salario/hora de las mujeres y hombres. Si el coeficiente , las mujeres ganan (dado que la categoría base es hombre), en promedio, menos que los hombres.

NOTA: Si una variable dummy tiene categorías, se debe introducir en el modelo a estimar, variables cualitativas. Lo anterior, con el fin de evitar la trampa de la variable dicótoma, es decir, la situación de multicolinealidad perfecta. En el ejemplo a realizar, la variable tiene dos categorías (hombre ó mujer) y, por lo tanto, se introducirá solamente una variable dummy. Teniendo en cuenta lo anterior, siempre se deberá tomar una categoría como base, con el fin de comparar las estimaciones realizadas con respecto a esa categoría.

Salida en stata: reg wage female

Source | SS df MS Number of obs = 526

-------------+------------------------------ F( 1, 524) = 68.54

Model | 828.220467 1 828.220467 Prob > F = 0.0000

Residual | 6332.19382 524 12.0843394 R-squared = 0.1157

-------------+------------------------------ Adj R-squared = 0.1140

Total | 7160.41429 525 13.6388844 Root MSE = 3.4763

------------------------------------------------------------------------------

wage | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

female | -2.51183 .3034092 -8.28 0.000 -3.107878 -1.915782

_cons | 7.099489 .2100082 33.81 0.000 6.686928 7.51205

------------------------------------------------------------------------------

De la salida anterior se puede decir varias cosas.

Primero:

La intercepción es el salario promedio de los hombres de la muestra (cuando ), de modo que ellos, en promedio, ganan 7.1 dólares por hora.

Segundo:

El salario promedio de las mujeres es 4.59 (7.1-2.51) dólares por hora.

Y tercero:

El coeficiente de , es la diferencia en el salario promedio entre hombres y mujeres, es decir la mujeres, en promedio, ganan 2.51 dólares menos que los hombres. A este coeficiente se le puede llamar coeficiente de intercepción porque dice que tanto difiere el valor del termino de intercepto de la categoría que recibe el valor de 1, del coeficiente del intercepto de la categoría base.

Sin embargo, para saber si el es estadísticamente significativo, y así poder concluir con certeza que los hombres ganan, en promedio, más que las mujeres, realizamos la prueba de significancia individual de la variable :

-8.3 -1,96 1,96

Ahora, dado que el t tabla con un nivel de significancia de 5% y 526 grados de libertad es 1.96, se puede apreciar en el gráfico, que el (-8.3) cae en la región de rechazo, por lo tanto hay evidencia suficiente para rechazar la hipótesis nula, es decir, el es estadísticamente diferente a cero y la variable es significativa, luego se puede decir que las mujeres, en promedio, ganan 2.5 dólares por hora menos que los hombres. De igual forma, en la salida en stata se puede evidenciar que el p-valor de la variable es 0.0000, lo cual indica que la variable es estadísticamente significativa al 1%.

NOTA: En general, la regresión simple con una constante y una variable dummy es una forma directa de comparar las medidas de dos grupos; para este ejemplo, entre el salario de las mujeres y los hombres. Geométricamente, se podría dar que:

Para el caso de este modelo, se observa un cambio en intercepto. Como el beta que acompaña la variable es negativo ( ), se tiene un menor nivel de salario por hora de las mujeres con respecto a los hombres.

Al correr el modelo anterior, tomando como la categoría base a las mujeres, es decir, dando el valor de 1 a los hombres y 0 a las mujeres se obtiene:

Salida en stata: reg wage hombre

Source | SS df MS Number of obs = 526

-------------+------------------------------ F( 1, 524) = 68.54

Model | 828.220467 1 828.220467 Prob > F = 0.0000

Residual | 6332.19382 524 12.0843394 R-squared = 0.1157

-------------+------------------------------ Adj R-squared = 0.1140

Total | 7160.41429 525 13.6388844 Root MSE = 3.4763

------------------------------------------------------------------------------

wage | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

hombre | 2.51183 .3034092 8.28 0.000 1.915782 3.107878

_cons | 4.587659 .2189834 20.95 0.000 4.157466 5.017852

------------------------------------------------------------------------------

Se puede observar, que el coeficiente estimado para la variable , presenta signo contrario al modelo anterior estimado con la variable . De igual forma, se evidencia que el intercepto ha cambiado, ahora el intercepto representa el salario/hora de las mujeres (cuando ).

Retomando el concepto de la trampa de variable dicótoma, existe una forma de evitarla diferente a incluir categorías dentro del modelo. Para esto, consideremos el siguiente modelo de regresión a través del origen:

Donde:

, es el salario/hora en dólares.

, es una variable dummy que toma los valores de:

cuando la persona es mujer.

cuando la persona es hombre.

, es una variable dummy que toma los valores de:

cuando la persona es hombre.

cuando la persona es mujer.

Salida en stata: reg wage female hombre exper, noconstant

Source | SS df MS Number of obs = 526

-------------+------------------------------ F( 3, 523) = 534.06

Model | 19184.0401 3 6394.68002 Prob > F = 0.0000

Residual | 6262.25231 523 11.9737138 R-squared = 0.7539

-------------+------------------------------ Adj R-squared = 0.7525

Total | 25446.2924 526 48.3769817 Root MSE = 3.4603

------------------------------------------------------------------------------

wage | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

female | 4.145462 .2845875 14.57 0.000 3.586387 4.704537

hombre | 6.626882 .2862475 23.15 0.000 6.064546 7.189218

exper | .0269163 .0111369 2.42 0.016 .0050379 .0487948

------------------------------------------------------------------------------

Como se puede observar en la salida, ahora el y no representan el efecto diferencial entre el salario de las mujeres y hombres. Los valores de los coeficientes estimados, son el salario promedio/hora de las mujeres y hombres respectivamente.

Sin embargo, es importante tener en cuenta que la practica común es asignar las variables dicótomas de tal manera que si una variable tiene categorías, se introducen solamente ( ) variables dicotómicas (Gujarati, 2001). Lo anterior, teniendo en cuenta que al utilizar dicho enfoque se obtiene un valor usual del , mientras que con el modelo sin intercepto , se tendría que calcular lo que se conoce como el simple. Asimismo, cuando se considera a priori un modelo sin intercepto, se puede estar cometiendo un error de especificación, violando así uno de los supuestos del modelo clásico de regresión lineal.

2. Modelo de regresión múltiple con una sola variable dummy y una variable cuantitativa.

La expresión general de este modelo, esta dada por:

Donde:

, es la variable dependiente.

, es la variable explicativa dummy.

, es la variable explicativa cuantitativa.

Para realizar un ejemplo, trabajaremos con la base de datos WAGE1.RAW.

Estimamos en stata el siguiente modelo:

Donde:

, es el salario/hora en dólares.

, es la variable dummy que representa el sexo de las personas, y toma los valores de:

cuando la persona es mujer.

cuando la persona es hombre.

, es la variable que representa los años de experiencia de la persona.

, es el parámetro que define la diferencia entre el salario/hora de las mujeres y hombres, dado los mismos niveles de experiencia. Si, manteniendo constante la experiencia, el coeficiente , las mujeres ganan, en promedio, menos que los hombres, dado un mismo nivel de experiencia.

Salida en stata: reg wage female exper

Source | SS df MS Number of obs = 526

-------------+------------------------------ F( 2, 523) = 37.51

Model | 898.161983 2 449.080991 Prob > F = 0.0000

Residual | 6262.25231 523 11.9737138 R-squared = 0.1254

-------------+------------------------------ Adj R-squared = 0.1221

Total | 7160.41429 525 13.6388844 Root MSE = 3.4603

------------------------------------------------------------------------------

wage | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

female | -2.48142 .3022793 -8.21 0.000 -3.07525 -1.887589

exper | .0269163 .0111369 2.42 0.016 .0050379 .0487948

_cons | 6.626882 .2862475 23.15 0.000 6.064546 7.189218

------------------------------------------------------------------------------

De la salida anterior se puede decir varias cosas.

Primero:

Por cada año de experiencia que tengan los hombres (cuando ), su salario promedio, aumenta en 6.64 (6.62+0.02) dólares hora

Segundo:

Por cada año de experiencia que tengan las mujeres (cuando ), su salario promedio, aumenta en 4.16 (6.62+0.02-2.48) dólares hora. Es decir, que las mujeres ganan menos que los hombres, para un mismo nivel de experiencia.

Y tercero:

El coeficiente de , es la diferencia en el salario promedio entre hombres y mujeres manteniendo un mismo nivel de experiencia, es decir la mujeres, en promedio, ganan 2.51 dólares menos que los hombres.

Sin embargo, para saber si el y son estadísticamente significativos, y así poder concluir con certeza que un año de experiencia de trabajo en los hombres aporta mas a su salario, que un año de experiencia de las mujeres, tenemos que realizar la prueba de significancia individual de las variables y .

-8.21 -1,96 1,96

Ahora, dado que el t tabla con un nivel de significancia de 5% y 526 grados de libertad es 1.96, se puede apreciar en el gráfico, que el (-8.21) cae en la región de rechazo, por lo tanto hay evidencia suficiente para rechazar la hipótesis nula, es decir, el es estadísticamente diferente a cero y la variable es significativa. De igual forma, en la salida en stata se puede evidenciar que el p-valor de la variable es 0.0000, lo cual indica que la variable es estadísticamente significativa al 1%.

Ahora:

-1,96 1,96 2.42

Ahora, dado que el t tabla con un nivel de significancia de 5% y 526 grados de libertad es 1.96, se puede apreciar en el gráfico, que el (2.42) cae en la región de rechazo, por lo tanto hay evidencia suficiente para rechazar la hipótesis nula, es decir, el es estadísticamente diferente a cero y la variable es significativa. De igual forma, en la salida en stata se puede evidenciar que el p-valor de la variable es 0.016, lo cual indica que la variable es estadísticamente significativa al 1%.

Al igual que en el ejemplo anterior, se puede estimar un modelo de regresión sin intercepto con el fin de enviar la trampa de la variable dicotómica. Considérese el siguiente modelo:

Salida en Stata: reg wage female hombre exper, noconstan

Source | SS df MS Number of obs = 526

-------------+------------------------------ F( 3, 523) = 534.06

Model | 19184.0401 3 6394.68002 Prob > F = 0.0000

Residual | 6262.25231 523 11.9737138 R-squared = 0.7539

-------------+------------------------------ Adj R-squared = 0.7525

Total | 25446.2924 526 48.3769817 Root MSE = 3.4603

------------------------------------------------------------------------------

wage | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

female | 4.145462 .2845875 14.57 0.000 3.586387 4.704537

hombre | 6.626882 .2862475 23.15 0.000 6.064546 7.189218

exper | .0269163 .0111369 2.42 0.016 .0050379 .0487948

------------------------------------------------------------------------------

Se puede observar que los coeficientes estimados representan el salario promedio de las mujeres y los hombres, dado un nivel de experiencia.

3. Modelo de regresión múltiple con una sola variable dummy y dos o más variables cuantitativas

Al modelo del ejemplo anterior, le agregaremos una variable explicativa cuantitativa.

Nuestro modelo a estimar ahora será:

Donde:

, es el salario/hora en dólares.

, es la variable dummy que representa el sexo de las personas, y toma los valores de:

cuando la persona es mujer.

cuando la persona es hombre.

, es la variable que representa los años de experiencia de la persona.

, es la variable que representa la antigüedad de la persona en el trabajo.

, es la variable que representa los años de experiencia de la persona al cuadrado.

, es la variable que representa la antigüedad de la persona en el trabajo al cuadrado.

Salida en stata: reg wage female exper tenure expersq tenursq

Source | SS df MS Number of obs = 526

-------------+------------------------------ F( 5, 520) = 37.84

Model | 1910.28805 5 382.057611 Prob > F = 0.0000

Residual | 5250.12624 520 10.0963966 R-squared = 0.2668

-------------+------------------------------ Adj R-squared = 0.2597

Total | 7160.41429 525 13.6388844 Root MSE = 3.1775

------------------------------------------------------------------------------

wage | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

female | -1.998933 .2837282 -7.05 0.000 -2.556328 -1.441539

exper | .2003255 .039522 5.07 0.000 .1226832 .2779678

tenure | .2521445 .0542485 4.65 0.000 .1455714 .3587176

expersq | -.0049574 .0008445 -5.87 0.000 -.0066166 -.0032983

tenursq | -.0037726 .0018635 -2.02 0.043 -.0074335 -.0001117

_cons | 4.79956 .347897 13.80 0.000 4.116104 5.483017

De acuerdo con la salida en Stata, todos los betas estimados que acompañan a las variables explicativas, son estadísticamente significativos. Se observa, que los t calculados son caen en la región de rechazo comparado con un t tabla con 526 g.l. y igual a 1.96, es decir, se rechaza la hipótesis nula, por tanto se puede decir que los betas son estadísticamente diferentes de cero.

En cuanto a la interpretación de los coeficientes estimados, se puede decir que las mujeres ganan en promedio menos que los hombres manteniendo constantes las demás variables; un año de experiencia y/o antigüedad, proporciona mayor salario/hora a los hombres y las mujeres, manteniendo constantes el resto de variables.

La interpretación de las variables estimadas al cuadrado, permite establecer que la experiencia y la antigüedad presentan rendimientos marginales decrecientes, es decir, que a medida que aumenta la experiencia y antigüedad de las personas, aumenta el salario/hora, hasta un punto en el cual después disminuye.

4. Modelo de regresión múltiple con dos variables dummy y una variable cuantitativa.

Continuando con la base de datos WAGE.RAW, estimaremos el siguiente modelo:

Donde:

, es el salario/hora en dólares.

, es la variable dummy que representa el sexo de las personas, y toma los valores de:

cuando la persona es mujer.

cuando la persona es hombre.

, es la variable dummy que representa el estado civil de las personas, y toma los valores de:

cuando la persona es casada.

cuando la persona no casada.

, es la variable que representa la antigüedad de la persona en el trabajo.

Salida stata: reg wage female tenure married

Source | SS df MS Number of obs = 526

-------------+------------------------------ F( 3, 522) = 46.41

Model | 1507.68441 3 502.561468 Prob > F = 0.0000

Residual | 5652.72989 522 10.8289845 R-squared = 0.2106

-------------+------------------------------ Adj R-squared = 0.2060

Total | 7160.41429 525 13.6388844 Root MSE = 3.2907

------------------------------------------------------------------------------

wage | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

female | -1.976333 .2953181 -6.69 0.000 -2.556491 -1.396176

tenure | .1354407 .0207625 6.52 0.000 .0946523 .1762291

married | .9131324 .3051762 2.99 0.003 .313608 1.512657

_cons | 5.596056 .2989656 18.72 0.000 5.008732 6.183379

------------------------------------------------------------------------------

De acuerdo con la salida en Stata, los , y que acompañan a las variables , y respectivamente, son estadísticamente significativos, pues vemos que su p-valor asociado al estadístico t son 0.00. Además se evidencia que los t calculados son -6.69, 6.52 y 2.99 respectivamente, caen en la región de rechazo comparado con un t tabla con 526 g.l. y igual a 1.96, es decir se rechaza la hipótesis nula, por tanto estadísticamente el y son diferentes de cero.

Como se puede observar en la salida anterior, el p valor asociado a la F es de 0.0000, lo cual indica que el modelo presenta una significancia global inclusive al 1%.

En cuanto a la interpretación de los coeficientes estimados, se tiene que las mujeres, ganan en promedio, menos que los hombres, independientemente si son casadas o no, manteniendo constante la antigüedad; y las personas casadas, gana en promedio, mas que los solteros, ya sean de sexo masculino ó femenino, dado un mismo nivel de antigüedad.

Teniendo en cuenta lo anterior, tenemos que:

El salario promedio de un hombre soltero dado un nivel de antigüedad en el trabajo, esta dado por:

El salario promedio de una mujer soltera dado un nivel de antigüedad en el trabajo, esta dado por:

El salario promedio de un hombre casado, dado un nivel de antigüedad en el trabajo, esta dado por:

El salario promedio de una mujer casada, dado un nivel de antigüedad en el trabajo, esta dado por:

5. Modelo de regresión múltiple con varias variables dummy (con una variable cualitativa de tres o cuatro categorías)

Considérese el siguiente modelo:

Donde:

, es el salario/hora en dólares.

, es la variable dummy que representa el sexo de las personas, y toma los valores de:

cuando la persona es mujer.

cuando la persona es hombre.

, es la variable dummy que representa el estado civil de las personas, y toma los valores de:

cuando la persona es casada.

cuando la persona no casada.

, es la variable dummy que representa si la persona vive en el norte, y toma los valores de:

cuando la persona vive en el norte.

cuando la persona no vive en el norte.

, es la variable dummy que representa si la persona vive en el sur, y toma los valores de:

cuando la persona vive en el sur.

cuando la persona no vive en el sur.

, es la variable dummy que representa si la persona vive en el occidente, y toma los valores de:

cuando la persona vive en el occidente.

cuando la persona no vive en el occidente.

NOTA: La categoría base para el sector donde viven las personas son las personas que viven en el oriente.

Salida: reg wage female married northcen south west

Source | SS df MS Number of obs = 526

-------------+------------------------------ F( 5, 520) = 21.55

Model | 1228.99076 5 245.798152 Prob > F = 0.0000

Residual | 5931.42353 520 11.4065837 R-squared = 0.1716

-------------+------------------------------ Adj R-squared = 0.1637

Total | 7160.41429 525 13.6388844 Root MSE = 3.3774

------------------------------------------------------------------------------

wage | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

female | -2.337965 .2994471 -7.81 0.000 -2.92624 -1.74969

married | 1.417395 .3068326 4.62 0.000 .8146113 2.020179

northcen | -.6532592 .4281555 -1.53 0.128 -1.494386 .1878678

south | -1.161885 .398185 -2.92 0.004 -1.944134 -.379636

west | .3794599 .4747887 0.80 0.425 -.5532799 1.3122

_cons | 6.666695 .3917518 17.02 0.000 5.897084 7.436305

------------------------------------------------------------------------------

De la salida anterior se puede observar varias cosas:

- Dado que el intercepto representa la categoría base, se incluyen variables dummys solo para 3 de las 4 categorías del sector donde viven las personas, con el fin de no caer en la trampa de la variable dicótoma (multicolinealidad perfecta).

- Las variables y no son significativas al 10%; por lo tanto, se puede decir que no existe diferencia en el salario promedio, entre las personas que viven en estos sectores y los que viven en el oriente (la categoría base).

- Teniendo en cuenta que la variable es estadísticamente significativa (p-valor 0.004), se puede decir que las personas que viven en el sur, ganan en promedio, 1.16 dólares menos que los que viven en el oriente, manteniendo constantes las demás variables.

6. Modelo de regresión múltiple con una interacción de dummys.

Considérese el siguiente modelo:

Con:

, es el salario/hora en dólares.

, es la variable dummy que representa el sexo de las personas, y toma los valores de:

cuando la persona es mujer.

cuando la persona es hombre.

, es la variable dummy que representa el estado civil de las personas, y toma los valores de:

cuando la persona es casada.

cuando la persona no casada.

, es la variable que representa los años de experiencia de la persona.

, es la variable que representa la antigüedad de la persona en el trabajo.

Salida stata: reg wage female educ exper tenure

Source | SS df MS Number of obs = 526

-------------+------------------------------ F( 4, 521) = 74.40

Model | 2603.10658 4 650.776644 Prob > F = 0.0000

Residual | 4557.30771 521 8.7472317 R-squared = 0.3635

-------------+------------------------------ Adj R-squared = 0.3587

Total | 7160.41429 525 13.6388844 Root MSE = 2.9576

------------------------------------------------------------------------------

wage | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

female | -1.810852 .2648252 -6.84 0.000 -2.331109 -1.290596

educ | .5715048 .0493373 11.58 0.000 .4745803 .6684293

exper | .0253959 .0115694 2.20 0.029 .0026674 .0481243

tenure | .1410051 .0211617 6.66 0.000 .0994323 .1825778

_cons | -1.567939 .7245511 -2.16 0.031 -2.991339 -.144538

------------------------------------------------------------------------------

En cuanto a la interpretación de los coeficientes estimados, se puede decir que las mujeres ganan en promedio menos que los hombres manteniendo constantes las demás variables; un año de experiencia, educación y/o antigüedad en el trabajo, proporciona mayor salario/hora tanto a los hombres como las mujeres, manteniendo constantes el resto de variables.

De otro lado, en este modelo esta implícito el supuesto de que el efecto diferencial de la variable dummy es constante a través del posible estado civil de las personas (casado y no casado). Por ejemplo, en la salida anterior se observa que las mujeres ganan en promedio menos que los hombres, esto se da ya sea casada o no.

En muchas aplicaciones, este supuesto puede ser imposible de mantener, una mujer puede ganar mas cuando es casada que cuando es soltera. Con el fin de observar este efecto dentro del modelo, se adiciona la variable , que representa la interacción entre las variables y .

Por lo tanto, se estima ahora el siguiente modelo:

Donde:

, es la variable dummy que representa la interacción entre las variables sexo y estado civil de las personas, y toma los valores de:

cuando la persona es mujer casada.

para el resto de la muestra.

Salida stata: reg wage female educ exper tenure femalemarried

Source | SS df MS Number of obs = 526

-------------+------------------------------ F( 5, 520) = 60.41

Model | 2630.9083 5 526.181659 Prob > F = 0.0000

Residual | 4529.50599 520 8.71058845 R-squared = 0.3674

-------------+------------------------------ Adj R-squared = 0.3613

Total | 7160.41429 525 13.6388844 Root MSE = 2.9514

------------------------------------------------------------------------------

wage | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

female | -1.447194 .3335762 -4.34 0.000 -2.102517 -.7918717

educ | .5808792 .0495127 11.73 0.000 .4836097 .6781487

exper | .0297398 .0117984 2.52 0.012 .0065613 .0529182

tenure | .1398767 .0211268 6.62 0.000 .0983724 .181381

femalemarr~d | -.6826192 .3820906 -1.79 0.075 -1.43325 .0680118

_cons | -1.756788 .7307182 -2.40 0.017 -3.19231 -.3212652

------------------------------------------------------------------------------

De la salida anterior, ahora se tiene una interpretación adicional, la de la variable con efecto interacción:

La expresión anterior, perite establecer el salario/hora promedio de las mujeres casadas, manteniendo constante el resto de variables.

Cambios en intercepto y cambios en pendientes

Considérese en siguiente modelo:

Donde:

Salario de las personas

Nivel de escolaridad

Sexo, 1 = Mujeres, 0 los hombres

Regresiones paralelas: Cambio en intercepto e igual pendiente: Cuando ó , y significativos, no es significativo.

Regresiones concurrentes: Igual intercepto, cambio en pendiente: Cuando ó significativos, y .

Regresiones no similares: Cambio en intercepto y pendiente: , y significativos.

En la gráfica (a), la intercepción de las mujeres es menor a la de los hombres, pero la pendiente es mayor para las mujeres. Esto significa que las mujeres ganan menos que los hombres en los niveles inferiores de educación, pero la brecha se cierra a medida que aumenta el grado de escolaridad. En algún, punto los hombres y las mujeres ganan igual, y después las mujeres ganan mas que los hombres, dados los mimos niveles de educación.

La gráfica (b), muestra el caso en el que la intercepción de las mujeres es menor que la de los hombres, y la pendiente de la línea de las mujeres es menor que la de los hombres. Esto significa que las mujerees ganan menos que los hombres en cualquier nivel de escolaridad

Regresiones coincidentes: igual intercepto y pendiente: , .

GRAFICAS EN STATA

Consideremos el siguiente ejemplo:

Si queremos graficar los puntos de esta regresión en el plano cartesiano, donde esta representado en el eje X y en el eje Y, se utiliza el siguiente comando:

scatter wage exper

Ahora, si se quiere adicionar a la gráfica titulo a la gráfica y los nombres a cada uno de los ejes, se utiliza el comando title:

scatter wage expe, title(Salario Vs. Experiencia) xtitle(A. Experiencia) ytitle(WAGE)

Por último, si se quiere adicionar la línea de tendencia, se utiliza el comando:

twoway (scatter wage exper) (lfit wage exper), title(Salario Vs. Experiencia) xtitle(A. Experiencia) ytitle(WAGE)