Google
En toda la web
En eumed·net





6. Variables dependientes discretas y limitadas

 

Existen muchos fenómenos en la actividad económica que responden a elecciones discretas como la decisión de trabajar, la decisión de comprar una bien, la decisión de votar por un candidato, etc.

Para Amemiya (1981), existen dos factores que explican el interés en los modelos de respuesta cualitativa: Primero, los economistas trabajan con modelos que involucran más de una variable discreta, más de dos respuestas, y por supuesto, más de una variable independiente. Segundo, el creciente número de encuestas que se realizan y la posibilidad de trabajar los datos que éstas producen.

A continuación, se desarrollarán algunos modelos estadísticos cuyo objetivo consiste en facilitar la contrastación empírica de la teoría del consumidor. Estos modelos son el de probabilidad lineal, el Logit, el Probit y el Tobit en sus diferentes versiones. Luego se presentará una versión del modelo de autoselección de Heckman y, finalmente, el modelo de variables latentes.

(Para ver el capítulo completo en formato PDF pulse aquí)

6.1. Especificación del modelo

Suponga que usted desea considerar la ocurrencia de un evento como "comprar un carro"; para describir este evento, definiremos la variable aleatoria dicotómica Y, la cual tomará el valor de 1 si el evento ocurre y 0 si no ocurre. De igual forma, deberemos asumir que la probabilidad del evento depende sobre un vector de variables independientes x* y un vector de parámetros desconocidos . El subíndice i denota el i- ésimo individuo. De esta forma, un modelo general dicotómico univariado, se puede expresar como:

(Para ver el capítulo completo en formato PDF pulse aquí)

6.2. Formas comunes de las funciones de probabilidad

Considere el siguiente modelo de consumo de automóviles: el consumidor responderá Y=1 si compra el automóvil y Y=0 si no lo compra. Dado que nosotros consideraremos que los factores x*i, explican la decisión que toma el consumidor:

(Para ver el capítulo completo en formato PDF pulse aquí)

6.3. Estimación

A excepción del modelo de Probabilidad Lineal, los modelos Probit y Logit se estiman por máxima verosimilitud donde cada observación es extraída de una distribución de Bernoulli. El modelo con una probabilidad de suceso f('x) y observaciones independientes lleva a una probabilidad conjunta o a una función de verosimilitud de la forma:

(Para ver el capítulo completo en formato PDF pulse aquí)

6.4. Algunos modelos aplicados

En economía, la tradición de usar modelos Logit y Probit es extensa, aquí menciono tan sólo algunos modelos, quedando en deuda con el resto.

(Para ver el capítulo completo en formato PDF pulse aquí)

6.4.1. Domencich y McFadden

Considérese a un individuo que toma la decisión entre conducir o usar un método alternativo para ir al trabajo (autobús, metro, etc.). La utilidad que se asocia a cada forma de transporte, está en función de las características Z (principalmente el tiempo y el costo en que se incurre en cada elección) y las características individuales socioeconómicas w, más un término aleatorio de error . Definiendo i1 y i0 como la utilidad indirecta13 asociada a la i-ésima persona cuando conduce o toma otro transporte y cuando esta función es lineal:

(Para ver el capítulo completo en formato PDF pulse aquí)

6.4.2. Lee, L.F.

6.4.3. Pencavel

Pencavel estudia cómo inciden en las decisiones de trabajar de la esposa y el esposo la ayuda económica brindada por el gobierno de los Estados Unidos en Seattle y Denver. De esta forma, estima la probabilidad de trabajar de la esposa usando 1657 familias durante 2 años. Las variables que el autor usa son: F igual a uno si la familia pertenece al experimento y cero lo contrario; L igual a uno si el esposo trabaja durante el año anterior al experimento y cero lo contrario; Y igual a uno si la observación es extraída del segundo año de experimento y cero si es extraída del primer año; U igual a uno si el esposo estuvo desempleado durante el año. Se estimaron dos modelos: uno que reporta estimaciones bajo un modelo de probabilidad lineal y otro que estima un modelo Logit , como se observa a continuación:

(Para ver el capítulo completo en formato PDF pulse aquí)

6.5. Modelo de efectos fijos y aleatorios en datos de panel

Considérese el modelo estructural Probit para datos de panel:

Al condicionar las probabilidades a la suma en las dos observaciones se remueve la heterogeneidad existente. Por lo tanto, la función de verosimilitud condicional será el producto de los conjuntos de observaciones para los que la suma no es cero ni T.

(Para ver el capítulo completo en formato PDF pulse aquí)

6.6. El modelo Logit condicionado

Esta es una versión reciente para incluir los atributos presentes en los bienes. Suponga que exista un modelo de elección no ordenada que provenga de una utilidad aleatoria para el i- ésimo consumo en j elecciones. De esta forma, la utilidad de la elección j es:

(Para ver el capítulo completo en formato PDF pulse aquí)

6.7. Modelos multinomiales

Un modelo multinomial de respuesta cualitativa se define de la siguiente forma. Asuma que la variable dependiente yi toma mi + 1 valores {0, 1, 2, . . ., mi}, entonces el modelo multinomial vendrá dado:

(Para ver el capítulo completo en formato PDF pulse aquí)

6.8. Variables dependientes limitadas

Existe un gran número de datos cuya observación nos muestra que están limitados o acotados de alguna forma. Este fenómeno lleva a dos tipos de efectos: el truncamiento y la censura.

El efecto de truncamiento ocurre cuando la muestra de datos es extraída aleatoriamente de una población de interés, por ejemplo, cuando se estudia el ingreso y la pobreza se establece un valor sobre el cual el ingreso se encuentra por encima o por debajo del mismo. De esta forma, algunos individuos podrán no ser tenidos en cuenta. Por otro lado, censurar es un procedimiento en el cual los rangos de una variable son limitados a priori por el investigador; este procedimiento produce una distorsión estadística similar al proceso de truncamiento.

(Para ver el capítulo completo en formato PDF pulse aquí)

6.8.1. Truncamiento

Una distribución truncada es la parte de una distribución no-truncada antes o después de un valor específico; imagínese por ejemplo que nosotros deseamos conocer la distribución de los ingresos anteriores a 100.000 o el número de viajes a una zona mayores de 2, ésta será tan sólo una parte de la distribución total.

(Para ver el capítulo completo en formato PDF pulse aquí)

6.8.2. Censuramiento

Un procedimiento normal con datos microeconómicos, consiste en censurar la variable dependiente. Cuando la variable dependiente es censurada, los valores en un determinado rango son todos transformados a un valor singular. De esta forma, si definimos una variable aleatoria y transformada de la variable original como:

(Para ver el capítulo completo en formato PDF pulse aquí)

6.8.3. Modelos Tobit

Los modelos Tobit se refiere a modelos censurados o truncados donde el rango de la variable dependiente se restringe de alguna forma. El problema puede verse como:

(Para ver el capítulo completo en formato PDF pulse aquí)

6.9. Contrastes de especificación

De la mano con el desarrollo de las formas de estimación de los modelos, la literatura ha venido ofreciéndonos una serie de contrastes para conocer la "bondad" de los modelos estimados. El origen de estos contrastes se remonta a los trabajos de Rao (1947) en lo que se conoce como "contraste Score" o "contraste de puntuación". Posteriormente Silvey (1959) propone el contraste de multiplicadores de Lagrange que no es otra cosa que el mismo contraste de Rao.

El contraste de multiplicadores de Lagrange no es el único que se pueda usar, pues están el de Hausman (1978) y el contraste de momentos condicionales [Newey (1985) y Tauchen (1985)]. Para Pagan y Vella (1989) el uso del contraste de especificación en variables dependientes limitadas no es muy común debido a la dificultad computacional de los mismos.

Los contrastes de especificación que se desarrollarán serán: El contraste de Rao ó contraste de puntuación; el contraste de especificación de Hausman, el cual parte de los trabajos de Durbin (1954) y por lo tanto se conoce también como Durbin-Hausman o Durbin-Wu-Hausman debido a los trabajos de Wu (1973); el contraste de la matriz de información de White (1982) y el contraste de momentos condicionales sugerido por Newey (1985) y Tauchen (1985).

(Para ver el capítulo completo en formato PDF pulse aquí)

6.9.1. Contraste de Rao ó contraste de puntuación

6.9.2. El contraste Durbin-Hausman

6.9.3. El contraste de la matriz de información de White

6.9.4. El contraste de momentos condicionados (CM)

6.9.5. Contrastes de heterocedasticidad

6.9.6. Contrastes de normalidad

6.9.7. Contraste de correlación contemporánea

6.9.8. Contraste de sesgos de selección

6.9.9. Contraste de estabilidad

6.9.10. Contraste de exogeneidad

(Para ver el capítulo completo en formato PDF pulse aquí)

6.10. Variables latentes

Las variables latentes representan conceptos unidimensionales en su más pura forma, puede decirse que se trata de variables abstractas como inteligencia, paisaje, etc. Como todas las variables latentes corresponden a conceptos, ellas son variables hipotéticas que varían en su grado de abstracción: inteligencia, clase social, poder y expectativas son variables latentes abstractas creadas en la teoría. Variables menos abstractas son la educación y el tamaño de la población.

Un ejemplo es la hipótesis de Emile Durkheim sobre la relación inversa entre la cohesión social y el suicidio: la cohesión social se refiere a la solidaridad de grupo, la cual es una variable abstracta; el suicidio es directamente observable, pero la relación directaindirecta es muy débil de acuerdo con la misma clasificación de los suicidios.

Un modelo latente se acompaña de un conjunto de ecuaciones estructurales que resumen las relaciones entre las variables latentes. Bollen (1989) usa las relaciones entre la democracia política y la industrialización en países desarrollados, para introducir la noción de modelos de variables latentes. Dado que algunas sociedades han alternado entre dictaduras y regímenes electorales, es difícil discernir si la asociación realmente existe. La democracia política se refiere a la extensión de los derechos políticos (imparcialidad de las elecciones) y libertades políticas (libertad de prensa) en un país. La industrialización es el grado en el cual la economía de una sociedad se caracteriza por el proceso de manufactura mecanizado, esto implica riqueza social, población educada, avances en el estándar de vida, y éstas son las oportunidades de una democracia.

Suponga que se tienen tres variables latentes aleatorias: democracia política en 1965 y 1960 e industrialización en 1960. Uno podría asumir que la democracia política en 1965 es una función de la democracia política e industrialización de 1960. No existe nada que nos diga que el nivel de industrialización es una variable latente exógena (independiente) y se simboliza como 1, esta es exógena, en tanto sus causas están por fuera del modelo. La variable democracia política es una variable latente endógena, ella está determinada por variables en el modelo, cada variable latente es representada por i. De esta forma, la democracia política en 1960 es representada por 1 y la democracia política en 1965 por 2, las variables latentes endógenas son parcialmente explicadas en el modelo y el componente no explicado i es un término aleatorio; de esta forma, el modelo de variables latentes para el ejemplo será:

(Para ver el capítulo completo en formato PDF pulse aquí)

6.10.1. Ecuaciones estructurales con variables observadas

6.10.2. La Matriz de covarianzas

6.10.3. Identificación

6.10.4. Estimación

(Para ver el capítulo completo en formato PDF pulse aquí)

 


Bibliografía

AIGNER, D.J AND GOLDBERGER. (1977). Latent variables in socioeconomic models, North Holland.  

AMEMIYA, T. (1994). Introduction to statistics and econometrics, Harvard University Press.  

–––––––. (1981). "Qualitative response models: a survey", Journal of economics history, vol. XIX, pp. 1483-1536.  

–––––––. (1974). " Tobit models : A Survey ", Journal of econometrics, 24, pp- 3-63.  

ANDERSON, G.J. (1987). "Prediction test in limited dependent variable models", Journal of econometrics, 34, pp.253-61.  

BERA, A.K., JARQUE, C.M. Y L.F, LEE. (1984). "Testing the normality assumption in limited dependent variable models", International economic review, 25, pp.563-78.  

BLUNDELL, R. AND C, MEGHIR. (1986). "Selection criteria for microeconomic model of labor supply", Journal of applied econometrics, 1, pp.55-82.  

BOLLEN, K. (1989). Structural equations with latent variables, John Wiley Sons.Inc.  

BRANNAS, K AND T, LAITILA. (1989). "Heterocedasticity in the tobit model", Statistical papers, 30, pp.185-196.  

BREUSH, T.S AND A.R, PAGAN. (1980). "The lagrange multiplier test and its applications to model specification in econometrics", Review of economic studies, 47, pp. 239-53.  

BYRON, R.P. (1969) " A simple model for estimation demand systems under separable utility assumptions". Review of economic studies, pp. 261-274.  

CESARIO, F.J. AND J. L, KNETSH. (1970). "Time bias in recreation benefit estimates", Water resources research, 6, pp.700-704.  

CHAMBERS, E.A AND COX, D.R. (1967)."Discrimation between alternative binary response models". Biometrika. Vol 4, nums (3-4), pp. 573-78.  

CHAMBERLAIN, G. (1980). "Analysis of covariance with qualitative data". Review of economic studies, Jan, pp. 225-38.  

CHESHER, A.D. (1984). "Testing for neglected hetoregeneity", Econometrica, vol. 52, pp.865- 72.  

–––––––, LANCASTER, T. AND M. IRISH. (1985). "On detecting the failure of distributions assumptions", Annals de L´INSEE, 59, pp. 7-44.  

COX, D.R. (1983). "Some remarks on overdispersion", Biometrika , 70,pp.269-74.  

DAVIDSON, R AND J.G, MACKINNON. (1989). "Testing for consistency using artificial regressions" Econometric Theory, 5, pp.363-84.  

–––––––.(1984). "Convenient specification test for Logit and Probit models", Journal of econometrics, 25, pp. 241-62.  

DOMENCICH, T.A AND D, MCFADDEN. (1975). Urban travel demand, Amsterdam, North holland.  

DUDLEY, L. AND MONTMARQUETLE, C. (1976). " A model of the supply of bilateral foreign aid" American economic review, March pp.132-42.  

DURBIN, J. (1954). "Errors in variables", Review of the international statistical institute, 22, pp.22-32.  

EYE VON, A AND C, CLOGG. (1994). Latent variable analysis: Applications for development research, Sage Publications.  

GOLDBERGER, A.S. (1983). "Abnormal selection bias" en Karlin, Amemiya y Goodman (comps.), Studies in econometrics, Time series and multivariate analysis, New York, Academic Press.  

GAURIÉROUX, C.A, MONFORT, E.R Y A, TROGNON. (1987). "Generalized residuals", Journal of econometrics, 34, pp.5-32.  

GREEN, W.H. (1999). Análisis econométrico, Tercera edición, Prentice Hall Iberia.  

GROGGER, C. (1991). "Model for truncated counts", Journal of applied econometrics, vol. 6, pp. 225-38.  

GROGGER, J. (1990). "A simple test for exogeneity in probit, logit and poisson regression models", Economics letters, 33, pp. 329-32.  

GRONAU R. (1976). "The allocation time of Israel women". Journal of Political economic, Aug, pp.201-20.  

HAUSMAN, J. (1978). "Specification test in econometrics", Econometrica, vol.46, pp.1251-71.  

HALL, W.J AND D.J, MATHIASON. (1990). "On large sample estimation and testing in parametric models", International statistical review, 58, pp.77-97.  

HARVEY, A. (1976). "Estimating regression models with multiplicative heteroskedasticity". Econometric, 44, pp. 461-465.  

HECKMAN, J. (1979). "Sample selection bias as a specification error", Econometrica, 47, pp.153-61.  

–––––––-.(1998). "Detecting discrimination", The journal of economic perspectives, vól 12, num.2, pp. 101-18, spring.  

–––––––. (1974). "Shadow prices, market wages and labor supply", Econometrica, 42, pp.679-94.  

HOFFMAN, D AND A.R, PAGAN. (1989). "Post-sample prediction test for generalized method of moments estimators", Oxford bulletin of economics and statistics, 51, pp. 333-44.  

HOROWITZ, J.L AND G.R, NEUMAN. (1989). "Specification testing in censored regression models: parametric and semiparametric methods", Journal of applied econometrics, 4, pp.s61- s86.  

KEALY, M.J AND R.C, BISHOP. (1986). "Theoretical and empirical specifications issues in travel cost demand studies", American journal of agricultural economics, august, pp. 660-67.  

KIEFER, N.M. (1982). "Testing for dependence in multivariate Probit models", Bometrika, 69, pp.161-6.  

LANCASTER, T. (1984). "Test of specification in econometrics", Econometrics review, 3, pp.211- 42.  

LEE, L.F. (1978). "Unionism and wage rates : A simultaneous equations model with qualitative and limited dependent variables. International economic review Jun, pp. 415-34.  

MCDONALD, J. A, AND D.A CLELLAND. (1984). "Textile workers and union sentimen". Social Forces 63; pp.502-521.  

MCFADDEN, D. (1974). "Conditional logit analysis of qualitative choice behavior" in fronters in econometrics edited by P. Zarembka, New York: Academic Press, pp. 105-42.  

–––––––-.(1981). "Econometric models of probabilistic choice", in structural analysis discrete date, edited by C.F Mansky and D. McFadden. Cambridge Mass: Mit Press.  

MACKINNON, J.G. (1992). "Model specification test and artificial regressions", Journal of economic literature, vol. 30, pp.102-46.  

MACREALY, G AND C.M, DAYTON. (1994). "Latent class model for longitudinal assessment of trait acquisition", en Alexander Von Eye, Clifford C Clogg (comps.), Latent variable analysis: application for development research.  

MADDALA, G.S. (1995) "Specification test in limited dependent variable models" en Phillips, P.C.B.,  

NELSON, F. "Censored regression models with unobserved stochastic censoring thresholds". Econometric 6, pp.309-327.  

NELSON, F Y L.. OLSON. "Specification and estimation of a simultaneous equation model with limited dependent variables". International economic review, Oct , pp.695-710.  

PAGAN, A. R AND PARK, Y. (1993). "Testin for heteroskedasticity in G.S maddala". C.R Rao an H.D vinod (eds), Handook of Statistic Vol. 11 Amsterdam : North-Holland, pp.489-518.  

PENCAVEL, J.H. (1979). "Market work decisions and unemployment of husbands and wives in the seatle and Denver income maintenance experiments". Mimeographed. April.  

RAO, C.R AND MITRA, S.K. (1971). "Generalid inverses of matrices and its applications, New York : Wiley.  

SRINVASAN, T.N (comps. ), Advances in econometrics and qualitative variables, Basil Blackwell.  

––––––– (1994) Econometrics methods and applications, Volume II, Edward Edgar Publishing.  

––––––– (1983) Dependent and qualitative variables in econometrics, Cambridge, Cambridge University Press.  

––––––– PHILLIPS, P.C.B., SRINVASAN, T.N (1995). Advances in econometrics and qualitative variables, Basil Blackwell.  

–––––––, AND F.D, NELSON. (1975). "Specification errors in limited dependent variable models" NBER Working paper series, No 96.  

–––––––, AND L.F, LEE. (1985). "The common structure of test for selectivity bias, serial correlation, heterocedasticity and non-normality in the Tobit model", International economic review, 26,pp.1-20  

MELINO, A. (1982). "Testing for sample selection bias ", Review of economic studies, 49, pp.151-3.  

MORA, J.J. (1997). "Aspectos microeconómicos del paisaje", Boletín Socioeconómico, núm. 30, pp.81-97.  

––––––– (2001). El efecto de las características socioeconómicas sobre la consistencia en la toma de decisiones: Un análisis experimental, Borradores de Economía y Finanzas, 01, mayo, Universidad Icesi.  

NAWATA, K. (1993a). "A note on the estimation of models with sample selection biases", Economic letters, 42, pp.15-24.  

––––––– (1993b). "Estimation of sample selection biases models", Manuscript, Dept of economics, University of Western, Australia.  

NEWEY, W.K. (1985). "Maximum likelihood specification testing and conditional moment test", Econometrica, vol. 53, pp.1047-73.  

––––––– (1987). "Specification test for distributional assumptions in the Tobit model", Journal of econometrics, vol. 34, pp.125-45.  

OLSEN, R. (1982). "Distributional test for selectivity bias and more robust likelihood estimator", International economic review, 23, pp. 233-40.  

ORME, R.J. (1990) "The small-sample performance of the information matrix test", Journal of econometrics, 46, pp.309-31.  

––––––– (1992). "Efficient score test for heterocedasticity in microeconometrics", Econometrics review, 11, pp. 235-52.  

PAGAN, A.R AND F, VELLA. (1989). "Diagnostic test for models based on unit record data: a survey", Journal of applied econometrics, 4, pp. 175-94.  

–––––––, AND Y, PARK. (1993). "Testing for heterocedasticity " en G.S.Maddala., C.R. Rao and H. D. Vinod (comps.) Handbook of statistic, vol.11, Amsterdam: North-Holland, pp.489- 518.  

POWELL, J.L. (1986). "Symmetrically trimmed least squares estimation for Tobit models", Econometrica, vol. 54, pp.1435-60.  

PREGINON, D. (1980). " Goodness of link test for generalized linear models", Applied statistics, 29, pp.15-24.  

RAO, C.R. (1947) "Large sample test of statistical hypothesis concerning several parameters with applications to problems of estimation", Proceedings of the Cambridge philosophical society, 44, pp.50-7.  

––––––– (1973). Linear statistical inference and its applications, New York, John Wiley and Sons.  

––––––– AND MITRA, S.K. (1971). Generalized inverses of matrices and its applications, New York, John Wiley and Sons.  

RUUD, P.A. (1984). "Test of specification in econometrics", Econometric reviews, 3, pp.211-42.  

SCHMID, P. AND STRAUSS, R.P (1975). " The prediction of occupation using multiple logit model". International economic review; June, pp. 47-86.  

SILVEY, S.D. (1959). "The lagrangian multiplier test", Annals of mathematical statistics, núm 7.pp.389-407.  

SKEELS, C.L AND F, VELLA. (1993). The performance of conditional moment test in Tobit and Probit models. ANU, Camberra.  

SMITH, R. (1989). "On the use of distributional misspecification checks in limited dependent variable models", Economic journal, supplement, 99, pp.178-92.  

–––––––, AND BLUNDELL, R. (1986) "An exogeneity test for simultaneous equation Tobit model with application to labor supply", Econometrica, vol. 54, pp. 679-85.  

WEDDERBURN. (1976). "Quasi-likelihood functions, generalized linear models, and the gauss newton method", Biometrika, vol.61, num. 3, pp. 439.  

WESTIN, R.B AND GUILLEN, D.W. (1978)." Parking location and transit demand : A case study of endogenous attributes in disaggregate mode choice functions". Journal of econometric, 8, pp. 75-101.  

TAYLOR, L. (1991). "Testing exclusion restricctions for misspecified Tobit model", Economics letters, 37, pp.411-16.  

TAUCHEN, G. (1985). "Diagnostic testing and evaluation of maximum likelihood models", Journal of econometrics, 30, pp.415-43.  

TUKEY, J.W. (1949). "One degree of freedom for non-additivity", Biometrics, 5, pp. 232-242.  

WHITE, H. (1982). "Maximum likelihood estimation of misspecified models", Econometrica, vol 50, pp.1-25.  

WU, D.M. (1973). "Alternative test of independence between stochastic regressors and disturbances", Econométrica, vol.41, pp.134-39.

 

(Para ver el capítulo completo en formato PDF pulse aquí)


Jhon James Mora R.
Departamento de Economía,
Universidad ICESI
e-mail: jjmora@icesi.edu.co
http:\\www.icesi.edu.co\~jjmora