INTRODUCCIN A LA METODOLOGA DEL LA INVESTIGACIN

INTRODUCCIN A LA METODOLOGA DEL LA INVESTIGACIN

Hctor Luis vila Baray

Volver al ndice

 

Elementos de Estadstica Inferencial

a) Anlisis de Varianza. El anlisis de varianza (ANOVA) es una tcnica estadstica diseada para comparar la varianza de dos poblaciones a partir del anlisis de las varianzas de las muestras respectivas. Webster (1998) aplica el concepto de ANOVA al contexto de un experimento y la define como ... el procedimiento que se puede aplicar a la determinacin de si un tratamiento en particular aplicado a una poblacin tendr efecto significativo sobre su media, (p. 595). Aplicar el ANOVA requiere cumplir con dos criterios especficos:

a1) Las poblaciones de estudio deber ser normales y tener varianzas iguales.

a2) Seleccionar las muestras independientemente.

La varianza total de todos los tratamientos (observaciones) se puede dividir en dos fuentes:

a) Variacin Intermuestral. Factor que representa la variacin entre los diversos tratamientos administrados durante el desarrollo de un experimento.

b) Variacin Intramuestral o debida al Error. Factor que representa la variacin dentro de un mismo tratamiento administrado durante la realizacin de un experimento.

En este contexto se entiende que la variacin total es igual a la variacin intermuestral + la variacin intramuestral o debida al error. Para obtener la comprobacin de una hiptesis de nulidad mediante el ANOVA se tienen que calcular los siguientes factores:

a) La suma total de cuadrados expresada por la ecuacin:

donde:

b) La suma de los cuadrados entre grupos (varianza intermuestral) se expresa por la ecuacin:

donde:

xi2 = Suma de los cuadrados entre los grupos

X1)2 = Suma de las puntuaciones elevadas al cuadrado del tratamiento1

n = Nmero de casos

c) La suma de cuadrados dentro de grupos (varianza intramuestral) se expresa por la ecuacin:

donde:

Xd2 = Suma de cuadrados dentro de grupos

X12 = Suma de los cuadrados de las puntuaciones del grupo 1

X1)2 = Suma de las puntuaciones elevadas al cuadrado del tratamiento1

Lo anterior refleja que se cuentra con tres varianzas y solo es posible realizar la comparacin de la varianza intermuestral con la varianza intramuestral mediante el anlisis del comportamiento de las mismas con respecta a la distribucin F que supone la independencia de las varianzas. La distribucin F se expresa por la ecuacin:

donde:

F = Distribucin F.

d) Los grados de libertad para la varianza del error se obtienen mediante la ecuacin:

donde:

gl = grados de libertad

c = columnas

e) Los grados de libertad para la varianza intramuestral se obtienen por medio de la ecuacin:

donde:

gl = grados de libertad

c = columnas

n = nmero de casos

Para ejemplificar el ANOVA se tomarn los datos siguientes: Con el propsito de determinar que las medias de las puntuaciones obtenidas por tres grupos de menonitas provenientes de los campos menonitas del municipio de Riva Palacio, Chih., en un experimento de lectura veloz en indioma espaol utilizando un vocabulario tcnico-cientfico. El rendimiento de cada uno de los grupos se muestra en la Tabla 4.5.

Para obtener la razn F se recomienda elaborar la siguiente tabla a fin de facilitar el anlisis de resultados:

La razn F crtica para 2 y 15 grados de libertad a un nivel  = 0.05 se obtiene

consultando el apndice B. Para el presente caso tiene un valor de F = 3.68. La interpretacin requiere de aplicar la regla de decisin: Si la razn F calculada es mayor que la razn F crtica entonces se rechaza la hiptesis nula, en caso contrario se acepta.

Para el problema anterior la razn F calculada es de 0.44 valor que esta muy por debajo de la razn F crtica con valor de 3.68 para  = 0.05 por consiguiente es posible aceptar la hiptesis de nulidad concluyendo que no existe evidencia de que las tres medias de calificaciones obtenidas por los grupos en lectura veloz sean diferentes.

b) Anlisis Multifactorial de Varianza. El anlisis multifactorial de varianza (ANCOVA) tambin denominado anlisis de covarianza permite la comparacin de ms de dos variables entre si con el propsito de comprobar tanto el efecto de las variables como el efecto de interaccin entre ellas.

El ANCOVA es utilizado para analizar los resultados de investigaciones de tipo experimental que aplican un diseo factorial (ver seccin 3.4 del captulo III). En este tipo de diseos se analizan los efectos combinados de dos o ms variables independientes. Para realizar un ANCOVA se necesita obtener:

b1) La suma total de cuadrados mediante la ecuacin 4.11.

b2) La suma de cuadrados entre grupos mediante la ecuacin 4.12.

b3) La suma de cuadrados dentro de grupos mediante la ecuacin 4.13.

b4) La suma de cuadrados entre columnas que se define por la ecuacin:

donde:

Xec2 = suma de cuadrados entre columnas

nc1 = nmero de casos en la columna 1.

N = nmero total de casos

b5) La suma de cuadrados entre hileras que se expresa matemticamente mediante la ecuacin:

donde:

Xer2 = suma de cuadrados entre hileras

nr1 = nmero de casos en la hilera 1.

N = nmero total de casos

b6) La suma de la interaccin de los cuadrados ... es la parte de la desviacin entre las medias de los grupos y la media total que no se debe ni a las diferencias de las hileras ni a las diferencias de las columnas, (DAry, Jacobs y Razavieh, 1982, p. 164). Se define matemticamente mediante la expresin:

donde:

Xint2 = suma de cuadrados entre hileras

Xi2 = suma de cuadrados entre grupos

Xec2 = suma de cuadrados entre columnas

Xer2 = suma de cuadrados entre hileras

b7) Determinar el nmero de grados de libertad asociados a cada puntuacin de variacin:

1 Suma de cuadrados entre columnas utilizando la ecuacin 4.15

2 Suma de cuadrados entre hileras mediante la ecuacin:

donde:

gl = grados de libertad

r = hileras

3 Suma de la interaccin de los cuadrados por medio de la expresin:

donde:

gl = grados de libertad

c = columnas

r = hileras

4 Suma de cuadrados entre grupos mediante la ecuacin:

donde:

gl = grados de libertad

G = grupos

5 Suma total de cuadrados definido por la expresin:

donde:

gl = grados de libertad

N = columnas

b8) Obtencin de la razn F mediante la ecuacin 4.14.

Para ejemplificar el ANCOVA se aplicar el procedimiento al siguiente caso: Se desea investigar como influye un programa de incentivacin econmica en la productividad de la mano de obra de una compaa de servicios de impresin, formando cuatro grupos de trabajadores aleatoriamente. Los integrantes de dos de los grupos son menores de 24 aos y los integrantes del resto del grupo mayores de 24 aos. Los datos obtenidos se muestran en la Tabla 4.7.

los calculos son:

para obtener la razn F se sugiere disear la siguiente tabla con el propsito de facilitar el anlisis:

Para la varianza entre columnas la razn Fo = 5.69  Fc = 4.49 por consiguiente no se acepta la hiptesis de nulidad. La razn F calculada (Fo) es significativa a nivel  = 0.05. Para la varianza entre hileras la razn Fo = 15.13  Fc = 4.49 por lo que no se acepta la hiptesis nula. La razn F es altamente significativa a nivel  = 0.05. Para la varianza de la interaccin la razn Fo = 15.03  Fc = 4.49 por lo que no se acepta la hiptesis de nulidad. La razn F es altamente significativa a nivel  = 0.05. Los anteriores resultados permiten concluir que existe evidencia estadstica para establecer como conclusin que la incentivacin econmica tiene influencia significativa en el aumento de la productividad de los empleados de la compaa de servicios de impresin. Este efecto se presenta tanto en trabajadores menores de 24 aos como en los mayores de 24 aos.

c) La Distribucin Xi2. La Xi2 (chi cuadrada) es una prueba de estadstica no paramtrica que se utiliza para la contrastacin de hiptesis. De acuerdo con Webster (1998) las pruebas no paramtricas son procedimientos estadsticos que se pueden utilizar para contrastar hiptesis cuando no es posible fijar ningn supuesto sobre parmetros o distribuciones poblacionales, (p. 836). Las aplicaciones de la prueba Xi2 son dos: c1) las pruebas de bondad del ajuste y c2) las pruebas de independencia.

c1) Xi2 de bondad del ajuste. Esta prueba se utiliza para apreciar si las distribuciones observadas se ajustan a las esperadas. La prueba es adecuada para realizar pruebas de variancia sin que interese el tipo de distribucin que tiene (Glass y Stanley, 1994; Kazmier, 1998).

Lo anterior significa que esta prueba permite determinar si los datos empricos de alguna distribucin especfica corresponde a una distribucin terica como la binomial, la poisson o la normal. Se emplea en el muestreo con el propsito de precisar si los valores obtenidos de una muestra corresponden a las frecuencias poblacionales (ver Hopkins, Hopkins y Glass, 1997; Kazmier, 1998).

Para Webster (1998) presenta una definicin muy completa de las pruebas de bondad del ajuste. ... estas pruebas miden el grado en que los datos muestrales observados cumplen una distribucin hipottica determinada. Si el grado de cumplimiento es razonable, se puede deducir que la distribucin hipottica existe, (p. 838).

La hiptesis de nulidad en la prueba de bondad del ajuste se expresa:

Ho: fo = fe. (No hay diferencia entre las frecuencias observadas y las esperadas)

H1: fo = fe. (Existe diferencia entre las frecuencias observadas y las esperadas.

Para someter a prueba estas hiptesis se utiliza la expresin matemtica:

donde:

Xi2= prueba chi cuadrada

k = nmero de categoras o clases

fo = frecuencias observadas

fe = frecuencias esperadas

Para ejemplificar la Xi2 de bondad del ajuste se utilizarn los siguientes datos: El Sr. David Neufeld es gerente de ventas de la fbrica de queso menonita tipo chester ubicada en la Colonia Manitoba en la regin noroeste del Estado de Chihuahua. En particular el Sr. Neufeld tiene que desplazar la produccin de queso en el mercado nacional. Recientemente se da cuenta de la existencia de una fuerte competencia de otras marcas de queso provenientes de otras entidades del pas y del extranjero. Le resulta cada vez ms difcil comercializar la produccin de queso y decide someter a comprobacin la hiptesis de nulidad a un nivel  = 0.05:

Ho: fo = fe. La demanda real es uniforme a la esperada

H1: fo = fe. La demanda real no es uniforme a la esperada.

el Sr. Neufeld toma como muestra el volumen de ventas mensual en toneladas de queso correspondientes a un periodo de 12 meses. Las frecuencias son:

El valor de Xi2 es:

Con el propsito de analizar e interpretar el valor encontrado de Xi2 se necesita obtener los grados de libertad. Para ello se utiliza la expresin matemtica:

donde:

gl = grados de libertad

n = nmero de casos

para el anterior problema los gl = 11. Posteriormente se obtiene el valor de Xi2 crtica(consultar apndice C) aplicando la regla de decisin: Se rechaza la hiptesis nula s Xi2 calculada  Xi2 crtica, no se rechace en caso contrario. Para el caso anterior se puede concluir que Xi2 calculada = 42.57  Xi2 crtica =19.675 a nivel  = 0.05 por consiguiente no se acepta la hiptesis de nulidad que expresa que la demanda de queso menonita tipo chester en el mercado nacional es uniforme. Las diferencias entre la demanda observada y la esperada son significativas por lo que es posible refutar la hiptesis de nulidad.

c2) Xi2 de Independencia. Es una excelente herramienta estadstica para comprobar la independencia de variables categricas. Analiza dos factores con el propsito de determinar la existencia o no de relacin entre ellos. Para lo anterior utiliza tablas de tabulaciones cruzadas o de contingencia (ver seccin 4.3 del captulo IV).

As por ejemplo si se analizar el rendimiento de alumnos con resultados por arriba o por debajo del promedio en la prueba coeficiente intelectual se estaran comparando dos factores: rendimiento y coeficiente intelectual. La Xi2 de independencia aplica la ecuacin 4.23 para analizar la diferencia entre las frecuencias observadas y las esperadas.

Para ilustrar esta prueba se utilizar un ejemplo segn el cual a una muestra aleatoria de 90 estudiantes recin egresados y prximos a egresar de educacin media superior se les pregunta si prefieren estudiar una carrera profesional en la Universidad Autnoma de Chihuahua (UACH), en el Instituto Tecnolgico de Cd. Cuauhtmoc (ITCC) o si tienen preferencia por alguna Institucin de Educacin Superior Particular. Los resultados se muestran en la Tabla 4.9.

como puede observarse la Tabla 4.9 contiene 6 casillas integradas por tres columnas y dos hileras. Para realizar la comparacin se plantea la hiptesis:

Ho: fo = fe. No existe preferencia por alguna institucin especfica

H1: fo = fe. Existe preferencia por alguna institucin especfica.

para someter a comprobacin la hiptesis de nulidad se elige un nivel de

 = 0.05 procedindose a obtener las frecuencias esperadas en funcin de las frecuencias observadas por medio de operaciones aritmticas. Se multiplica el valor de cada casilla por el total de la columna dividido por el total de casos.

As por ejemplo la frecuencia esperada de los estudiantes que prefieren la UACH es 20 (36/90) = 8. Se realiza la misma operacin para obtener el resto de frecuencias esperadas. La Tabla 4.10 presenta las frecuencias esperadas.

el valor de Xi2 es:

Finalmente se compara el valor de Xi2 observada con el valor de Xi2 crtica. Para lo cual se requiere obtener los grados de libertad mediante la expresin:

donde:

gl = grados de libertad

r = nmero de renglones en la tabla

c = nmero de columnas en la tabla

por consiguiente los grados de libertad son gl = (2 1) (3 1) = 2 que a un nivel  = 0.05 el valor de Xi2 crtica es de 5.99. Como Xi2=87.20 Xi2 crtica = 5.99 es posible afirmar con cierto grado de confianza que existen diferencias significativas acerca de la relacin de la variable estudiantes recien egresados y prximos a egresar de educacin media superior y la variable preferencia por alguna institucin de educacin superior. La hiptesis de nulidad no se acepta a