LA DESILUSIÓN SEXENAL

Óscar Antonio Jiménez Morales

Cálculo de los tamaños de muestra, abstencionismo electoral, 2003

Para calcular el tamaño de una muestra hay que tomar en cuenta cuatro factores:
1.- El nivel de confianza (1- α) con el cual se quiere generalizar los datos desde la muestra hacia la población total.
2.- El porcentaje de error (α) que se pretende aceptar al momento de hacer la generalización (nivel de significancia).
3.- El nivel de variabilidad que se calcula para comprobar la hipótesis (p y q)
4.- El valor crítico de la distribución Z o de la distribución normal estandarizada (Z α/2) dado el nivel de confianza.
Debemos decir que la confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del cien por ciento equivale a decir que no existe ninguna duda para generalizar tales resultados, pero también implica estudiar a la totalidad de los casos de población.
Para evitar un costo muy alto para el estudio, o debido a que, en ocasiones, llega a ser prácticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de confianza menor. Comúnmente en las investigaciones sociales se busca un 95 por ciento de confianza.
Por lo regular se acepta entre el 4 y el 6 por ciento de error, tomando en cuenta que son complementarios la confianza y el error, en otras palabras si el área bajo la curva normal representa el 100% o bien la unidad y, si el 95% de esa área se encuentra “ocupada” por el nivel de confianza, luego entonces, el porcentaje de error sería del 5 por ciento.
La variabilidad es la probabilidad o porcentaje con el que se aceptó y se rechazó la hipótesis que se quiere verificar en alguna investigación anterior o en un ensayo previo a la investigación actual (prueba piloto). El porcentaje con que se aceptó tal hipótesis se denomina variabilidad positiva y se denota por p, y el porcentaje con el que se rechazó la hipótesis es la variabilidad negativa, denotada por q.
Debemos tomar en cuenta que, tanto p como q, son complementarios, es decir, que su suma es a igual a la unidad p + q = 1.
Además, cuando se habla de la máxima variabilidad, en el caso de no existir antecedentes o pruebas piloto sobre la investigación, como es el caso de la presente investigación, entonces los valores de variabilidad son: p = q = 0.5 o bien el 50 por ciento.
Por último, para calcular el valor crítico de la distribución Z, dado el nivel de confianza, debemos utilizar la siguiente tabla:

Cuadro 10
Niveles de confianza más utilizados con sus respectivos valores críticos para la curva normal estandarizada:

1- α Nivel de confianza	Z α/2 Valor crítico
90%	1.645
95%	1.96
98%	2.32
99%	2.57

Fuente: Freund, Johm y Gary Simon, Estadística elemental, México, D.F., Ed. Prentice may, 1992.

Para un nivel de confianza del 95% correspondería un valor crítico de Z de 1.96. Los valores críticos de la distribución Z son aquellos límites que separan la zona de aceptación (nivel de confianza) de la zona de rechazo (nivel de significancia) en una distribución normal como la mostrada en el gráfico 6. Dicho gráfico muestra que entre más grande sea una muestra de cierta distribución más se asemejará a una normal1. Una vez que se han determinado estos cuatro factores, entonces se puede calcular el tamaño de muestra utilizando la siguiente fórmula:

Fórmula para determinar el tamaño de muestra cuando se conoce el tamaño de la población:

n = (Z)² (p)(q)(N)
(N)(E)² + (Z)² (p)(q)

Dónde:

n: es el tamaño de la muestra
Z: es el valor crítico de Z dado el nivel de confianza
p: es la variabilidad positiva
q: es la variabilidad negativa
N: es el tamaño de la población
E: es la precisión o el error, dado el nivel de confianza2

Esta fórmula se utiliza para calcular el tamaño de muestra, siempre y cuando se conozca el tamaño de población, y como contamos con los tamaños de población por secciones, es decir, el número total de abstencionistas por cada unidad geográfica básica, entonces podremos saber cuántos abstencionistas encuestar en la totalidad de los FRA y, posteriormente, en cada uno de los 21 focos rojos de abstencionismo.
Por ejemplo, el primer tamaño de población correspondería a la sección 2993 del distrito 04 de Zapopan con 2265 abstencionistas. Si consideramos un nivel de confianza del 95 por ciento, entonces el valor crítico de Z que correspondería sería 1.96, ahora bien, como este experimento nunca se ha hecho y tampoco se ha piloteado, la variabilidad que corresponde es la máxima, en otras palabras tanto la variabilidad negativa como la positiva sería de .5 o de 50 por ciento.

Según este cálculo se precisaría encuestar a 328 abstencionistas electorales en la sección 2993 del distrito 04 de Zapopan.
Al proseguir con los cálculos de los tamaños de muestra de las siguientes secciones foco rojo, tendríamos los resultados expresados en el cuadro 11.

Cuadro 11

Cálculos de los tamaños de muestra seccional tomando para su cálculo el tamaño de población seccional, ZMG, elecciones federales, 2003.

Sección	Distrito electoral	% de abstencionismo	Tamaño de la población (N) (No. de abstencionistas)	Tamaño de muestra (n) (No. de abstencionistas)
2993	04, Zapopan	60.35	2265	328
3007	04, Zapopan	60.78	2410	331
3017	04, Zapopan	62.02	1550	308
3026	04, Zapopan	60.59	326	176
3152	06, Zapopan	59.90	2330	330
3154	06, Zapopan	62.89	4440	354
3157	06, Zapopan	60.11	1939	321
3223	06, Zapopan	60.97	1415	302
3232	06, Zapopan	63.82	1166	289
3233	06, Zapopan	90.79	1087	284
3293	07, Tonalá	66.74	297	168
3320	10, Zapopan	61.71	195	129
3323	10, Zapopan	63.64	259	155
925	14, Guadalajara	59.19	1337	298
3313	14, Guadalajara	60.99	866	266
3314	14, Guadalajara	63.08	410	198
2592	16, Tlaquepaque	59.20	1454	304
2599	16, Tlaquepaque	59.98	697	248
2600	16, Tlaquepaque	59.86	689	247
2604	16, Tlaquepaque	61.26	6535	263
3311	16, Tlaquepaque	61.70	356	185
Totales			32, 023	5,484

Fuente: Elaboración propia.

Como observamos en dicho cuadro, la sumatoria de los tamaños de muestra de cada una de las secciones consideradas “foco rojo” es de 5, 484 abstencionistas electorales. Debemos decir que ésta es una de las formas no tan afortunadas de calcular el tamaño total de muestra ya que al tener subpoblaciones pequeñas (abstencionistas en cada sección electoral), las muestras suelen ser grandes en términos proporcionales en comparación con sus universos correspondientes.
En este tenor, es mejor calcular el tamaño de muestra para este experimento tomando en cuenta a la población total cuyo tamaño es de N= 32,023 abstencionistas electorales. En esta tesitura, al tomar en cuenta el tamaño de población total (N) de los 21 focos rojos de abstencionismo electoral tenemos:

n = (1.96) ² (.5) (.5) (32023) ; n = 380
(32023) (.05) ² + (1.96) ² (.5) (.5)

El tamaño de muestra para este estudio es de n = 380 abstencionistas electorales.
A todas luces, este tamaño de muestra es mucho más manejable operativamente que 5, 484 abstencionistas dado que al tomar tamaños de población grandes, las muestras serán más pequeñas, empero, óptimas que garanticen el proceso de inferencia estadística3, por lo tanto, los tamaños de muestra por sección considerados en el cuadro 11 no serán tomados en cuenta para la ejecución de la prueba de hipótesis.
Ahora bien, si el tamaño de muestra total es de n = 380 para este experimento, ahora surge la pregunta: ¿cómo asignar un tamaño de submuestra para cada uno de los focos rojos de abstencionismo? En otras palabras, ¿cuántos abstencionistas se encuestarán en cada una de las secciones electorales seleccionadas?
La respuesta más correcta sería aplicar el procedimiento planteado por la teoría de los muestreos estratificados el cual establece que dado un tamaño de muestra, el cálculo de las submuestras debe hacerse en forma proporcional en cada uno de los estratos. Por lo tanto tomaremos a aquellos focos rojos o bien, a aquellas secciones electorales precisamente como estratos4.
En este tenor, procederemos a obtener las proporciones de colaboración de cada una de las secciones electorales con respecto al número total de abstencionistas (tamaño de población, N).
Acto seguido, las multiplicaremos por el tamaño de muestra definido, n = 380 y así obtener el tamaño de la submuestra correspondiente a ese foco rojo o sección electoral.

La fórmula nk = nPk nos indica el número de elementos dentro de una muestra que pertenecen a un estrato, es decir, en qué proporción participa cada uno de los estratos en la composición de la muestra. Los tamaños de muestra y los tamaños de muestra ajustados se presentan en el cuadro 12.
En dicho cuadro, podemos ver en la cuarta columna el número de abstencionistas electorales por cada uno de los focos rojos y en la quinta la proporción que le corresponde con respecto al total, es decir, se ha calculado la proporción de colaboración dividiendo cada total seccional de abstencionistas entre el total de los mismos (32,023), acto seguido, y como hemos indicado, dichas proporciones las multiplicamos por el tamaño total de muestra (380) y así obtenemos el número de abstencionistas electorales a encuestar en cada una de las secciones electorales seleccionadas.

Cuadro 12

Cálculo de los tamaños de muestra por sección electoral,
ZMG, comicios federales, 2003.

Sección	Distrito electoral	% de abstencionismo electoral	Tamaño de la población por sección (Nk) (No. de abstencionistas)	Prop. (Pk)	Tamaño de muestra (nk)	Tamaño de la muestra ajustada (nk) (No. de abstencionistas)
2993	04, Zapopan	60.35	2265	.0707	26.88	27
3007	04, Zapopan	60.78	2410	.0753	28.60	29
3017	04, Zapopan	62.02	1550	.0484	18.39	18
3026	04, Zapopan	60.59	326	.0102	3.87	4
3152	06, Zapopan	59.90	2330	.0728	27.65	28
3154	06, Zapopan	62.89	4440	.1387	52.69	53
3157	06, Zapopan	60.11	1939	.0606	23.01	23
3223	06, Zapopan	60.97	1415	.0442	16.79	17
3232	06, Zapopan	63.82	1166	.0364	13.84	14
3233	06, Zapopan	90.79	1087	.0339	12.90	13
3293	07, Tonalá	66.74	297	.0093	3.52	3
3320	10, Zapopan	61.71	195	.0061	2.31	2
3323	10, Zapopan	63.64	259	.0081	3.07	3
925	14, Guadalajara	59.19	1337	.0418	15.87	16
3313	14, Guadalajara	60.99	866	.0270	10.28	10
3314	14, Guadalajara	63.08	410	.0128	4.87	5
2592	16, Tlaquepaque	59.20	1454	.0454	17.25	17
2599	16, Tlaquepaque	59.98	697	.0218	8.27	8
2600	16, Tlaquepaque	59.86	689	.0215	8.18	8
2604	16, Tlaquepaque	61.26	6535	.2041	77.55	78
3311	16, Tlaquepaque	61.70	356	.0111	4.22	4
Totales			32, 023	1	380	380

Fuente: Elaboración propia
La séptima columna nos indica el tamaño de muestra ajustada por sección, en otras palabras, hemos convertido un número continuo a un número discreto, pues lógicamente no hay medios, o, enteros y fracción de ciudadanos abstencionistas.
Hemos operado, de tal manera que la sumatoria total del “tamaño de muestra ajustado” sea igual a 380.

1 (Kurtosis 3, e índice de asimetría = cero), siempre y cuando no se conozca el tamaño de la población, sin embargo, si se conoce el tamaño de la población, la muestra no tendrá que ser tan grande sino mas bien óptima que garantice el proceso de inferencia estadística.

2 Freund, Johm y Gary Simon, Estadística elemental, México, D.F., Ed. Prentice may, 1992.

3 Recordemos que el proceso de inferencia estadística es aquel en el que los resultados emanados de una muestra representativa pueden generalizarse hacia la población o universo designado de antemano por el investigador y que las condiciones de representatividad de una muestra son las siguientes: tamaño de muestra, la correspondencia de variables de la población en la muestra y la selección de los individuos o elementos de la muestra sobre la base de la aleatoriedad.

4 Los estratos pueden ser de cualquier índole, es decir pueden ser meramente poblaciones o bien de índole social, económica o política, pero para efectos de esta estrategia, el criterio de la estratificación será propiamente poblacional, en otras palabras, será la delineada ya por las secciones electorales definidas como “Focos Rojos de Abstencionismo”.

5 Freund, Johm y Gary Simon, Estadística elemental, Opus Citatum.

Volver al índice