Pulse aquí para acceder al índice general del libro. Pulse aquí para bajarse el libro completo en formato PDF comprimido ZIP (2,7 Mb) |
El tamaño empresarial como factor de diversidad
Alfonso Galindo Lucas
Capítulo III: OBTENCIÓN DEL FACTOR TAMAÑO
4.1. Base de datos
El marco de selección fue la base de datos SABI, donde se obtuvo la información económico-financiera y se comprobaron el resto de los datos relativos a las distintas empresas seleccionadas de forma aleatoria.
En la consulta que realizamos a esta base, se exigió disponibilidad de datos para al menos un año para cada una de las variables. En función de esta exigencia, se obtuvo datos de 20.771 empresas. Si el cumplimiento de esta condición no fuese independiente de las variables sometidas a análisis, se estaría asumiendo un sesgo que restaría fiabilidad a los procedimientos estadísticos. Por ejemplo, sería el caso de que las empresas de mayor o menor tamaño o antigüedad comunicasen al Registro una información más completa.
4.2. Estratificación
Para aquellos procedimientos descriptivos que no necesitasen el concurso de las variables cualitativas o para el cálculo de coeficientes de correlación y contrastes de contingencia, se utilizó, además de la muestra citada y por motivos de comparación, una muestra más grande, de 2150 empresas, obtenidas de forma estratificada en la base de datos SABI. Normalmente, no mostraremos los resultados obtenidos con esta muestra, al ser similares a los que ofrece la muestra menor. Esto puede ser indicio de que la muestra de 1.160 ha quedado bien estratificada o tal vez que los factores localización y sector no afectan a nuestras variables de análisis de tipo económico-financiero.
En general, las variables utilizadas para la estratificación deben estar correlacionadas con aquéllas que se estudian (García et al., 2002), hasta el punto que reproduzcan la variabilidad de estas últimas (Fernández y Mayor, 1994). En este caso, se estudian muchas variables, sin que, en principio, ninguna adquiera la condición de dependiente.
Por eso, el único motivo por el que es deseable mantener una proporción por zonas y por sectores similar a las poblacionales es para evitar posibles efectos de la localización geográfica o la actividad en la variabilidad de alguna de las variables. La muestra inicial había sido obtenido de forma estratificada, en función de las proporciones poblacionales de las empresas por Comunidades Autónomas (CC. AA.).
Los tamaños poblacionales de los estratos se obtuvieron del Directorio Central de Empresas (DIRCE) del Instituto Nacional de Estadística (INE), cerrado a fines de 2000, que es el penúltimo año consultado en SABI. Una vez obtenidos los datos poblacionales, se determinó el número mínimo de empresas a encuestar para cada estrato, por la siguiente fórmula:
... donde N es el tamaño poblacional del estrato, según el DIRCE y n0 viene dado por la siguiente expresión:
En ésta, la letra Z representa una distribución normal de media cero y desviación unitaria y el subíndice (1 - ½α) es el nivel de significación para el intervalo 2δ.
Como es habitual, se utilizó como criterio de obtención de dicho número el margen de error máximo en la estimación de una proporción, bajo el supuesto de mayor dispersión.
Es remarcable el hecho de que las proporciones poblacionales, según el DIRCE son más o menos similares a las de las empresas incluidas en la base de datos. Eso significa que un muestreo aleatorio simple en SABI mantendría, por término medio, las mismas proporciones.
No obstante, las 20.771 empresas de que se disponían datos de al menos un año para todas las variables tenían una distribución por CC. AA. menos parecida a la poblacional. Por ese motivo, se hizo un esfuerzo por respetar el muestreo estratificado, al completar la muestra en la base de datos SABI, a efectos de crear la muestra estratificada de comparación, de 2.150 empresas.
Esta restricción afecta poco a nuestra muestra de comparación, puesto que los estratos suelen ser suficientemente grandes como para muestrear en ellos. Con respecto a nuestra muestra de análisis, los porcentajes obtenidos finalmente también se presentan en la Tabla 12). En cuanto a la estratificación por sectores, también se respetó, a grandes rasgos, la contenida en la muestra inicial de AECA (Tabla 13).