Autores como García Sánchez (2008) explican que el análisis de conglomerados o cluster, que vamos a desarrollar a continuación, permite agrupar a los elementos en tipos o grupos, homogéneos internamente, pero heterogéneos entre sí, de acuerdo con la selección de criterios o bases de la segmentación, efectuada anteriormente como bases de entrada en el análisis.
En este contexto, se intentará estudiar en este apartado la agrupación o segmentación de las empresas cárnicas españolas en grupos homogéneos o característicos denominados clusters o clases, en terminología anglosajona, según el valor que, según ellas, añade la trazabilidad al producto y su vínculo con la cadena de valor, los factores económicos, los despilfarros, la valoración de sus actividades desagregadas y la valoración de sus ventajas, configurando cinco análisis clúster diferentes. De esta forma, se trata de ver la estructura de estas características, intereses y opiniones en un conjunto de empresas, para establecer una tipología de éstas con respecto a los factores citados.
Tras generar los clusters con técnicas jerárquicas y no jerárquicas como por ejemplo los algoritmos de Johnson o de K-medias, probados con distinta cantidad de conglomerados, nos hemos decantado por el algoritmo de Howard-Harris y la agrupación en cinco clusters, por ser el resultado que daba una mayor suma de cuadrados explicada por la participación en grupos, aparte de producir una mejor información para el análisis posterior.
Según Santesmases Mestre (2005), el algoritmo de Howard-Harris es un método utilizado en el análisis de grupos para generar grupos homogéneos. Este algoritmo sería de tipo descendente (breaking down), es decir, que divide de forma secuencial el conjunto de individuos de la muestra, que compone el grupo inicial, en un fenómeno cada vez mayor de grupos (2, 3, 4, 5…) para minimizar la varianza intragrupos y maximizar la varianza intergrupos de las variables. A diferencia de otros, esta técnica puede aplicarse a grandes muestras y, de hecho, Santesmases Mestre (2005) la recomienda si se dispone de ellas.
Vamos a comentar algunos indicadores comunes a los análisis realizados:
En primer lugar, se puede ver en la tabla V.13 una estimación de la suma de cuadrados explicada por la partición en grupos de la muestra en cada uno de los análisis anteriormente expuestos. Esta estimación de la suma de cuadrados explicada supera el 50% en todos los casos exceptuando el último, que sería el único caso en el que no se cumple este primer requisito. El segundo (Incremento de la varianza explicada respecto al número inmediatamente superior de clúster inferior o igual al 5%) se cumple en todos los casos.
TABLA V.13. ANÁLISIS DE LA VARIANZA PARA LOS ANÁLISIS REALIZADOS |
|||
Tipos de análisis |
Suma cuadrados del total de la muestra |
Suma cuadrados intragrupos (de todos los grupos) |
Suma de cuadrados explicada por la partición en grupos |
Análisis con respecto a la cadena de valor |
4.907,25 |
1.784,38 |
63,64% |
Análisis de variables económicas |
3.472,41 |
1.475,02 |
57,52% |
Análisis de los posibles despilfarros |
4.346,53 |
2.121,52 |
51,19% |
Análisis de las actividades desagregadas de trazabilidad. |
19.767,64 |
9.854,24 |
50,15% |
Análisis de las ventajas de la trazabilidad. |
6.818,34 |
3.916,84 |
42,55% |
Fuente: Elaboración propia. |
Todos los tests F de Snedecor, presentados en las tablas de cada análisis clúster realizado, suponen el rechazo de la hipótesis de igualdad de las medias a un nivel del 1% (p=0,0000), que implica que las diferencias entre los valores medios son significativas a un nivel del 1% y que al menos un grupo tendrá media diferente del resto de los clusters generados. Cada factor tendría así un comportamiento diferenciado con respecto a cada uno de los conglomerados.
También hemos realizado algunas pruebas estadísticas a raíz de la aplicación del análisis discriminante a los conglomerados obtenidos, para generar la matriz de confusión que pretende validar la formación de los mismos. Algunas de estas pruebas son específicamente propias de este análisis discriminante y se han llevado a cabo con el objetivo de comprobar la bondad o exactitud de la clasificación en grupos planteada en los resultados obtenidos.
En primer lugar, se puede ver el indicador Lambda de Wilks de los distintos clusters generados. Este análisis es una medida de las diferencias entre grupos, comparando la dispersión intragrupo con la dispersión total para toda la muestra. Los valores de este estadístico oscilan entre cero y uno:
TABLA V.14. ESTIMACIÓN DE LOS LAMBDA DE WILKS |
||||
Análisis |
Lambda de Wilks |
F de Snedecor |
Grados de libertad |
p |
Análisis con respecto a la cadena de valor |
0,0416 |
52,2470 |
36 y 1407 |
0,0000 |
Análisis de variables económicas |
0,0484 |
76,0231 |
24 y 1319 |
0,0000 |
Análisis de los posibles despilfarros |
0,0425 |
58,7364 |
32 y 1388 |
0,0000 |
Análisis de las actividades desagregadas de trazabilidad |
0,0308 |
17,0663 |
116 y 1413 |
0,0000 |
Análisis de las ventajas de la trazabilidad |
0,0471 |
36,1844 |
48 y 1435 |
0,0000 |
Fuente: Elaboración propia. |
Como se aprecia en la tabla V.14, los estudios de los distintos grupos en cada análisis, con respecto a este estadístico Lambda de Wilks, permiten afirmar que las diferencias entre ellos son bastante destacables por ser sus valores cercanos a 0, siendo por lo tanto los centros de los grupos notoriamente diferentes en todos los casos. Según las p correspondientes, todas ellas iguales a 0,0000, los grupos sí se diferenciarían por las variables analizadas a un nivel del 1%.
Los distintos tests X2 de Bartlett realizados permiten también rechazar la hipótesis nula de no correlación significativa, lo que implica que la matriz de correlaciones de la población no será la identidad. Sería adecuada, por tanto, la aplicación del análisis factorial de componentes principales a las variables y la obtención de las matrices de confusión correspondientes.
TABLA V.15. TEST DE BARTLETT DE LOS ANÁLISIS REALIZADOS |
|||
Análisis |
Grados de libertad |
X2 |
p |
Análisis con respecto a la cadena de valor |
36 |
1208,6825 |
0,0000 |
Análisis de variables económicas |
24 |
1155,3321 |
0,0000 |
Análisis de los posibles despilfarros |
32 |
1201,2817 |
0,0000 |
Análisis de las actividades desagregadas de trazabilidad. |
116 |
1287,6382 |
0,0000 |
Análisis de las ventajas de la trazabilidad |
48 |
1156,4175 |
0,0000 |
Fuente: Elaboración propia. |
Partiendo de los datos utilizados pasamos a exponer cada uno de los análisis realizados, aplicando el ya comentado algoritmo de Howard-Harris:
Hemos seleccionado en primer lugar, la variable principal que medía la posibilidad de que la trazabilidad añada valor al producto y aquellas variables que intentan explicar la visión de la empresa de su cadena de valor. El análisis de las medias resultantes permite caracterizar las empresas de cada cluster, como se puede ver en la tablA V.16.
Como se puede ver, los clusters generados serían los siguientes:
Las empresas de este grupo tienen un tamaño mayor que el resto de clusters:
TABLA V.16. ANÁLISIS CLÚSTER DE LAS VARIABLES DE VALOR |
||||||||
|
|
MEDIA |
C. 1. |
C. 2. |
C. 3. |
C. 4. |
C. 5 |
|
|
Nº elem. |
388 |
77 |
114 |
59 |
110 |
28 |
|
Variables |
Suma cuadrados |
4.907,25 |
182,29 |
461,82 |
432,44 |
531,62 |
176,21 |
ANOVA / F Snedecor |
Un pto. con trazab. vale más que un pto. sin ella. |
Media: |
3,56 |
4,53 + |
4,30 |
2,83 |
3,09 |
1,25 - |
F(4,383) = 85,7350 |
|
Des.Est.: |
1,36 |
0,97 |
0,78 |
1,39 |
1,00 |
0,63 |
p = 0,0000 |
La trazab. es una actividad inevitable en el contexto actual. |
Media: |
4,36 |
4,91 + |
4,69 |
4,31 |
4,11 |
2,61 - |
F(4,383) = 48,9143 |
|
Des.Est.: |
0,99 |
0,33 |
0,59 |
1,03 |
0,85 |
1,50 |
p = 0,0000 |
Mi cliente valora positivam. la trazab. |
Media: |
3,7 |
4,73 + |
4,18 |
3,14 |
3,30 |
1,64 - |
F(4,383) = 91,5775 |
|
Des.Est.: |
1,18 |
0,68 |
0,79 |
1,1 |
0,83 |
0,89 |
p = 0,0000 |
Mi empresa valora positivam la trazab. |
Media: |
4,12 |
4,88 + |
4,57 |
4,08 |
3,68 |
2,04 - |
F(4,383) = 102,2923 |
|
Des.Est.: |
1,03 |
0,39 |
0,58 |
0,96 |
0,79 |
0,94 |
p = 0,0000 |
Mi empresa tiene una visión global de la cadena con prov. y clientes. |
Media: |
4,02 |
4,81 + |
4,26 |
3,76 |
3,68 |
2,68 - |
F(4,383) = 51,1081 |
|
Des.Est.: |
0,95 |
0,48 |
0,75 |
0,89 |
0,79 |
1,04 |
p = 0,0000 |
La coord. de la trazab. con mis prov. aumenta el valor de mis ptos. |
Media: |
3,26 |
4,86 + |
3,68 |
1,66 |
3,1 |
1,21 - |
F(4,383) = 327,7484 |
|
Des.Est.: |
1,27 |
0,45 |
0,66 |
0,75 |
0,57 |
0,56 |
p = 0,0000 |
La coord. de la trazab. con mis clientes aumenta el valor de mis ptos. |
Media: |
3,27 |
4,97 + |
3,74 |
1,49 |
3,06 |
1,25 - |
F(4,383) = 537,9490 |
|
Des.Est.: |
1,3 |
0,16 |
0,58 |
0,5 |
0,58 |
0,51 |
p = 0,0000 |
La coord. de la trazab. con distrib. aumenta el valor de mis ptos. |
Media: |
3,23 |
4,88 + |
3,61 |
1,51 |
3,12 |
1,18 - |
F(4,383) = 513,0927 |
|
Des.Est.: |
1,26 |
0,32 |
0,59 |
0,53 |
0,52 |
0,38 |
p = 0,0000 |
La coord. de la trazab. con otros agentes de la cadena aumenta el valor de mis ptos. |
Media: |
3,18 |
4,84 + |
3,47 |
1,51 |
3,09 |
1,21 - |
F(4,383) = 413,4241 |
|
Des.Est.: |
1,26 |
0,36 |
0,68 |
0,56 |
0,51 |
0,41 |
p = 0,0000 |
Fuente: Elaboración propia. |
Las empresas de este grupo se caracterizan por ser empresas de gran tamaño en comparación con el resto, como demuestran estos datos:
Las empresas incluidas en este clúster se caracterizan por presentar un tamaño medio, opinando un 59,32% de ellas que la trazabilidad compensa. Aún así, suponen un claro target objetivo para empresas de formación y de consultoría en estas cuestiones.
Las empresas de este grupo también se caracterizan por tener un tamaño medio, pensando un 68,18% de ellas que la trazabilidad compensa. Estas empresas deberían comprender la verdadera utilidad de la trazabilidad y su potencial, así como entender que tener una visión global de la cadena implica cambiar la forma de relacionarse con los agentes que la conforman.
Estaríamos entonces ante el clúster con una visión más negativa acerca de las variables planteadas, debiendo constituir un auténtico foco de atención para el desarrollo de políticas sanitarias y alimentarias. De hecho, sólo un 21,43% de estas empresas considera que la trazabilidad compensa, el menor porcentaje de todos los clusters, opinando sólo un 57,14 % estima que no, el mayor de los cinco grupos obtenidos.
Este grupo se caracteriza también por incluir principalmente pequeñas empresas, tal y como demuestran los siguientes datos:
Para validar la formación de los grupos obtenidos, se puede utilizar el análisis discriminante tomando como variable dependiente la nueva variable categórica que identifica el grupo al que pertenece la empresa, y como independiente, las variables utilizadas en el análisis cluster. La matriz de confusión calculada con todas las funciones discriminantes obtenidas, en los clusters generados, con probabilidades previas iguales para cada grupo, aparece en la tablA V.17:
TABLA V.17. MATRIZ DE CONFUSIÓN DE LOS CLUSTERS GENERADOS EN EL ANÁLISIS DE VALOR |
||||||
GRUPOS REALES |
C. 1 |
C. 2 |
C. 3 |
C. 4 |
C. 5 |
TOTAL |
1 |
77 |
0 |
0 |
0 |
0 |
77 |
2 |
0 |
110 |
1 |
3 |
0 |
114 |
3 |
0 |
0 |
58 |
1 |
0 |
59 |
4 |
0 |
5 |
2 |
103 |
0 |
110 |
5 |
0 |
0 |
0 |
0 |
28 |
28 |
TOTAL |
77 |
115 |
61 |
107 |
28 |
388 |
Fuente: Elaboración propia. |
El porcentaje de asignaciones acertadas por las funciones discriminantes asciende a 96,91%, una asignación casi perfecta y que prácticamente garantizaría la asignación de cualquier empresa a su clúster correspondiente con sólo conocer sus respuestas. Los valores de las funciones discriminantes generadas utilizando como variable criterio la pertenencia a esos grupos, según cada uno de los centroides obtenidos, aparecen reflejados en la tabla V.18:
TABLA V.18. VALORES DE LAS FUNCIONES EN LOS CENTROIDES DE LOS GRUPOS CON RESPECTO A LA CADENA DE VALOR |
||||
|
FUNCIÓN 1 |
FUNCIÓN 2 |
FUNCIÓN 3 |
FUNCIÓN 4 |
CLÚSTER 1 |
4,7986 |
-0,3377 |
0,1743 |
-0,181 |
CLÚSTER 2 |
1,5341 |
0,4861 |
-0,3059 |
0,0515 |
CLÚSTER 3 |
-4,1722 |
1,4300 |
0,2179 |
-0,0879 |
CLÚSTER 4 |
-0,8885 |
-0,6129 |
0,1512 |
0,1900 |
CLÚSTER 5 |
-7,1603 |
-1,6554 |
-0,2869 |
-0,2733 |
Fuente: Elaboración propia. |
La representación gráfica de cada uno de los centroides tras realizar el análisis cluster, bajo dos ejes cualquiera, y con la aplicación de las técnicas de análisis discriminante múltiple, aparecen reflejados en el gráfico V.105:
En eumed.net: |
1647 - Investigaciones socioambientales, educativas y humanísticas para el medio rural Por: Miguel Ángel Sámano Rentería y Ramón Rivera Espinosa. (Coordinadores) Este libro es producto del trabajo desarrollado por un grupo interdisciplinario de investigadores integrantes del Instituto de Investigaciones Socioambientales, Educativas y Humanísticas para el Medio Rural (IISEHMER). Libro gratis |
15 al 28 de febrero |
|
Desafíos de las empresas del siglo XXI | |
15 al 29 de marzo |
|
La Educación en el siglo XXI |