EDUCACIÓN MATEMÁTICA Y FORMACIÓN DOCENTE

Silvia Vázquez Cedeño y Gustavo Mazcorro Téllez

Posibilidades de Emplear las
Caras de Chernoff en la Investigación
Pedagógica
TOMÁS CRESPO BORGES
Instituto Superior Pedagógico “Félix Varela”, Cuba.

"Puesto que todo en el mundo piensa que puede
 enseñar Estadística aunque no sepa nada,
yo debería ponerme en la posición de enseñar
Biología a pesar de que no se nada"
Herman Chernoff (1996)

“El siglo XX ha visto muchos avances en campos diversos. La Visualización no ha sido una excepción a esos cambios, que prepararon el camino para su transformación en “Visualización de Información” durante las dos décadas que precedieron al nuevo milenio.
A diferencia de la segunda mitad del siglo XIX, la primera mitad del siglo XX marca la normalización y popularización de los gráficos. La innovación y el entusiasmo de la última parte del XIX han desaparecido ahora.
Los avances en la precisión de los métodos estadísticos junto con la aparición habitual de diagramas y gráficos en los textos parecen reducirlos a un artículo más de consumo. Este es un periodo de consolidación, que ve los primeros intentos de comparar la eficiencia de distintos tipos de gráficos. La evolución de la ciencia, la estadística y la tecnología estaban preparando el escenario para la nueva ola de creatividad.”
Por otro lado, los estudios de la metodología de la investigación cuantitativa en las ciencias sociales llevan a la conclusión de que 
“…el análisis multivariado en algunas investigaciones cumple el importante papel de encontrar una explicación del fenómeno que se estudia, justamente al tomar en cuenta un mayor número de variables que en el análisis descriptivo y haciendo la distinción necesaria entre las  causas y los efectos que se dan en el conjunto de los datos tomados de la realidad en sus expresiones cuantitativas.”
La investigación pedagógica no es ajena a esta exigencia, la necesidad del análisis multivariado de los procesos que se dan en la escuela y su entorno, así como las incidencias en ella de múltiples variables, es una realidad indiscutible y a ello hacen referencias diversos autores. Por citar sólo un ejemplo, al referirse a la dirección del proceso de superación, el Dr. Pedro Valiente destaca tres regularidades y describe la tercera del siguiente modo:
“3ª. Regularidad: Entre el carácter, contenido y contexto multivariado de la actividad docente y directiva y el enfoque multidimensional e interdisciplinario de los objetivos y el contenido de la superación.”
Sin embargo, raras veces se hace un análisis estadístico multivariado de las variables que realmente están involucradas en una investigación pedagógica, motivado generalmente por la complejidad que esto significa en el tratamiento estadístico, por lo que siguiendo las ideas planteadas por John W. Tukey en 1997, en su libro “Exploratory Data Analysis”:
“Una visualización exitosa es una alternativa que puede reducir considerablemente el tiempo que se tarda en entender los datos subyacentes, en encontrar relaciones y en obtener la información que se busca.”
Aceptados los planteamientos anteriores, el problema se transfiere ahora a la “búsqueda de una visualización exitosa”; para lograrlo, los datos a ser visualizados deben presentarse de modo tal que el sistema de percepción visual del usuario de la visualización sea estimulado para entender relaciones y reconocer patrones. Para resolver el problema existen diferentes alternativas, una de ellas son las caras de Chernoff (Gráfico 1).

 

En 1973 el matemático Hermann Chernoff, publicó un artículo  en el Journal of American Statistical Association, titulado: "Usando caras para representar gráficamente puntos en k-espacios dimensionales”. Su propuesta esencial es que, dado que los humanos podemos reconocer y clasificar características faciales de manera rápida y sencilla, una cara sería una manera conveniente de presentar un conjunto de varias variables distintas provenientes de un muestreo estadístico.
El método propuesto es que cada dato se represente mediante una cara. A cada variable se asocia un rasgo o característica de una cara, por ejem­plo: (1) área de la cara, (2) forma de la cara, (3) longitud de la nariz, (4) localización de la boca, (5) curva de la sonrisa (6) grosor de la boca, (7) localización, separación, inclinación, forma y grosor de los ojos, etcétera.
Lo expresado se ilustra con el siguiente ejemplo tomado de un artículo relacionado con la economía de Cuba:
“El Gráfico 2, contiene las “Caras de Chernoff para los 5 países por encima y los 5 por debajo de Cuba en términos de PIB per cápita a PPA. En este caso se utilizan sólo las 9 variables explicativas tomadas para el ejercicio, excluyendo por supuesto al PIB per cápita.
Cada rasgo de las caras tiene en cuenta la magnitud relativa para cada país, de la siguiente forma:

La ilustración del comportamiento de las 9 variables explicativas en cada caso y en especial la situación de Cuba respecto a los 10 países tomados de referencias es evidente (Gráfico 2).
Como una aplicación a la investigación pedagógica, a sugerencia del autor de este trabajo, Yusimí Guerra utilizó las caras de Chernoff en su tesis de doctorado. Mediante este método analizó la variación antes-después de 7 estudiantes en tres componentes con sus respectivos indicadores:
Componente intelectual


Componente personal

Componente práctico

Los resultados del procesamiento se dan en el anexo que se reproduce a continuación:

Caras de Chernoff para cada uno de los estudiantes sometidos al experimento.


Leyenda
La leyenda que a continuación se muestra se acompaña de un esquema para aclarar la relación entre los rasgos de la cara de Chernoff y la magnitud de las variables representada por dicho rasgo.
Componente intelectual
― Longitud de la nariz = indicador 1 (a mayor longitud de la nariz más puntuación).
― Altura del centro de la boca = indicador 2 (a menor altura mayor puntuación).
― Curvatura de la boca = indicador 3 (a mayor curvatura mayor puntuación).
― Longitud de un extremo a otro de la boca = indicador 4 (a mayor longitud mayor puntuación)
Componente personal
― Altura de los ojos = indicador 1 (a menor altura menor puntuación)
― Separación entre los ojos = indicador 2 (a mayor separación mayor puntuación)
― Tamaño de los ojos = indicador 3 (a mayor tamaño menor puntuación)

Componente práctico
― Separación extremo superior de las cejas = indicador 1 (a mayor separación mayor puntuación)
― Ángulo agudo de las cejas, respecto a la horizontal = indicador 2 (a mayor ángulo menor puntuación)
― Longitud de las cejas = indicador 3 (a mayor longitud menor puntuación)
Esquema que representa la relación entre algunos rasgos de la cara de Chernoff y la magnitud de la variable que con dicho rasgo se caracteriza.”
Los rasgos de las caras anteriores permitieron a la autora hacer análisis como el siguiente:
“El estudiante 1 tiene los ojos a mayor altura que el 2 dada su puntuación más elevada en ese indicador. En todos los demás indicadores de ese y los restantes componentes sus puntuaciones coinciden. Sin embargo, esta pequeña variación en un indicador es suficiente para cambiar la configuración del rostro expresándose así la correlación entre los componentes.”
Es posible que al lector le hayan interesado los resultados y el análisis realizado hasta el momento, pero lógicamente tiene una preocupación "¿cómo dibujar las caritas?" De eso se ocupa, entre otras, la aplicación profesional STATISTICA en la forma que se explica a continuación. STATISTICA se presenta como una hoja de cálculos similar a las conocidas de EXCEL; si se toman los mismos datos de la tesis a la que se ha  hecho referencia se tiene la siguiente tabla.
Los términos variables y casos (VARIABLES Y CASE) se señalan para identificarlos como términos utilizados por la aplicación STATISTICA.

Tras seleccionar las variables de análisis (todas en este caso ) y pulsar con el clic secundario (derecho) sobre la tabla de la Figura 1 se despliega el menú que se muestra señalando con las flechas las opciones que deben ser seleccionadas.

A continuación se despliega el siguiente menú con la opción referida a  las caras de Chernoff.
pulsar Ok aparecen las deseadas caras de Chernoff. Si el usuario lo desea puede darle un formato adecuado a sus gustos estéticos y necesidades de destacar uno u otro rasgo.
Accionando el clic derecho sobre la leyenda permite acceder a los correspondientes menús de modificaciones como lo indica la secuencia de imágenes (Fig. 4-9).

La lectura interpretativa de los resultados queda por parte del investigador en correspondencia con los indicadores escogidos y la teoría en la que fundamenta su estudio.
Las caras de Chernoff pueden resultar de particular interés para el estudio de casos o para el análisis multivariado con variables resultantes de otros estudios estadísticos análogos al caso del cálculo indirecto del PIB per cápita de Cuba en términos de PPA.
El autor del presente trabajo no lo presenta como una panacea, tampoco se trata de algo novedoso, pues tiene más de 30 años. Además, aunque con el paquete STATISTICA se puede llegar al gráfico deseado con la facilidad que se ha expuesto, se requiere de cierto entrenamiento y habilidad para obtenerlo con las exigencias de su publicación en una tesis. Finalmente, es preciso reiterar la necesaria selección rigurosa y científicamente fundamentada de las dimensiones e indicadores, así como la interpretación de los resultados, cuestión clave en el empleo de las caras de Chernoff, porque para ello no hay fórmulas ni algoritmo, sólo estudio y profesionalidad en el análisis por parte del investigador.
Como es de suponer, el empleo de la caras de Chernoff tiene detractores, quizás en este momento usted sea uno de ellos  y  hasta lo exprese así: L, pero no se precipite, piense que prestigiosos matemáticos e investigadores las aceptan, y que cuando una aplicación tan profesional como STATISTICA le dedica esfuerzo y la incluye entre sus facilidades, es porque tiene un valor científico y práctico, por tanto analice y experimente, aunque sea para criticar los planteamientos de Chernoff, así también se hace ciencia.

Notas:
Hermann Chernoff nació el 1 julio de 1923 en Nueva York, N.Y.) es uno de los  matemáticos estadístico estadounidense más conocido por sus trabajos.  Consigue en 1943 un bachillerato en Ciencias matemáticas, física del nebenfach, en la Universidad del centro de ciudad de Nueva York. Fue empleado de la  Marina de guerra. Comenzó en 1946 el PH.D. Desarrolló su tesis sobre la rama de las matemáticas aplicadas en la Universidad Marrón y la terminó en la Universidad de Colombia. El salir de 1948 pasó a la Universidad De Chicago, saliendo de 1951 hacia la Universidad De Stanford y  cambió en 1974 a un centro de estadística y en 1985 al Departamento De Estadística de la Universidad de Harvard. En 1947, se casa con Judy Ullman, con la que tiene dos hijas. Chernoff fue presidente del Instituto de Estadística Matemática y es miembro seleccionado para la Academia Americana de Ciencias. En ocasión de sus 60 cumpleaños se honró su labor con la publicación de "Avances recientes en estadística". Su principal área de trabajo es la Estadística donde hizo varias contribuciones fundamentales.

El  25 de julio del 2000  murió John Wilder Tukey a los 85 años de edad. Tukey ha sido uno de los grandes talentos estadísticos del siglo XX, con una notable influencia en la Visualización de Información.
Quizá su contribución mejor conocida es la de la transformada rápida de Fourier (FFT). No obstante, Tukey ha dado lugar a muchas otras contribuciones a la estadística moderna. Entre ellas se cuenta la estadística descriptiva (Exploratory Data Analysis o EDA). Su libro Exploratory Data Analysis (1977) es el clásico sobre este tema. EDA es una filosofía básicamente gráfica de exploración de datos estadísticos. Por ello muchas veces se la confunde con la estadística gráfica, aunque EDA va más allá.
Referencias Bibliográficas
BRIONES Guillermo (1996): Investigación cuantitativa en las ciencias sociales. Bogotá Instituto Colombiano para el Fomento a la Educación Superior, ICFES.  
García García, Julián (2006): “Pasos básicos población y muestra”.   http://www.psico.uniovi.es/fac_psicologia/w3doc/ad/Od1.pdf  [Consulta: enero 2008].
GUERRA VÉLIZ, Yusimí. (2008): Modelo didáctico para la implementación de los métodos numéricos en el proceso docente educativo de la Física General en la especialidad de Profesor de Ciencias Exactas. Santa Clara, Tesis de doctorado.
DÜRSTLER, Juan C. (1999): “Visualización en el siglo XX”. Revista digital de InfoVis.net.  http://www.infovis.net/printRec.php?rec=revista&lang=1 [Consulta: enero 2008]
HOSSEIN, Arsham (sin fecha): “Statistical thinking for managerial decisions”. http://www.mirrorservice.org/sites/home.ubalt.edu/ntsbarsh/Business-stat/opre504.htm [Consulta: marzo 2008]
TOVAR, Luis (sin fecha): “Uso de algunos métodos gráficos multivariados para la selección de germoplasma mejorado de arroz para riego”. http://www.danac.org.ve/ocs/index.php. [Consulta: marzo 2008]
U-ECHEVARRÍA VALLEJO y otros. (2003): “El cálculo indirecto del PIB per cápita de Cuba en términos de PPA”. La Habana, Cuba.
KASKI, Samuel (1997): “Visualization of high-dimensional data items”.  http://www.cis.hut.fi/~sami/thesis/node7.html[Consulta: marzo 2008]
(Ayuda  de la aplicación STATISTICA)

 

Dr. Tomás Crespo Borges
Instituto Superior Pedagógico “Felix Varela”, Cuba
crespoborges@ucp.vc.rimed.cu


Juan C. Dürsteler. “Visualización en el siglo XX”, La Revista Digital de InfoVis.net. En http://www.infovis.net/printRec.php?rec=revista&lang=1.

Briones Guillermo. “Investigación Cuantitativa en las Ciencias Sociales”. Instituto Colombiano para el Fomento de la Educación Superior, ICFES. Bogotá 1996.

Las cursivas son nuestras.

Valiente Sandó, Pedro. “La superación profesional de docentes y directivos educacionales: una propuesta para su dirección” Curso 77. Pedagogía 2005.

Sergio Martig y otros. Herramientas de Visualización para la Exploración de Datos. Departamento de Ciencias e Ingeniería de la Computación  Laboratorio de Investigación y Desarrollo en Visualización y Computación Gráfica. Universidad Nacional del Sur. Argentina.

Paridad del Poder Adquisitivo.

Oscar U-Echevarría Vallejo, Oscar y otros. “El cálculo indirecto del PIB per cápita de Cuba en términos de PPA”, La Habana, Marzo de 2003.

Enciclopedia Virtual
Tienda
Libros Recomendados


1647 - Investigaciones socioambientales, educativas y humanísticas para el medio rural
Por: Miguel Ángel Sámano Rentería y Ramón Rivera Espinosa. (Coordinadores)

Este libro es producto del trabajo desarrollado por un grupo interdisciplinario de investigadores integrantes del Instituto de Investigaciones Socioambientales, Educativas y Humanísticas para el Medio Rural (IISEHMER).
Libro gratis
Congresos

15 al 28 de febrero
III Congreso Virtual Internacional sobre

Desafíos de las empresas del siglo XXI

15 al 29 de marzo
III Congreso Virtual Internacional sobre

La Educación en el siglo XXI

Enlaces Rápidos

Fundación Inca Garcilaso
Enciclopedia y Biblioteca virtual sobre economía
Universidad de Málaga