EL ESTUDIO OPERATIVO DE LA PSICOLOGÍA 
UNA APROXIMACIÓN MATEMÁTICA

EL ESTUDIO OPERATIVO DE LA PSICOLOGÍA UNA APROXIMACIÓN MATEMÁTICA

Josep Maria Franquet i Bernis

Volver al índice

 

 

 

 

2. "Normalización" del problema

Una variable aleatoria que se distribuya con la función de densidad que ya hemos relacionado en otras partes de este mismo libro, concretamente en el anexo nº: 1 anterior, recibe el nombre de normal debido a que la distribución binomial, considerada en su caso límite, es la que corresponde corrientemente o habitualmente a la mayor parte de las variables empíricas, entre ellas las psicológicas. Una ampliación de conceptos teóricos en relación a la expresada distribución de probabilidad, puede encontrarse en el anexo nº: 1 de este mismo libro (“Restantes especificaciones metodológicas”).

Desde luego, entre las muchas distribuciones continuas que se utilizan en Estadística y que pueden tener provechosas aplicaciones en el estudio de las variables psicológicas, la curva normal o distribución normal es, con mucho, la más importante de ellas. Su estudio data de investigaciones sobre la naturaleza de los errores experimentales, llevadas a cabo en el siglo XVIII. Se observaba entonces que las discrepancias entre las medidas repetidas de la misma cantidad física mostraban un sorprendente grado de regularidad; sus aspectos (distribución), según se encontró, podían aproximarse muy bien mediante un cierto tipo de curva de distribución continua, denominada “curva normal de errores” y atribuida a las leyes del azar. Las propiedades matemáticas de este tipo de curva de distribución continua y su base teórica fueron investigadas, por primera vez, por Abraham de Moivre (1667-1745), Pierre Laplace (1749-1827) y Karl Gauss (1777-1855). Este último fue un gran matemático alemán que, con sus brillantes aportaciones sobre las geometrías no euclideanas, hizo posible la aparición de las ciencias formales.

La importancia de la distribución normal radica, en primer lugar, en que son muy numerosas las variables aleatorias que la siguen, resultando adecuada para describir la distribución de muchos conjuntos de datos. En efecto, numerosas medidas físicas, datos meteorológicos, características biológicas, variables económicas y sociales, etc., siguen la ley normal, así como también aparece en muchas investigaciones teóricas. En segundo lugar, como consecuencia del teorema del límite central, que establece que la suma de un número elevado de variables aleatorias converge a una distribución normal, sea cual sea la distribución de estas variables. Además, en ciertas condiciones, las distribuciones discretas pueden ser substituidas por distribuciones normales, lo que simplifica notablemente los cálculos correspondientes. Hay que tener mucho cuidado, en fin, al suponer que un determinado conjunto de observaciones se puede aproximar por una distribución normal, pues será necesario realizar una comprobación previa.

Como se ha visto, la curva normal tiene forma de campana extendida indefinidamente en ambas direcciones, positiva y negativa, siendo asintótica en relación al eje de abscisas. Rara vez es necesario extender las colas de la curva normal muy lejos de la media, porque el área comprendida bajo la curva y el eje horizontal que queda a más de cuatro o cinco desviaciones típicas de la media aritmética o esperanza matemática resulta insignificante para la mayoría de los fines prácticos y, entre ellos, los propios de la Psicología aplicada. Debe tenerse en cuenta que no todas las distribuciones acampanadas simétricas en relación al eje de ordenadas son distribuciones normales, y las palabras distribución normal refiérense al hecho de que el área bajo la curva se distribuye de una manera determinada.

Una importante propiedad de la curva normal es que está completamente determinada por su media y su desviación típica. Es decir, la ecuación matemática de dicha curva es tal que se puede determinar el área existente bajo la curva entre dos puntos cualesquiera del eje horizontal si se conoce el valor que adoptan ambos parámetros, aunque en la práctica dichas áreas se obtienen valiéndose de tablas especiales elaboradas al efecto. Por otra parte, la probabilidad o frecuencia relativa con que una variable psicológica tomará valores entre dos puntos es el área bajo la curva comprendida entre los dos puntos del eje horizontal.

Si se representa gráficamente esta función (FIG. A-2.5), encontraremos que está definida para todos los valores de x (desde - hasta +) y con las siguientes propiedades:

a) Solamente existe la curva para valores positivos de las ordenadas.

b) El eje de abscisas OX es una asíntota horizontal de la curva.

c) Existe un máximo absoluto para el punto x = .

d) Es creciente hasta el máximo y después es decreciente.

e) Existen dos puntos de inflexión: para x = - y para x = +.

f) Es cóncava hacia la región positiva del eje 0Y, para - < x < - y para + < x < + y cóncava hacia la región negativa del eje de ordenadas en el intervalo: - < x < +.

FIG. A-2.5. Área bajo la curva normal entre los puntos x1 y x2

Dentro de la ley normal los valores más próximos a  son más frecuentes que los más alejados de . La utilización e interpretación de esta función para Gauss puede verse a través de un ejemplo como el que nos ocupa: supongamos que se efectúan 1.000 mediciones del cociente intelectual de un mismo individuo superdotado, cuyo CI verdadero es de 168; en este caso se dice que  = 168. Las medidas efectuadas se acumularán en mayor proporción alrededor de  cuanto más próximas estén a dicho valor y serán menos frecuentes cuanto más alejadas se encuentren de .

El parámetro  está relacionado con la precisión de las mediciones realizadas al medir el parámetro . Si se hace igual a la unidad el área comprendida entre la curva y el eje de abscisas y se supone que los CI medidos que han estado comprendidos entre los valores x1 y x2 representan el diez por ciento de las 1.000 mediciones realizadas, el área rayada de la figura anterior debe ser igual a 0’10. También sabemos hoy que el área comprendida entre la curva, el eje de abscisas y las ordenadas x = - y x = + corresponde, aproximadamente, al 64 por ciento del área total. Por lo tanto, ya tenemos un significado del hasta ahora desconocido parámetro : cuanto menor sea el valor de  (que se denomina desviación típica o standard en la terminología estadística) también serán de menor cuantía los errores que se cometen al medir el CI ; es decir, si el test empleado para medir el CI es más perfecto o si es más hábil la persona encargada de medirlo (psicólogo experimentador),  será un número menor que en el caso contrario.

La función de densidad normal o la función de distribución normal son dos modelos matemáticos inspirados por la conocida “ley de los errores” o ley de Gauss, cuya introducción ya ha sido realizada en el anexo anterior. Pues bien, la Estadística ha incorporado a su metodología –como un modelo probabilístico esencial– esta ley de Gauss con el nombre de función de densidad normal. Si y = f(x) es dicha función de densidad o de probabilidad, se puede definir a partir de ella la denominada función de distribución normal F(x), tal que:

y dicha integral impropia de primera especie significa que a cada valor de x corresponde un número F(x) determinado por la probabilidad de que la variable (CI, en nuestro ejemplo) tome un valor menor o igual a x.

Las áreas comprendidas bajo la curva normal y el eje de abscisas representan probabilidades, que quedan acotadas por las correspondientes ordenadas. En estas condiciones, la probabilidad de que la variable x (en nuestro caso se trata del CI del individuo) tome un valor comprendido entre x1 y x2, vendría dada de la siguiente forma, como deduciremos posteriormente, aplicando la propiedad de la aditividad del intervalo de integración en las integrales definidas:

, en que ya hemos aplicado los parámetros correspondientes de nuestro problema, que tendremos ocasión de calcular con posterioridad. Es decir, como la última integral permite conocer el área rayada de la figura A-2.5, dicha área representa la probabilidad de que la variable x = CI (que en el Cálculo de Probabilidades es una variable aleatoria o estocástica, en lugar de una variable estadística) tome un valor comprendido entre x1 y x2 .

En el caso de que la tabla anterior correspondiera a 1.000 mediciones distintas de un mismo CI (en lugar de corresponder a los CI medidos en 1.000 individuos distintos), la distribución de frecuencias determinada por las columnas encabezadas por "CI" y por "fi" presentaría una imagen empírica de una función de densidad normal. Si los resultados se hubieran obtenido a partir del modelo matemático, en lugar de constituir una observación de la realidad, para: x1 = 165 y x2 = 170, se tendría que:

Conocidas la media aritmética y la desviación típica, se pueden tabular las áreas comprendidas bajo la curva normal. En realidad, para  = 168’325 (media aritmética o esperanza matemática de aquella distribución de frecuencias) y para  = 6'36 (desviación típica) se tiene que:

,

cuya diferencia: 0'312 - 0'303 = 0'009 es una medida de la discrepancia existente entre la realidad y el modelo teórico que ha sido considerado y para la clase particular "CI comprendido entre 165 y 170".

Las áreas comprendidas entre menos infinito y x son los valores de la función de distribución para cada valor de la variable psicológica x.

De la misma manera, la distribución de frecuencias determinada por la primera columna de la tabla de la figura A-2.1. y la encabezada por Fi, constituyen una imagen empírica de la función de distribución normal que venimos considerando. En este caso, los resultados empírico y teórico, para x =170, serían, respectivamente:

F5 = , y también:

que implicarían una discrepancia absoluta de 0'002 y relativa del 0’32% entre el valor teórico y el correspondiente valor observado, que resulta ser francamente baja.