![]() ![]() |
![]() ![]()
|
Manual de Estadística
David Ruiz Muñoz
Capítulo II : CARACTERÍSTICAS DE UNA DISTRIBUCIÓN DE FRECUENCIAS
2.1. Introducción
La fase previa de cualquier estudio estadístico se basa en la recogida y ordenación de datos; esto se realiza con la ayuda de los resúmenes numéricos y gráficos visto en los temas anteriores
2.2. Medidas de posición
Son aquellas medidas que nos ayudan a saber donde están los datos pero sin indicar como se distribuyen
2.2.1. Medidas de posición central
a) Media aritmética ( X ) La media aritmética o simplemente media, que denotaremos por X , es el número obtenido al dividir la suma de todos los valores de la variable entre el numero total de observaciones.
Ejemplo: Si tenemos la siguiente distribución, se pide hallar la media aritmética, de los siguientes datos expresados en kg. (ver tabla en formato doc)
Propiedades:
1ª) Si sometemos a una variable estadística X, a un cambio de origen y escala Y = a + b X, la media aritmética de dicha variable X, varía en la misma proporción.
2ª) La suma de las desviaciones de los valores o datos de una variable X, respecto a su media aritmética es cero. (ver tabla en formato doc)
Ventajas e inconvenientes:
- La media aritmética viene expresada en las mismas unidades que la variable. - En su cálculo intervienen todos los valores de la distribución.
- Es el centro de gravedad de toda la distribución, representando a todos los valores observados.
- Es única.
- Su principal inconveniente es que se ve afectada por los valores extremadamente grandes o pequeños de la distribución.
• Media aritmética ponderada Es una media aritmética que se emplea en distribuciones de tipo unitario, en las que se introducen unos coeficientes de ponderación, denominados i ., que son valores positivos, que representan el número de veces que un valor de la variable es más importante que otro. b) Media geométrica Sea una distribución de frecuencias (x i , n i ). La media geométrica, que denotaremos por G. se define como la raíz N-ésima del producto de los N valores de la distribución. (ver tabla en formato doc)
Si los datos están agrupados en intervalos, la expresión de la media geométrica, es la misma, pero utilizando la marca de clase (Xi).
El empleo más frecuente de la media geométrica es el de promediar variables tales como porcentajes, tasas, números índices. etc., es decir, en los casos en los que se supone que la variable presenta variaciones acumulativas
Ventajas e inconvenientes:
- En su cálculo intervienen todos los valores de la distribución.
- Los valores extremos tienen menor influencia que en la media aritmética.
- Es única.
- Su cálculo es más complicado que el de la media aritmética.
Además, cuando la variable toma al menos un xi = 0 entonces G se anula, y si la variable toma valores negativos se pueden presentar una gama de casos particulares en los que tampoco queda determinada debido al problema de las raíces de índice par de números negativos.
c) Media armónica La media armónica, que representaremos por H, se define como sigue: (ver tabla en formato doc)
Obsérvese que la inversa de la media armónica es la media aritmética de los inversos de los valores de la variable. No es aconsejable en distribuciones de variables con valores pequeños. Se suele utilizar para promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc.
Ventajas e inconvenientes:
- En su cálculo intervienen todos los valores de la distribución.
- Su cálculo no tiene sentido cuando algún valor de la variable toma valor cero.
- Es única
• Relación entre las medias: (ver tablas en formato doc)
d) Mediana ( Me ) Dada una distribución de frecuencias con los valores ordenados de menor a mayor, llamamos mediana y la representamos por Me, al valor de la variable, que deja a su izquierda el mismo número de frecuencias que a su derecha.
• Calculo de la mediana:
a) Variables discretas no agrupadas: (ver tabla en formato doc)
b) Variables agrupadas por intervalos En este caso hay que detectar en que intervalo está el valor mediano. Dicho intervalo se denomina “ intervalo mediano ”. (ver tablas en formato doc)
Ventajas e inconvenientes :
- Es la medida más representativa en el caso de variables que solo admitan la escala ordinal.
- Es fácil de calcular.
- En la mediana solo influyen los valores centrales y es insensible a los valores extremos u “outliers ”.
- En su determinación no intervienen todos los valores de la variable.
e) Moda La moda es el valor de la variable que más veces se repite, y en consecuencia, en una distribución de frecuencias, es el valor de la variable que viene afectada por la máxima frecuencia de la distribución. En distribuciones no agrupadas en intervalos se observa la columna de las frecuencias absolutas, y el valor de la distribuci6n al que corresponde la mayor frecuencia será la moda. A veces aparecen distribuciones de variables con más de una moda (bimodales, trimodales, etc), e incluso una distribución de frecuencias que presente una moda absoluta y una relativa.
En el caso de estar la variable agrupada en intervalos de distinta amplitud, se define el intervalo modal, y se denota por ( Li-1 , Li ], como aquel que posee mayor densidad de frecuencia ( hi ); la densidad de frecuencia se define como : (ver tabla en formato doc).
Una vez identificado el intervalo modal procederemos al cálculo de la moda, a través de la fórmula: (verla en formato doc).
En el caso de tener todos los intervalos la misma amplitud, el intervalo modal será el que posea una mayor frecuencia absoluta ( ni ) y una vez identificado este, empleando la fórmula: (ver en formato doc)Ventajas e inconvenientes: - Su cálculo es sencillo.
- Es de fácil interpretación.
- Es la única medida de posición central que puede obtenerse en las variables de tipo cualitativo.
- En su determinación no intervienen todos lo valores de la distribución.
Volver al índice de Manual de Estadística
Volver a "Libros Gratis de Economía"
Volver a la "Enciclopedia y Biblioteca de Economía EMVI"