Las medidas de dispersión, también conocidas como medidas de variabilidad, son indicadores estadísticos utilizados para cuantificar la extensión o la variabilidad de un conjunto de datos.
Es decir, estas medidas indican cuán dispersos están los valores individuales con respecto al valor central o promedio. En esencia, las medidas de dispersión proporcionan información sobre la homogeneidad o heterogeneidad de las observaciones.
Las medidas de dispersión suelen formar parte del análisis estadístico, y se observan en conjunto con las medidas de tendencia central (como la
media o la
mediana). Estas últimas brindan información sobre cuál es el valor central de la muestra o población estudiada.
Las medidas de dispersión son importantes porque nos muestran qué tanto se pueden alejar las observaciones respecto al punto central. Ello puede ser muy útil, por ejemplo, en finanzas, donde una mayor variabilidad implica mayor volatilidad y, por ende, mayor riesgo.
¿Cuáles son las medidas de dispersión?
Algunas de las medidas de dispersión más comunes son:
-
Rango: Es la diferencia entre el valor máximo y el valor mínimo en el conjunto de datos. Si el rango es grande, indica una mayor dispersión de los valores.
Fórmula para calcular el rango:
Rango = Valor máximo − Valor mínimo
-
Desviación típica: Mide la dispersión promedio de los valores respecto a la media. Una desviación estándar más alta indica una mayor variabilidad de los datos (y lo mismo ocurre en sentido contrario).
-
Varianza: Es igual a la desviación estándar al cuadrado. Proporciona una medida más precisa de la variabilidad y se utiliza en cálculos estadísticos más avanzados.
-
Rango Intercuartílico (RIC): Es la diferencia entre el tercer cuartil y el primer cuartil en el conjunto de datos. El RIC es útil para identificar la dispersión en el rango intermedio de los datos, ignorando los valores atípicos.
RIC = Q3−Q1
-
Coeficiente de Variación: Es una medida relativa de la variabilidad, que compara la desviación estándar con la media. Se expresa como un porcentaje y permite comparar la dispersión en diferentes conjuntos de datos, incluso si tienen diferentes escalas.
Podemos distinguir, por un lado, las medidas de dispersión absoluta que permiten analizar la desviación en un conjunto de datos. Ejemplo: Rango, desviación típica y varianza.
Por otro lado, las medidas de dispersión relativa, a diferencia de las anteriores, permiten comparar la distribución de distintas muestras o poblaciones, aunque las observaciones se presenten en diferentes unidades de medida. Ejemplo: Coeficiente de variación.
Las medidas de dispersión son esenciales para comprender la distribución de los datos y proporcionar información sobre la confiabilidad de las estadísticas descriptivas. Cuanto mayor sea la dispersión, mayor será la variabilidad entre los valores, lo que puede tener implicaciones en la interpretación y el análisis de los datos.
Ejemplo de medidas de dispersión
Supongamos que contamos con el siguiente grupo de datos, ¿cuáles serían sus principales medidas de dispersión?
15,17
26,88
27,46
27,55
28,56
40,57
41,71
41,74
46,75
47,12
57,57
61,95
67,66
74,26
75,75
76,11
77,31
84,03
84,37
86,59
Rango:
Valor máximo: 86,59
Valor mínimo: 15,17
Rango= 86,59-15,17= 71,42
Desviación típica: 22,87
Varianza: 522,97
Rango intercuartílico:
Para hallar el rango intercuartílico, recordemos primero cómo encontrar los cuartiles:
Q= a (N+1)/4
Donde:
a= Es el número del cuartil: 1, 2 o 3.
N= Número de observaciones analizadas.
Q1=(N+1)/4= (20+1)/4= 21/4= 5,25
Si Q1 es igual a 5,25, tomo el valor en la posición 5 y sumo la parte decimal (0,25) multiplicada por la diferencia entre los valores en la posición 6 y en la posición 5.
El primer cuartil sería:
Q1= 28,56+ 0,25*(40,57-28,56)
Q1= 31,56
Ahora, calculamos el tercer cuartil:
Q3= 3*(N+1)/4= 3*21/4= 15,75
Hacemos el mismo cálculo que con el primer cuartil. Tomamos el valor en la posición 15 y sumamos 0,75 multiplicado por la diferencia entre los valores en la posición 16 y 15.
Q3= 75,75+0,75*(76,11-75,55)
Q3= 76,02
Rango intercuartílico: 76,02-31,56= 44,46
Coeficiente de variación:
Desviación típica/media
La media es 54,46. Por lo tanto, el coeficiente de variación sería:
22,87/54,46= 41,99%
Para más detalle sobre el cálculo de la varianza y de la desviación típica, mostramos esta tabla, donde x es la observación y μ es la media.
x |
x-μ |
(x-μ)^2 |
15,17 |
-39,29 |
1543,35 |
26,88 |
-27,58 |
760,41 |
27,46 |
-27,00 |
728,76 |
27,55 |
-26,91 |
723,91 |
28,56 |
-25,90 |
670,58 |
40,57 |
-13,89 |
192,81 |
41,71 |
-12,75 |
162,45 |
41,74 |
-12,72 |
161,68 |
46,75 |
-7,71 |
59,37 |
47,12 |
-7,34 |
53,81 |
57,57 |
3,11 |
9,70 |
61,95 |
7,49 |
56,17 |
67,66 |
13,20 |
174,36 |
74,26 |
19,80 |
392,22 |
75,75 |
21,29 |
453,46 |
76,11 |
21,65 |
468,92 |
77,31 |
22,85 |
522,33 |
84,03 |
29,57 |
874,65 |
84,37 |
29,91 |
894,88 |
86,59 |
32,13 |
1032,63 |
Sumatoria de las desviaciones al cuadrado (x-μ)^2: 9.936,42
Varianza: 522,97
Desviación típica: 22,87
Debemos aclarar que, para el cálculo, se divide la sumatoria de las desviaciones al cuadrado entre N-1, es decir, el número de observaciones menos 1. Esto es porque, por la cantidad de datos, asumimos que se trata de una muestra.
Otro punto importante a tener en consideración es que en Excel se puede emplear directamente una fórmula para calcular el valor máximo y el mínimo del conjunto de datos, la varianza, la desviación típica y la media.