Medidas de Tendencia Central Para Datos Agrupados en Intervalos
Al finalizar esta sesión se espera que el estudiante aprenda a:
Reconocer cuándo una ecuación representa una circunferencia.
Reconocer cuándo la ecuación de una circunferencia está escrita de forma canónica.
Identificar los elementos de una circunferencia a partir de su ecuación canónica.
En clases anteriores analizamos las medidas de tendencia central para datos no agrupados. En esta ocasión revisaremos las mismas medidas de tendencia central, pero para datos agrupados en intervalos.
Se hará una revisión y explicación a través de ejemplos sobre el proceso a seguir al momento de querer calcular dichas medidas, así como un análisis de su significado. Finalmente se plantearán situaciones problemas que el estudiante con asesoría de su docente deberá resolver.
Recordemos que las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor características de un conjunto de datos. Representan un centro en torno al cual se encuentra ubicado un conjunto de los datos, nos indican hacia donde tienden o se agrupan más un conjunto de datos. Las medidas de tendencia central más utilizadas son: la media o promedio, la mediana y la moda.
Recordemos que la media aritmética o promedio es un valor que representa al conjunto de datos que se está estudiando, la moda es el dato con mayor frecuencia o que más se repite en el conjunto de datos, y la mediana es el dato que divide en dos partes a dicho conjunto.
A continuación, se presentan las fórmulas utilizadas para el cálculo de las medidas de tendencia central en datos agrupados:
$$ \begin{align*} \color{blue}{x_i} &: \text{ marca de clase de la fila }i \\ \color{blue}{f_i} &: \text{frecuencia absoluta de la fila }i \\ \color{blue}{\sum{x_if_i}}&:\text{indica el resultado de sumar la}\\ &:\text{columna }x_if_i\\ \color{blue}n &: \text{ cantidad de datos.}\end{align*} $$
\begin{align*} \color{blue}{M_e} &: \text{ Mediana} \\ \color{blue}{L_i}&:\text{ límite inferior de la clase mediana.} \\ \color{blue}{A}&:\text{ amplitud del intervalo de la clase mediana.}\\&:\text{ se calcula como }L_s-L_i \\ \color{blue}{n}&:\text{ cantidad de datos.} \\ \color{blue}{F_{i-1}}&:\text{ frecuencia acumulada de la clase}\\ &: \text{anterior a la clase mediana.} \\ \color{blue}{f_i}&:\text{ frecuencia absoluta de la clase mediana.}\end{align*}
$$ \begin{align*}\color{blue}{M_o}&:\text{ moda.}\\\color{blue}{L_i}&:\text{ límite inferior de la clase modal.}\\\color{blue}{A}&:\text{ amplitud del intervalo } (L_s-L_i) \text{ de la clase modal.}\\\color{blue}{f_i}&:\text{ frecuencia absoluta de la clase modal.}\\\color{blue}{f_{i-1}}&:\text{ frecuencia absoluta de la clase anterior a la clase modal.}\\\color{blue}{f_{i+1}}&:\text{ frecuencia absoluta de la clase posterior a la clase modal.}\end{align*} $$
Antes de revisar algunos ejercicios resueltos, veamos tres videos en los que se explica el procedimiento para calcular las medidas de tendencia central para datos agrupados en intervalos
Una vez revisado los videos, procedamos a leer atentamente cada una de las situaciones que se plantean a continuación y observar el procedimiento que se llevó a cabo para dar respuesta a lo solicitado.
Ejemplo # 1. Temperatura máxima en Santa Lucía.
En el municipio de Santa Lucia se realizó un estudio cuyo objetivo fue estudiar la temperatura máxima diaria durante dos meses consecutivos. En la siguiente tabla se observa la distribución diaria de la temperatura máxima durante los meses de agosto y septiembre de 2022.
1. Interprete los datos que están en la tabla. 2. Calcule las medidas de tendencia central e interprete cada una de ellas.
Solución.
1. Interprete los datos que están en la tabla.
Se pueden observar y analizar varios aspectos, entre esos, que durante los dos meses que se realizó el estudio, se observó que en 4 días la temperatura estuvo entre los 27 y 28 grados Celsius. Se observa también que la temperatura más usual, común o frecuente (la que más se repitió) estuvo entre los 31 y 32 grados Celsius. Tan solo hubo un día en el que la temperatura alcanzó un valor cercano a los 35 grados Celsius. Estos y muchos más aspectos pueden ser analizados a partir de una tabla de frecuencias…. Vamos ahora a calcular e interpretar las medidas de tendencia central.
2. Calcule las medidas de tendencia central e interprete cada una de ellas
Para calcular las medidas de tendencia central en datos agrupados necesitaremos 3 columnas adicionales en la tabla que nos muestra el problema. La tabla deberá quedar como se muestra a continuación:
¿De dónde salieron los datos de esa nueva tabla?
Se realizará la explicación para la primera fila, el resto queda a interpretación y verificación por parte del estudiante. Se dijo que xi es la marca de clase, esta se calcula como el promedio de los limites inferior y superior del primer intervalo, en este caso sería: $$ x_1=\frac{27+28}{2}=\frac{55}{2}=27,5 $$ Fi hace referencia a la frecuencia absoluta acumulada, es decir que se va acumulando o sumando. En este caso por ser la primera fila se debe colocar el primer valor de la frecuencia absoluta normal, es decir 4. Posteriormente se suma 4 + 8 lo cual da 12, a ese 12 se le suma 7 lo cual nos da como resultado 19 y así sucesivamente hasta finalizar.
La última columna, xifi hace referencia al producto o multiplicación de la marca de clase xi con la frecuencia absoluta fi. Por ejemplo x1f1 sería el resultado de multiplicar la marca de clase de la fila 1 con la frecuencia absoluta de la misma fila, es decir (27,5)(4), lo cual da como resultado 110. De la misma manera se calculan el resto de los valores.
Llegó el momento de calcular las medidas de tendencia central. Iniciemos con la media aritmética o promedio:
Cálculo de la media aritmética o promedio
$$ \bar{x}=\frac{1875,5}{61} $$
$$ \bar{x}=30,75 $$
Interpretación: en promedio la temperatura en Santa Lucía durante los dos meses en los que se realizó el estudio fue de 30,75 grados Celsius, esto quiere decir que, de los 61 valores obtenidos de temperatura, algunos estuvieron por debajo y otros por encima de los 30,75 grados Celsius. Por ello es por lo que decimos que es una medida de tendencia central (que tiende al centro de un conjunto de datos).
Cálculo de la mediana
Para hallar la mediana en datos agrupados lo primero que debemos calcular es el resultado de dividir la cantidad de datos (n=61) entre 2 y luego buscar este valor en la columna de frecuencia acumulada. Si no lo encontramos entonces elegimos el número que sea inmediatamente mayor a ese. En nuestro caso el resultado es 30,5. Como en la columna Fi no existe el 30,5 entonces elegimos el 31 y sombreamos toda la fila, a partir de esta observamos los datos que nos solicita la formula y remplazamos (recuerda observar al inicio de la guía el significado de cada término que está en la fórmula)
Interpretación: el 50% de las temperaturas que se tomaron en el estudio están por debajo de 30,96 grados Celsius.
Cálculo de la moda
Sabemos que la moda es el dato que más se repite en un conjunto de datos. En este sentido lo primero que debemos hacer para calcular la moda es identificar la fila de la tabla en la que se encuentra la clase modal. Para ello buscamos en la columna de la frecuencia absoluta fi el número de mayor valor y sombremos toda la fila en la que se encuentra dicho número, posteriormente remplazamos los datos que nos solicita la formula y listo, hemos calculado la moda. El procedimiento se muestra a continuación:
A = 1, se calcula al restar los límites superior e inferior de la clase modal, es decir 32 - 31 = 1
Para identificar el resto de los valores que debes remplazar en la fórmula recuerda revisar el significado de cada término, el cual se encuentra en la segunda tabla de la primera página. $$ \begin{align*}M_o&=31+1 \left(\frac{(15-12)}{(15-12)+(15-11)}\right) \\ \\ M_o&=31+1 \left(\frac{3}{3+4}\right) \\ \\ M_o&=31+1 \left(\frac{3}{7}\right) \\ \\ M_o&=31+1 (0,43)\\ \\ M_o&=31+0,43 \\ \\M_o&=31,43 \end{align*} $$
Interpretación: la temperatura que fue más usual o frecuente en Santa Lucia durante la realización del estudio fue la de aproximadamente 31,43 grados Celsius.
Ejemplo # 2. Creación de videos en TikTok. El tiempo en segundos, que duran los videos de de 40 estudiantes de 10°A se muestra a continuación:
Interprete los datos que están en la tabla. Calcule las medidas de tendencia central e interprete cada una de ellas.
Solución. Interprete los datos que están en la tabla. Se pueden observar y analizar varios aspectos, entre esos, que hay 7 estudiantes que hacen videos de TikTok que tienen una duración que está entre los treinta y sesenta segundos. Se observa también que lo más frecuente o usual es que un estudiante haga videos que tienen una duración entre los 60 y 90 segundos. Así mismo se puede observar que de los 40 estudiantes, hay 3 que hacen videos más largos, ya que poseen una duración la cual está entre los 150 y 180 segundos. Estos y muchos más aspectos pueden ser analizados a partir de la tabla de frecuencia del problema.
Calcule las medidas de tendencia central e interprete cada una de ellas. Para calcular las medidas de tendencia central en datos agrupados necesitaremos 3 columnas adicionales en la tabla que nos muestra el problema. La tabla deberá quedar como se muestra a continuación:
¿Qué interpretación le podemos dar a ese resultado? Podríamos afirmar que en promedio la duración de los videos de TikTok realizados por los estudiantes de 10°A es de 90,75 segundos, esto quiere decir que, de los 40 estudiantes, algunos hicieron sus videos con una duración por encima de los 90,75 segundos y otros por debajo de este mismo tiempo.
Mediana: Primero se calcula el resultado de dividir la cantidad de datos \left(n=40\right) entre 2, y luego buscar este valor en la columna de frecuencia acumulada \left(F_i\right). Si no lo encontramos entonces elegimos el número que sea inmediatamente mayor a ese. En nuestro caso el resultado es 20. Como en la columna F_i existe el 20 entonces elegimos el 20 y sombreamos toda la fila (fila de la clase mediana). Los datos que nos solicita la fórmula de la mediana los identificaremos en esa fila (recuerda observar al inicio de la guía el significado de cada término que está en la fórmula de la mediana). A continuación, se muestra el procedimiento
¿Qué interpretación le podemos dar a ese resultado? La mitad o el 50% de los videos hechos por los estudiantes de 10°A tienen una duración igual o inferior a 90 segundos, es decir que la otra mitad o el otro 50% de estudiantes hacen videos con una duración superior a este tiempo.
Moda: Lo primero que debemos hacer es identificar la fila de la tabla en la que se encuentra la clase modal, para ello buscamos en la columna de frecuencia absoluta f_i el valor más grande y sombreamos esa fila, luego remplazamos los datos que nos solicita la formula y listo, hemos calculado la moda. Observemos que, en este caso, la fila de la clase modal coincide con la fila de la clase mediana, ya que el valor más grande de f_i es 10 y este se encuentra ubicado en la misma fila de la clase mediana. Es decir que los datos a utilizar para calcular la moda se encuentran en la misma fila utilizada para calcular la mediana.
El procedimiento se muestra a continuación:
A=30, se calcula al restar los límites superior e inferior de la clase modal, es decir 90-60=30.
Para identificar el resto de los valores que debes remplazar en la fórmula recuerda revisar el significado de cada término, el cual se encuentra en la segunda tabla de la primera página o revise el ejemplo anterior.
¿Qué interpretación le podemos dar a ese resultado?
Podemos afirmar que el tiempo que fue más usual o frecuente al momento de grabar un video de TikTok por los estudiantes de 10°A fue de aproximadamente 82 segundos y medio o 82,5 segundos. “Recuerda que la moda es el dato que en promedio más se repite en un conjunto de datos.