
Aplicación práctica de la estadística
A partir de la información revisada hasta ahora y haciendo uso de la base de datos anexa, en esta sección del blog aplicaremos los conceptos estadísticos previamente explicados para la resolución de un problema real. El objetivo es demostrar que la estadística no solo se comprende en teoría, sino que también puede utilizarse como una herramienta práctica para analizar información y apoyar la toma de decisiones.
La base de datos utilizada en esta actividad se conformó con información proporcionada por la entidad financiera Bank América, lo que permitirá trabajar con datos reales relacionados con el ámbito bancario. A partir de estos datos, se obtendrán distintas medidas estadísticas, las cuales servirán para interpretar la información, identificar patrones y responder a las solicitudes planteadas.
Con este ejercicio se busca que el lector observe cómo los conceptos de estadística, como la media, mediana, moda y otras medidas, se aplican en un contexto real, facilitando su comprensión y mostrando su utilidad en situaciones cotidianas y profesionales. De esta manera, la estadística deja de percibirse como un tema complejo y se presenta como una herramienta accesible y funcional.
Información
La base de datos que se adjunto es la información suministrada por la entidad financiera Bank América.
Con base en la tabla, realiza lo siguiente:
A) Clasifica cada variable en cualitativa o cuantitativa (discreta o continua)
Como podemos observar en la tabla, se encuentran nuestras variables de datos divididas en tipo de variable donde: cualitativa son nuestros datos NO numéricos y cuantitativos son nuestros datos Numéricos. También podemos observar una clasificación especifica donde:
🔹 Nominal
Los datos nominales clasifican información en categorías sin orden.
👉 No se pueden comparar ni ordenar.
🔹 Discreta
Los datos discretos representan cantidades contables y toman valores enteros.
👉 No admiten decimales.
🔹 Continua
Los datos continuos representan mediciones y pueden tomar valores con decimales.
👉 Se miden, no se cuentan.
b) Elabora una distribución de frecuencias absolutas y relativas para los datos agrupados de la variable salario anual y represéntalas con las gráficas correspondientes
Las frecuencias absolutas y relativas son conceptos básicos de estadística que sirven para contar y comparar datos.
📌 Frecuencia absoluta
Es la cantidad de veces que aparece un dato o valor en un conjunto de datos.
📌 Frecuencia relativa
Es la proporción o porcentaje que representa un dato respecto al total de datos.
Se obtiene dividiendo la frecuencia absoluta entre el total.
📊 Resumen rápido
-
Frecuencia absoluta → cuántas veces aparece un dato
-
Frecuencia relativa → qué parte o porcentaje representa ese dato del total
Frecuencias absolutas y relativas
Intervalos de amplitud $10,000.
Mínimo = 16,950
Máximo = 60,985
n = 40
Gráficos
📊 Histograma
Es una gráfica que representa la distribución de datos numéricos continuos.
Características:
-
Usa intervalos (clases)
-
Las barras van pegadas
-
Muestra frecuencias
Se usa cuando:
-
Analizas datos como edades, estaturas, calificaciones, pesos, etc.
📊 Gráfico de barras
Representa datos categóricos o discretos mediante barras.
Características:
-
Las barras están separadas
-
Cada barra representa una categoría
-
Puede mostrar frecuencias o cantidades
Se usa cuando:
-
Comparas categorías como género, tipo de producto, colores favoritos, etc.
🥧 Gráfico de pastel (o de porcentajes)
Es una gráfica circular que muestra proporciones o porcentajes de un total.
Características:
-
El total representa el 100%
-
Cada sección es una parte del todo
-
Ideal para porcentajes
Se usa cuando:
-
Quieres ver cómo se reparte un total
📌 Resumen rápido
c) Determina la media aritmética, la moda y la mediana para los datos agrupados de la variable salario anual, selecciona una de ellas para que represente al conjunto y explícala
Media aritmética
Suma total salarios = 1,313,610
xˉ=1,313,610/40
Media = $32,840.25
Mediana
Al ordenar los 40 salarios:
Los valores centrales son:
30,730
31,050
Mediana=(30,730+31,050)/2
Mediana = $30,890
Moda (datos individuales)
No hay un único salario que se repita con gran frecuencia.
Algunos salarios se repiten dos veces (ej. 21,900; 240 meses experiencia, etc.), pero no existe moda dominante clara en salario exacto.
En datos agrupados:
Clase modal = 20,000–29,999
Medida representativa adecuada
Se mantiene que la mediana ($30,890) representa mejor el conjunto porque:
- Hay valores altos (60,985 y 60,375)
- La distribución presenta ligera asimetría positiva
d) Escribe una conclusión sobre la distribución de los datos
La distribución salarial es asimétrica positiva (sesgo a la derecha), ya que existen algunos salarios altos que elevan la media por encima de la mediana.
La mayor concentración (67.5%) se encuentra entre $20,000 y $39,999, lo que indica que la mayoría del personal percibe ingresos medios.
Esta característica se refleja en el hecho de que la media aritmética es mayor que la mediana, evidenciando la influencia de los valores extremos en el comportamiento general de la distribución.
Este tipo de distribución sugiere una desigualdad en la percepción de ingresos dentro del grupo estudiado, donde pocos individuos con salarios elevados incrementan el promedio general, pero no representan la realidad económica de la mayoría. Por esta razón, el uso de la mediana como medida representativa resulta más adecuado, ya que permite describir de manera más precisa el comportamiento central de los datos y facilita una interpretación más justa de la situación salarial del conjunto analizado.
En conclusión, el análisis de la distribución de los salarios anuales demuestra la importancia de seleccionar adecuadamente la medida de tendencia central, ya que una elección incorrecta podría conducir a interpretaciones erróneas sobre el nivel real de ingresos de la población estudiada.
e) Elabora una distribución de frecuencias relativas de la variable tipo de contrato y represéntalas con la gráfica pertinente
f) Obtén la medida de tendencia central correspondiente a este tipo de variable y al respecto escribe una conclusión
Para variables nominales se utiliza la moda.
El análisis del tipo de contrato, al tratarse de una variable cualitativa nominal, se apoya correctamente en la moda como medida de tendencia central, ya que esta permite identificar la categoría que se presenta con mayor frecuencia dentro del conjunto de datos. En este caso, la distribución es bimodal, pues dos categorías —contrato indefinido y contrato anual— comparten la frecuencia más alta, con 16 casos cada una, lo que equivale al 40 % del total respectivamente.
Este resultado evidencia que ocho de cada diez personas cuentan con contratos que implican una duración relativamente prolongada, lo cual refleja una preferencia institucional por modalidades contractuales más estables. La presencia mayoritaria de contratos indefinidos y anuales sugiere que la organización busca mantener continuidad laboral, reducir la rotación de personal y fortalecer el compromiso de los trabajadores con la empresa. Además, este tipo de contratación suele asociarse con mayores beneficios laborales, seguridad económica y mejores condiciones de planeación a largo plazo para los empleados.
Por otro lado, el contrato temporal, con una frecuencia de solo 8 casos (20 %), ocupa un lugar claramente secundario dentro de la estructura contractual. Esto indica que su uso está limitado a necesidades específicas, como cubrir ausencias, atender picos de trabajo o realizar actividades de carácter provisional. La menor proporción de este tipo de contrato refuerza la idea de que no constituye la base principal del sistema de contratación, sino un complemento.
En este caso existe bimodalidad, ya que:
- Indefinido = 40%
- Anual = 40%
Ambos tipos de contrato comparten la mayor frecuencia.
La institución presenta una estructura laboral equilibrada entre contratos indefinidos y anuales, que juntos representan el 80% del personal. Solo el 20% corresponde a contratos temporales. No existe un único tipo de contrato predominante, sino una distribución dual dominante.
g) Realiza un diagrama de tallo y hojas de la variable experiencia laboral y al respecto escribe una conclusión
El diagrama de tallo y hoja es una representación gráfica de datos numéricos que organiza la información separando cada valor en tallo (parte inicial) y hoja (parte final), permitiendo observar fácilmente la distribución y frecuencia de los datos.
La mayor concentración de experiencia laboral se encuentra entre 200–299 meses.