Formulario de Estadística I

Un formulario (de fórmulas) es un documento de apoyo que reúne fórmulas, definiciones y símbolos importantes de una materia para consultarlos fácilmente al estudiar o resolver ejercicios.

👉 Sirve para recordar cómo se hacen los cálculos sin tener que memorizar todo.

1. Organización de datos

1.1 Análisis exploratorio de datos: diagrama de tallo y hoja

Representación de datos numéricos donde el tallo agrupa los valores y la hoja muestra cada dato, facilitando observar la distribución.

1.2 Escalas de medición

  • Nominal: clasifica datos sin orden (color, sexo).

  • Ordinal: clasifica con orden (niveles, rangos).

  • Intervalo: datos con distancia igual, sin cero absoluto (temperatura).

  • Razón: datos con distancia igual y cero absoluto (edad, peso).

1.3 Tablas de frecuencia para variables discretas y continuas

Organizan los datos mostrando cuántas veces aparece cada valor o intervalo.

1.4 Intervalo de clase y límites de clase

  • Intervalo de clase: rango que agrupa los datos.

  • Límites de clase: valores mínimo y máximo del intervalo.

1.5 Anchura del intervalo de clase

Es la amplitud de cada intervalo.
Fórmula:
Anchura = Límite superior − Límite inferior

1.6 Marca de clase

Es el valor central del intervalo.
Fórmula:
Marca de clase = (Límite inferior + Límite superior) / 2

1.7 Distribución de frecuencia relativa y acumulada

  • Frecuencia relativa: proporción o porcentaje de un dato.

  • Frecuencia acumulada: suma progresiva de las frecuencias.

2. Presentación de datos: gráficas y curvas

2.1 Gráfica para datos cualitativos

  • Gráfica de barras: compara categorías.

  • Gráfica de pastel: representa porcentajes.

2.2 Gráfica para datos cuantitativos

  • Histograma: distribución de datos continuos.

  • Polígono de frecuencia: unión de marcas de clase.

  • Ojiva: gráfica de frecuencia acumulada.

2.3 Gráficas de líneas de series de tiempo

Muestran el comportamiento de un dato a lo largo del tiempo.

2.4 Diagramas de caja

Representan la dispersión de los datos mediante cuartiles, mediana y valores extremos.

3. Medidas de posición y de tendencia central

3.1 Media aritmética (promedio)

Definición:
Es la suma de todos los datos dividida entre el número total de datos.

Fórmula (datos no agrupados):

3.2 Mediana

Definición:
Es el valor central cuando los datos están ordenados.

Ejemplo:
Datos: 3, 5, 7, 9, 11
La mediana es 7 (el valor del centro).

Si hay dos valores centrales:
Datos: 4, 6, 8, 10

3.3 Moda

Definición:
Es el valor que más se repite.

Ejemplo:
Datos: 2, 4, 4, 6, 8
La moda es 4.

3.4 Media geométrica

Definición:
Se usa cuando los datos representan crecimientos o razones.

3.5 Promedio móvil

Definición:
Es el promedio de un grupo fijo de datos consecutivos.
Se usa para analizar tendencias en el tiempo.

Ejemplo:
Datos: 10, 12, 14, 16
Promedio móvil de 2 datos:

  • (10 + 12) / 2 = 11

  • (12 + 14) / 2 = 13

  • (14 + 16) / 2 = 15

3.6 Media armónica

Definición:
Se usa cuando los datos son tasas o velocidades.

3.7 Cuartiles, deciles y percentiles

Definición:
Son medidas que dividen los datos ordenados:

  • Cuartiles (Q): dividen en 4 partes

  • Deciles (D): dividen en 10 partes

  • Percentiles (P): dividen en 100 partes

Ejemplo simple:
Si el percentil 50, es el valor donde el 50% de los datos queda por debajo
👉 es la mediana.

cuartiles

Deciles

Percentiles

4. Medidas de variabilidad o de dispersión

4.1 Rango

Definición:
Es la diferencia entre el valor mayor y el valor menor del conjunto de datos.

4.2 Desviación media absoluta

Definición:
Es el promedio de las distancias absolutas de cada dato respecto a la media.

4.3 Varianza

Definición:
Mide qué tanto se alejan los datos de la media.

4.4 Desviación estándar

Definición:
Es la raíz cuadrada de la varianza y expresa la dispersión en las mismas unidades que los datos.

4.5 Coeficiente de variación

Definición:
Mide la variabilidad relativa respecto a la media, expresada en porcentaje.

4.6 Medidas de forma: asimetría y curtosis

Asimetría:
Indica si la distribución se inclina a la derecha o izquierda.

  • Positiva → cola a la derecha

  • Negativa → cola a la izquierda

Curtosis:
Indica el grado de concentración de los datos alrededor de la media.

  • Alta → distribución más puntiaguda

  • Baja → distribución más plana

5. Probabilidad

5.1 Probabilidad clásica, frecuencial y subjetiva

Probabilidad clásica
Se basa en resultados igualmente probables.

Probabilidad frecuencial
Se basa en la frecuencia con que ocurre un evento al repetir un experimento.

Probabilidad subjetiva
Se basa en la opinión o experiencia personal, no tiene fórmula exacta.

Ejemplo:
“Creo que hay alta probabilidad de que apruebe el examen”.

5.2 Experimentos, eventos y espacio muestral

Experimento: acción que produce resultados (lanzar una moneda).
Evento: resultado del experimento.
Espacio muestral (S): conjunto de todos los resultados posibles.

Ejemplo:
Moneda →
S={cara, cruz}

5.3 Reglas de conteo: permutaciones y combinaciones

Permutaciones (importa el orden):

Combinaciones (no importa el orden):

5.4 Reglas de la probabilidad

Regla de la suma (eventos excluyentes):

Regla del complemento

5.5 Eventos dependientes, independientes y condicionales

Eventos independientes:
Uno no afecta al otro.

5.6 Teorema de Bayes

Definición:
Permite calcular una probabilidad condicionada usando información previa.

5.7 Diagrama de árbol

Definición:
Representa gráficamente los resultados posibles de un experimento.

Ejemplo:
Moneda + dado → ramas para cada resultado.

5.8 Esperanza matemática

Definición:
Es el valor promedio esperado de un experimento aleatorio.

6. Variables aleatorias discretas y su distribución de probabilidad

6.1 Probabilidad clásica, frecuencial y subjetiva

Probabilidad clásica
Se usa cuando todos los resultados son igualmente probables.

Probabilidad frecuencial
Se basa en la repetición de un experimento.

Probabilidad subjetiva
Depende del juicio personal o experiencia, no tiene fórmula.

Ejemplo:
“Creo que tengo alta probabilidad de aprobar el examen”.

6.2 Distribución de probabilidad de una variable aleatoria discreta

Definición:
Es una tabla o función que asigna una probabilidad a cada valor posible de una variable aleatoria discreta.

Condición:
La suma de todas las probabilidades debe ser 1.

6.3 Distribución Bernoulli

Definición:
Modelo de probabilidad con solo dos resultados posibles: éxito o fracaso.

6.4 Distribución binomial y multinomial

Distribución binomial

Definición:
Se usa cuando un experimento Bernoulli se repite varias veces de forma independiente.

Distribución multinomial

Definición:
Extiende la binomial cuando hay más de dos posibles resultados.