Matemáticas Ciencias Sociales
intervalos de confianza
medias poblacionales
error admisible

Intervalos de confianza para medias poblacionales y proporciones grandes

AAcceso a la Universidad Ucademy
Matemáticas Ciencias Sociales | Selectividad
6:26
6:26
Momentos clave del video

Respuesta rápida

Para calcular intervalos de confianza en medias poblacionales, la distribución de las medias muestrales sigue una normal con media μ y desviación σ/√n. El error admisible es E = Z(α/2) × σ/√n, y para reducirlo debes aumentar el tamaño de la muestra n o disminuir el nivel de confianza.

Puntos clave

📊

Distribución de medias muestrales

Las medias de muestras siguen una normal N(μ, σ/√n), con menor variabilidad que la población original.

⚠️

Error admisible

Se calcula como E = Z(α/2) × σ/√n y mide la precisión del intervalo de confianza.

🔄

Compromiso error-confianza

Para reducir el error: aumentar n o disminuir el nivel de confianza. No se pueden maximizar ambos.

🔍

Tamaño mínimo de muestra

Fórmula n ≥ (Z(α/2) × σ / E)² para garantizar un error máximo admisible.

📈

Aproximación normal para proporciones

Cuando n×p ≥ 5 y n×(1-p) ≥ 5, la binomial se aproxima a una normal para simplificar cálculos.

Paso a paso

1

Identifica si trabajas con medias poblacionales o proporciones grandes

Por qué funciona: Cada caso utiliza fórmulas diferentes para el intervalo de confianza
Error común: Usar la fórmula de proporciones cuando se trata de medias muestrales
2

Para medias muestrales: calcula la nueva desviación típica como σ' = σ/√n

Por qué funciona: La distribución de las medias muestrales tiene menor variabilidad que la población original
Error común: Olvidar dividir la desviación típica entre la raíz del tamaño muestral
3

Calcula el error admisible: E = Z(α/2) × σ/√n

Por qué funciona: Este error determina la amplitud del intervalo de confianza
Error común: Confundir Z(α/2) con Z(α)
4

Para hallar el tamaño mínimo de muestra, despeja n de la fórmula del error

Por qué funciona: Permite diseñar estudios con el error máximo admisible deseado
Error común: No redondear hacia arriba el resultado (siempre se necesita al menos ese número)
5

Para proporciones grandes: aproxima la binomial a una normal con μ = n×p y σ = √(p(1-p)/n)

Por qué funciona: Simplifica enormemente los cálculos cuando n es muy grande
Error común: Aplicar esta aproximación cuando n×p o n×(1-p) son menores que 5

Ejemplos resueltos

Problema 1

Una población tiene media μ = 50 y desviación típica σ = 10. Si tomamos muestras de tamaño n = 25, ¿cuál es el error admisible para un nivel de confianza del 95%?

Solución:

  1. 1Identificamos los datos: μ = 50, σ = 10, n = 25, nivel de confianza = 95%
  2. 2Para 95% de confianza, Z(α/2) = Z(0.025) = 1.96
  3. 3Calculamos la desviación de las medias muestrales: σ' = σ/√n = 10/√25 = 10/5 = 2
  4. 4Aplicamos la fórmula del error: E = Z(α/2) × σ/√n = 1.96 × 2 = 3.92
Respuesta

El error admisible es E = 3.92 unidades

Verificación: El intervalo de confianza sería (50-3.92, 50+3.92) = (46.08, 53.92)

Problema 2

¿Cuál es el tamaño mínimo de muestra necesario para que el error máximo sea de 2 unidades, con σ = 10 y nivel de confianza del 95%?

Solución:

  1. 1Tenemos: E ≤ 2, σ = 10, Z(α/2) = 1.96
  2. 2Partimos de la fórmula: E = Z(α/2) × σ/√n
  3. 3Despejamos n: n ≥ (Z(α/2) × σ / E)²
  4. 4Sustituimos: n ≥ (1.96 × 10 / 2)² = (9.8)² = 96.04
Respuesta

Se necesita un tamaño mínimo de muestra n = 97 (redondeando hacia arriba)

Verificación: Con n = 97, el error sería E = 1.96 × 10/√97 ≈ 1.99 < 2 ✓

Problema 3

En una encuesta con proporción p = 0.4 y muestra de n = 400, calcula el intervalo de confianza al 95% usando la aproximación normal.

Solución:

  1. 1Verificamos que podemos aproximar: n×p = 160 > 5 y n×(1-p) = 240 > 5 ✓
  2. 2Calculamos la desviación: σ = √(p(1-p)/n) = √(0.4×0.6/400) = √(0.0006) ≈ 0.0245
  3. 3El error es: E = Z(α/2) × σ = 1.96 × 0.0245 ≈ 0.048
  4. 4El intervalo es: (p - E, p + E) = (0.4 - 0.048, 0.4 + 0.048)
Respuesta

El intervalo de confianza al 95% es (0.352, 0.448) o (35.2%, 44.8%)

Verificación: La proporción poblacional estará en este intervalo con 95% de confianza

Intervalos de confianza para medias poblacionales y proporciones grandes

Introducción

En estadística inferencial, uno de los objetivos principales es estimar parámetros poblacionales a partir de muestras. Este artículo aborda dos situaciones fundamentales: el cálculo de intervalos de confianza cuando trabajamos con medias de muestras poblacionales y la aproximación de distribuciones binomiales a normales cuando las proporciones son muy grandes.

Estos conceptos son esenciales para cualquier estudiante que prepare la Selectividad en la asignatura de Matemáticas aplicadas a las Ciencias Sociales, ya que aparecen frecuentemente en los exámenes y tienen aplicaciones prácticas en investigación, encuestas y análisis de datos.

Distribución de las medias muestrales

El concepto de media muestral

Cuando estudiamos una población, raramente tenemos acceso a todos sus elementos. En su lugar, tomamos muestras y calculamos estadísticos que nos permitan inferir información sobre la población.

Supongamos que tomamos una muestra M₁ de tamaño n con elementos {x₁, x₂, ..., xₙ}. La media muestral se calcula como:

$$\bar{x} = \frac{x_1 + x_2 + ... + x_n}{n} = \frac{\sum_{i=1}^{n} x_i}{n}$$

Si tomamos múltiples muestras del mismo tamaño (M₁, M₂, M₃...), cada una tendrá su propia media. ¿Cómo se distribuyen estas medias?

Teorema central del límite aplicado

Si la variable original sigue una distribución normal N(μ, σ), entonces la distribución de las medias muestrales también es normal, pero con parámetros diferentes:

$$\bar{X} \sim N\left(\mu, \frac{\sigma}{\sqrt{n}}\right)$$

Esto nos dice dos cosas importantes:

  1. La media de las medias muestrales es igual a la media poblacional (μ). Es decir, las medias muestrales están centradas en el valor correcto.

  2. La desviación típica de las medias muestrales es σ/√n, que es menor que la desviación poblacional σ. Esto significa que las medias muestrales varían menos que los datos individuales.

Esta segunda propiedad es intuitiva: al promediar valores, los extremos se compensan entre sí, produciendo resultados más estables.

Error admisible en intervalos de confianza

Fórmula del error

El intervalo de confianza para la media poblacional, cuando trabajamos con medias muestrales, tiene la forma:

$$\left(\bar{x} - Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}, \quad \bar{x} + Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}\right)$$

La diferencia entre los extremos del intervalo (su amplitud) depende del error admisible E:

$$E = Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$$

Donde:

  • Z(α/2) es el valor crítico de la normal estándar según el nivel de confianza (1.96 para 95%, 2.576 para 99%)
  • σ es la desviación típica poblacional (dato conocido o estimado)
  • n es el tamaño de la muestra

Cómo reducir el error

Del análisis de la fórmula se extraen dos conclusiones prácticas:

Si fijamos el nivel de confianza (y por tanto Z(α/2) es constante), la única forma de reducir el error es aumentar el tamaño de la muestra. Sin embargo, como n está bajo el signo de raíz cuadrada, la relación no es lineal:

  • Para reducir el error a la mitad, hay que cuadruplicar el tamaño de la muestra
  • Para reducir el error a un tercio, hay que multiplicar n por 9

Si fijamos el tamaño de la muestra, para reducir el error debemos disminuir el nivel de confianza. Esto implica aceptar una menor certeza en nuestras conclusiones. Es un compromiso entre precisión y seguridad.

Cálculo del tamaño mínimo de muestra

La fórmula fundamental

Una pregunta frecuente en estadística es: "¿cuántas observaciones necesito para garantizar un error máximo determinado?"

Partiendo de la fórmula del error E = Z(α/2) × σ/√n, si queremos que el error no supere un valor máximo E, despejamos n:

$$n \geq \left(\frac{Z_{\alpha/2} \cdot \sigma}{E}\right)^2$$

Ejemplo práctico

Supongamos que queremos estimar la media de una población con σ = 15, con un error máximo de 3 unidades y nivel de confianza del 95%.

  1. Identificamos: σ = 15, E = 3, Z(0.025) = 1.96
  2. Aplicamos: n ≥ (1.96 × 15 / 3)² = (9.8)² = 96.04
  3. Conclusión: necesitamos al menos 97 observaciones

Importante: Siempre redondeamos hacia arriba, ya que necesitamos un número entero de observaciones y debe ser suficiente para cumplir la condición.

Intervalos de confianza para proporciones grandes

El problema con las binomiales grandes

Cuando trabajamos con una distribución binomial B(n, p) donde n es muy grande (por ejemplo, miles de repeticiones), los cálculos directos se vuelven impracticables:

  • Los números combinatorios crecen enormemente
  • Las potencias de p y (1-p) son difíciles de manejar
  • Los cálculos son propensos a errores

La aproximación normal

Cuando n es suficientemente grande (regla práctica: n×p ≥ 5 y n×(1-p) ≥ 5), podemos aproximar la binomial por una normal:

$$B(n, p) \approx N(np, \sqrt{np(1-p)})$$

Para proporciones, donde p es la proporción muestral de éxitos, usamos:

  • Media: p
  • Desviación típica: √(p(1-p)/n)

Intervalo de confianza para proporciones

El intervalo de confianza al nivel 1-α para una proporción poblacional es:

$$\left(p - Z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}, \quad p + Z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}\right)$$

Y el error admisible correspondiente:

$$E = Z_{\alpha/2} \cdot \sqrt{\frac{p(1-p)}{n}}$$

Tamaño de muestra para proporciones

De forma análoga, el tamaño mínimo de muestra para proporciones es:

$$n \geq \left(\frac{Z_{\alpha/2}}{E}\right)^2 \cdot p(1-p)$$

Nota práctica: Si no conocemos p de antemano (situación habitual al diseñar un estudio), usamos p = 0.5, que maximiza p(1-p) = 0.25 y nos da el tamaño de muestra más conservador.

Resumen de fórmulas clave

Para medias poblacionales

ConceptoFórmula
Distribución de medias muestralesN(μ, σ/√n)
Error admisibleE = Z(α/2) × σ/√n
Tamaño mínimo de muestran ≥ (Z(α/2) × σ / E)²

Para proporciones (aproximación normal)

ConceptoFórmula
Condición de aproximaciónn×p ≥ 5 y n×(1-p) ≥ 5
Error admisibleE = Z(α/2) × √(p(1-p)/n)
Tamaño mínimo de muestran ≥ (Z(α/2)/E)² × p(1-p)

Conclusiones

El estudio de intervalos de confianza para medias poblacionales y proporciones grandes es fundamental en estadística inferencial. Las ideas clave son:

  1. Las medias muestrales se distribuyen normalmente con menor variabilidad que los datos originales
  2. El error depende inversamente de √n, por lo que aumentar la precisión requiere aumentar significativamente el tamaño de la muestra
  3. Existe un compromiso entre precisión y confianza: no se puede maximizar ambas simultáneamente
  4. La aproximación normal simplifica el trabajo con proporciones cuando n es grande

Dominar estas fórmulas y entender cuándo aplicar cada una es esencial para resolver con éxito los problemas de probabilidad e inferencia estadística en Selectividad.

Errores comunes

Error

Usar σ en lugar de σ/√n para medias muestrales

Cómo detectarlo

El error calculado es mucho mayor de lo esperado para el tamaño de muestra

Cómo corregirlo

Siempre divide la desviación típica poblacional entre √n cuando trabajes con distribución de medias muestrales

Error

Confundir el efecto de aumentar n sobre el error

Cómo detectarlo

Pensar que duplicar n reduce el error a la mitad

Cómo corregirlo

Como n está bajo raíz cuadrada, para reducir el error a la mitad necesitas cuadruplicar el tamaño de muestra

Error

Redondear hacia abajo el tamaño mínimo de muestra

Cómo detectarlo

El error calculado con ese n supera el error máximo admisible

Cómo corregirlo

Siempre redondea hacia arriba cuando calcules tamaño mínimo de muestra

Error

Aplicar la aproximación normal a binomiales con n pequeño

Cómo detectarlo

n×p < 5 o n×(1-p) < 5

Cómo corregirlo

Solo aproxima a normal cuando tanto n×p como n×(1-p) sean mayores que 5

Error

Pensar que más confianza siempre es mejor

Cómo detectarlo

Se aumenta el nivel de confianza sin considerar el aumento del error

Cómo corregirlo

A mayor nivel de confianza, mayor error admisible. Hay que equilibrar ambos según las necesidades del estudio

Glosario

Media muestral
Promedio de los valores de una muestra, calculado como la suma de todos los valores dividido entre el tamaño de la muestra n.
Desviación típica de las medias muestrales
Es σ/√n, donde σ es la desviación típica poblacional y n el tamaño de la muestra. También llamada error estándar de la media.
Error admisible
Máxima diferencia tolerable entre el estadístico muestral y el parámetro poblacional. Se calcula como E = Z(α/2) × σ/√n.
Nivel de confianza
Probabilidad de que el intervalo de confianza contenga el verdadero valor del parámetro. Se expresa como 1 - α (por ejemplo, 95%).
Z(α/2)
Valor crítico de la distribución normal estándar que deja un área de α/2 en cada cola. Para 95% de confianza, Z(0.025) = 1.96.
Aproximación normal de la binomial
Cuando n es grande, una distribución binomial B(n,p) puede aproximarse por una normal N(np, √(np(1-p))).
Tamaño muestral mínimo
Número mínimo de observaciones necesarias para garantizar un error máximo admisible con un nivel de confianza dado.
Proporción muestral
Frecuencia relativa de éxitos en una muestra, utilizada para estimar la proporción poblacional p.

Preguntas frecuentes

¿Por qué la desviación típica de las medias muestrales es σ/√n y no simplemente σ?

Porque las medias muestrales varían menos que los datos individuales; al promediar, se compensan las desviaciones extremas.

Cuando tomamos múltiples muestras y calculamos sus medias, estas medias tienden a estar más concentradas alrededor de la media poblacional que los datos individuales. Esto ocurre porque los valores extremos de una muestra se compensan parcialmente entre sí al calcular el promedio. Matemáticamente, esto se refleja dividiendo la desviación típica poblacional entre √n.

¿Cómo puedo reducir el error en un intervalo de confianza?

Aumentando el tamaño de la muestra o disminuyendo el nivel de confianza.

Si mantienes el nivel de confianza fijo, la única forma de reducir el error es aumentar n. Pero cuidado: como n está bajo raíz cuadrada, para reducir el error a la mitad necesitas cuadruplicar la muestra. Alternativamente, si reduces el nivel de confianza (por ejemplo, de 95% a 90%), el valor Z(α/2) disminuye y con ello el error, pero a costa de menor certeza en tu conclusión.

¿Cuál es la fórmula para calcular el tamaño mínimo de muestra?

n ≥ (Z(α/2) × σ / E)², donde E es el error máximo admisible.

Esta fórmula se obtiene despejando n de la ecuación del error E = Z(α/2) × σ/√n. Es muy útil en la fase de diseño de un estudio estadístico, pues permite saber cuántas observaciones necesitas recoger para garantizar una precisión determinada en tus estimaciones.

¿Cuándo puedo aproximar una binomial a una normal?

Cuando n×p ≥ 5 y n×(1-p) ≥ 5, es decir, cuando hay suficientes éxitos y fracasos esperados.

La aproximación funciona porque, con muchas repeticiones, la distribución binomial se vuelve simétrica y acampanada, pareciéndose a una normal. Los parámetros de esta normal son: media μ = n×p y desviación típica σ = √(n×p×(1-p)). Esta aproximación simplifica enormemente los cálculos cuando trabajar directamente con la binomial sería muy complejo.

¿Qué significa que el nivel de confianza sea del 95%?

Significa que si repitiéramos el muestreo muchas veces, el 95% de los intervalos construidos contendrían el verdadero valor del parámetro.

Es importante entender que no decimos 'hay un 95% de probabilidad de que el parámetro esté en este intervalo concreto'. El parámetro poblacional es un valor fijo (aunque desconocido). Lo que varía es el intervalo, que depende de la muestra obtenida. El 95% se refiere a la proporción de intervalos correctos si repitiéramos el procedimiento infinitas veces.

¿Por qué al aumentar el nivel de confianza aumenta también el error?

Porque para tener más certeza de capturar el parámetro, el intervalo debe ser más amplio.

Al aumentar el nivel de confianza (por ejemplo, de 95% a 99%), el valor Z(α/2) aumenta (de 1.96 a 2.576). Como el error es proporcional a Z(α/2), también aumenta. Intuitivamente, si quieres estar 'más seguro' de atrapar el verdadero valor, necesitas lanzar una 'red más grande', es decir, un intervalo más amplio.

¿Cuál es la fórmula del error admisible para proporciones?

E = Z(α/2) × √(p(1-p)/n), donde p es la proporción muestral.

Esta fórmula es análoga a la de medias, pero usando la desviación típica específica para proporciones. Si no conoces p previamente, puedes usar p = 0.5 para obtener el error máximo posible, ya que p(1-p) alcanza su valor máximo cuando p = 0.5.

¿Cómo afecta el tamaño de la muestra a la distribución de las medias muestrales?

A mayor tamaño de muestra, las medias muestrales se concentran más alrededor de la media poblacional.

La distribución de las medias muestrales tiene la misma media que la población (μ), pero su desviación típica es σ/√n. Por tanto, al aumentar n, la desviación disminuye, lo que significa que las medias muestrales estarán más agrupadas cerca del valor verdadero. Esto es el fundamento de por qué muestras más grandes dan estimaciones más precisas.

Artículos relacionados

¿Quieres aprender más sobre este tema?

Este contenido es parte del curso Matemáticas Ciencias Sociales | Selectividad de Acceso a la Universidad Ucademy. Contacta con nosotros para más información o descarga este artículo en PDF.