Intervalos de confianza para medias poblacionales y proporciones grandes
Respuesta rápida
Para calcular intervalos de confianza en medias poblacionales, la distribución de las medias muestrales sigue una normal con media μ y desviación σ/√n. El error admisible es E = Z(α/2) × σ/√n, y para reducirlo debes aumentar el tamaño de la muestra n o disminuir el nivel de confianza.
Puntos clave
Distribución de medias muestrales
Las medias de muestras siguen una normal N(μ, σ/√n), con menor variabilidad que la población original.
Error admisible
Se calcula como E = Z(α/2) × σ/√n y mide la precisión del intervalo de confianza.
Compromiso error-confianza
Para reducir el error: aumentar n o disminuir el nivel de confianza. No se pueden maximizar ambos.
Tamaño mínimo de muestra
Fórmula n ≥ (Z(α/2) × σ / E)² para garantizar un error máximo admisible.
Aproximación normal para proporciones
Cuando n×p ≥ 5 y n×(1-p) ≥ 5, la binomial se aproxima a una normal para simplificar cálculos.
Paso a paso
Identifica si trabajas con medias poblacionales o proporciones grandes
Para medias muestrales: calcula la nueva desviación típica como σ' = σ/√n
Calcula el error admisible: E = Z(α/2) × σ/√n
Para hallar el tamaño mínimo de muestra, despeja n de la fórmula del error
Para proporciones grandes: aproxima la binomial a una normal con μ = n×p y σ = √(p(1-p)/n)
Ejemplos resueltos
Problema 1Una población tiene media μ = 50 y desviación típica σ = 10. Si tomamos muestras de tamaño n = 25, ¿cuál es el error admisible para un nivel de confianza del 95%?
Una población tiene media μ = 50 y desviación típica σ = 10. Si tomamos muestras de tamaño n = 25, ¿cuál es el error admisible para un nivel de confianza del 95%?
Solución:
- 1Identificamos los datos: μ = 50, σ = 10, n = 25, nivel de confianza = 95%
- 2Para 95% de confianza, Z(α/2) = Z(0.025) = 1.96
- 3Calculamos la desviación de las medias muestrales: σ' = σ/√n = 10/√25 = 10/5 = 2
- 4Aplicamos la fórmula del error: E = Z(α/2) × σ/√n = 1.96 × 2 = 3.92
El error admisible es E = 3.92 unidades
Verificación: El intervalo de confianza sería (50-3.92, 50+3.92) = (46.08, 53.92)
Problema 2¿Cuál es el tamaño mínimo de muestra necesario para que el error máximo sea de 2 unidades, con σ = 10 y nivel de confianza del 95%?
¿Cuál es el tamaño mínimo de muestra necesario para que el error máximo sea de 2 unidades, con σ = 10 y nivel de confianza del 95%?
Solución:
- 1Tenemos: E ≤ 2, σ = 10, Z(α/2) = 1.96
- 2Partimos de la fórmula: E = Z(α/2) × σ/√n
- 3Despejamos n: n ≥ (Z(α/2) × σ / E)²
- 4Sustituimos: n ≥ (1.96 × 10 / 2)² = (9.8)² = 96.04
Se necesita un tamaño mínimo de muestra n = 97 (redondeando hacia arriba)
Verificación: Con n = 97, el error sería E = 1.96 × 10/√97 ≈ 1.99 < 2 ✓
Problema 3En una encuesta con proporción p = 0.4 y muestra de n = 400, calcula el intervalo de confianza al 95% usando la aproximación normal.
En una encuesta con proporción p = 0.4 y muestra de n = 400, calcula el intervalo de confianza al 95% usando la aproximación normal.
Solución:
- 1Verificamos que podemos aproximar: n×p = 160 > 5 y n×(1-p) = 240 > 5 ✓
- 2Calculamos la desviación: σ = √(p(1-p)/n) = √(0.4×0.6/400) = √(0.0006) ≈ 0.0245
- 3El error es: E = Z(α/2) × σ = 1.96 × 0.0245 ≈ 0.048
- 4El intervalo es: (p - E, p + E) = (0.4 - 0.048, 0.4 + 0.048)
El intervalo de confianza al 95% es (0.352, 0.448) o (35.2%, 44.8%)
Verificación: La proporción poblacional estará en este intervalo con 95% de confianza
Intervalos de confianza para medias poblacionales y proporciones grandes
Introducción
En estadística inferencial, uno de los objetivos principales es estimar parámetros poblacionales a partir de muestras. Este artículo aborda dos situaciones fundamentales: el cálculo de intervalos de confianza cuando trabajamos con medias de muestras poblacionales y la aproximación de distribuciones binomiales a normales cuando las proporciones son muy grandes.
Estos conceptos son esenciales para cualquier estudiante que prepare la Selectividad en la asignatura de Matemáticas aplicadas a las Ciencias Sociales, ya que aparecen frecuentemente en los exámenes y tienen aplicaciones prácticas en investigación, encuestas y análisis de datos.
Distribución de las medias muestrales
El concepto de media muestral
Cuando estudiamos una población, raramente tenemos acceso a todos sus elementos. En su lugar, tomamos muestras y calculamos estadísticos que nos permitan inferir información sobre la población.
Supongamos que tomamos una muestra M₁ de tamaño n con elementos {x₁, x₂, ..., xₙ}. La media muestral se calcula como:
$$\bar{x} = \frac{x_1 + x_2 + ... + x_n}{n} = \frac{\sum_{i=1}^{n} x_i}{n}$$
Si tomamos múltiples muestras del mismo tamaño (M₁, M₂, M₃...), cada una tendrá su propia media. ¿Cómo se distribuyen estas medias?
Teorema central del límite aplicado
Si la variable original sigue una distribución normal N(μ, σ), entonces la distribución de las medias muestrales también es normal, pero con parámetros diferentes:
$$\bar{X} \sim N\left(\mu, \frac{\sigma}{\sqrt{n}}\right)$$
Esto nos dice dos cosas importantes:
-
La media de las medias muestrales es igual a la media poblacional (μ). Es decir, las medias muestrales están centradas en el valor correcto.
-
La desviación típica de las medias muestrales es σ/√n, que es menor que la desviación poblacional σ. Esto significa que las medias muestrales varían menos que los datos individuales.
Esta segunda propiedad es intuitiva: al promediar valores, los extremos se compensan entre sí, produciendo resultados más estables.
Error admisible en intervalos de confianza
Fórmula del error
El intervalo de confianza para la media poblacional, cuando trabajamos con medias muestrales, tiene la forma:
$$\left(\bar{x} - Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}, \quad \bar{x} + Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}\right)$$
La diferencia entre los extremos del intervalo (su amplitud) depende del error admisible E:
$$E = Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$$
Donde:
- Z(α/2) es el valor crítico de la normal estándar según el nivel de confianza (1.96 para 95%, 2.576 para 99%)
- σ es la desviación típica poblacional (dato conocido o estimado)
- n es el tamaño de la muestra
Cómo reducir el error
Del análisis de la fórmula se extraen dos conclusiones prácticas:
Si fijamos el nivel de confianza (y por tanto Z(α/2) es constante), la única forma de reducir el error es aumentar el tamaño de la muestra. Sin embargo, como n está bajo el signo de raíz cuadrada, la relación no es lineal:
- Para reducir el error a la mitad, hay que cuadruplicar el tamaño de la muestra
- Para reducir el error a un tercio, hay que multiplicar n por 9
Si fijamos el tamaño de la muestra, para reducir el error debemos disminuir el nivel de confianza. Esto implica aceptar una menor certeza en nuestras conclusiones. Es un compromiso entre precisión y seguridad.
Cálculo del tamaño mínimo de muestra
La fórmula fundamental
Una pregunta frecuente en estadística es: "¿cuántas observaciones necesito para garantizar un error máximo determinado?"
Partiendo de la fórmula del error E = Z(α/2) × σ/√n, si queremos que el error no supere un valor máximo E, despejamos n:
$$n \geq \left(\frac{Z_{\alpha/2} \cdot \sigma}{E}\right)^2$$
Ejemplo práctico
Supongamos que queremos estimar la media de una población con σ = 15, con un error máximo de 3 unidades y nivel de confianza del 95%.
- Identificamos: σ = 15, E = 3, Z(0.025) = 1.96
- Aplicamos: n ≥ (1.96 × 15 / 3)² = (9.8)² = 96.04
- Conclusión: necesitamos al menos 97 observaciones
Importante: Siempre redondeamos hacia arriba, ya que necesitamos un número entero de observaciones y debe ser suficiente para cumplir la condición.
Intervalos de confianza para proporciones grandes
El problema con las binomiales grandes
Cuando trabajamos con una distribución binomial B(n, p) donde n es muy grande (por ejemplo, miles de repeticiones), los cálculos directos se vuelven impracticables:
- Los números combinatorios crecen enormemente
- Las potencias de p y (1-p) son difíciles de manejar
- Los cálculos son propensos a errores
La aproximación normal
Cuando n es suficientemente grande (regla práctica: n×p ≥ 5 y n×(1-p) ≥ 5), podemos aproximar la binomial por una normal:
$$B(n, p) \approx N(np, \sqrt{np(1-p)})$$
Para proporciones, donde p es la proporción muestral de éxitos, usamos:
- Media: p
- Desviación típica: √(p(1-p)/n)
Intervalo de confianza para proporciones
El intervalo de confianza al nivel 1-α para una proporción poblacional es:
$$\left(p - Z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}, \quad p + Z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}\right)$$
Y el error admisible correspondiente:
$$E = Z_{\alpha/2} \cdot \sqrt{\frac{p(1-p)}{n}}$$
Tamaño de muestra para proporciones
De forma análoga, el tamaño mínimo de muestra para proporciones es:
$$n \geq \left(\frac{Z_{\alpha/2}}{E}\right)^2 \cdot p(1-p)$$
Nota práctica: Si no conocemos p de antemano (situación habitual al diseñar un estudio), usamos p = 0.5, que maximiza p(1-p) = 0.25 y nos da el tamaño de muestra más conservador.
Resumen de fórmulas clave
Para medias poblacionales
| Concepto | Fórmula |
|---|---|
| Distribución de medias muestrales | N(μ, σ/√n) |
| Error admisible | E = Z(α/2) × σ/√n |
| Tamaño mínimo de muestra | n ≥ (Z(α/2) × σ / E)² |
Para proporciones (aproximación normal)
| Concepto | Fórmula |
|---|---|
| Condición de aproximación | n×p ≥ 5 y n×(1-p) ≥ 5 |
| Error admisible | E = Z(α/2) × √(p(1-p)/n) |
| Tamaño mínimo de muestra | n ≥ (Z(α/2)/E)² × p(1-p) |
Conclusiones
El estudio de intervalos de confianza para medias poblacionales y proporciones grandes es fundamental en estadística inferencial. Las ideas clave son:
- Las medias muestrales se distribuyen normalmente con menor variabilidad que los datos originales
- El error depende inversamente de √n, por lo que aumentar la precisión requiere aumentar significativamente el tamaño de la muestra
- Existe un compromiso entre precisión y confianza: no se puede maximizar ambas simultáneamente
- La aproximación normal simplifica el trabajo con proporciones cuando n es grande
Dominar estas fórmulas y entender cuándo aplicar cada una es esencial para resolver con éxito los problemas de probabilidad e inferencia estadística en Selectividad.
Errores comunes
Usar σ en lugar de σ/√n para medias muestrales
El error calculado es mucho mayor de lo esperado para el tamaño de muestra
Siempre divide la desviación típica poblacional entre √n cuando trabajes con distribución de medias muestrales
Confundir el efecto de aumentar n sobre el error
Pensar que duplicar n reduce el error a la mitad
Como n está bajo raíz cuadrada, para reducir el error a la mitad necesitas cuadruplicar el tamaño de muestra
Redondear hacia abajo el tamaño mínimo de muestra
El error calculado con ese n supera el error máximo admisible
Siempre redondea hacia arriba cuando calcules tamaño mínimo de muestra
Aplicar la aproximación normal a binomiales con n pequeño
n×p < 5 o n×(1-p) < 5
Solo aproxima a normal cuando tanto n×p como n×(1-p) sean mayores que 5
Pensar que más confianza siempre es mejor
Se aumenta el nivel de confianza sin considerar el aumento del error
A mayor nivel de confianza, mayor error admisible. Hay que equilibrar ambos según las necesidades del estudio
Glosario
- Media muestral
- Promedio de los valores de una muestra, calculado como la suma de todos los valores dividido entre el tamaño de la muestra n.
- Desviación típica de las medias muestrales
- Es σ/√n, donde σ es la desviación típica poblacional y n el tamaño de la muestra. También llamada error estándar de la media.
- Error admisible
- Máxima diferencia tolerable entre el estadístico muestral y el parámetro poblacional. Se calcula como E = Z(α/2) × σ/√n.
- Nivel de confianza
- Probabilidad de que el intervalo de confianza contenga el verdadero valor del parámetro. Se expresa como 1 - α (por ejemplo, 95%).
- Z(α/2)
- Valor crítico de la distribución normal estándar que deja un área de α/2 en cada cola. Para 95% de confianza, Z(0.025) = 1.96.
- Aproximación normal de la binomial
- Cuando n es grande, una distribución binomial B(n,p) puede aproximarse por una normal N(np, √(np(1-p))).
- Tamaño muestral mínimo
- Número mínimo de observaciones necesarias para garantizar un error máximo admisible con un nivel de confianza dado.
- Proporción muestral
- Frecuencia relativa de éxitos en una muestra, utilizada para estimar la proporción poblacional p.
Preguntas frecuentes
¿Por qué la desviación típica de las medias muestrales es σ/√n y no simplemente σ?
Porque las medias muestrales varían menos que los datos individuales; al promediar, se compensan las desviaciones extremas.
Cuando tomamos múltiples muestras y calculamos sus medias, estas medias tienden a estar más concentradas alrededor de la media poblacional que los datos individuales. Esto ocurre porque los valores extremos de una muestra se compensan parcialmente entre sí al calcular el promedio. Matemáticamente, esto se refleja dividiendo la desviación típica poblacional entre √n.
¿Cómo puedo reducir el error en un intervalo de confianza?
Aumentando el tamaño de la muestra o disminuyendo el nivel de confianza.
Si mantienes el nivel de confianza fijo, la única forma de reducir el error es aumentar n. Pero cuidado: como n está bajo raíz cuadrada, para reducir el error a la mitad necesitas cuadruplicar la muestra. Alternativamente, si reduces el nivel de confianza (por ejemplo, de 95% a 90%), el valor Z(α/2) disminuye y con ello el error, pero a costa de menor certeza en tu conclusión.
¿Cuál es la fórmula para calcular el tamaño mínimo de muestra?
n ≥ (Z(α/2) × σ / E)², donde E es el error máximo admisible.
Esta fórmula se obtiene despejando n de la ecuación del error E = Z(α/2) × σ/√n. Es muy útil en la fase de diseño de un estudio estadístico, pues permite saber cuántas observaciones necesitas recoger para garantizar una precisión determinada en tus estimaciones.
¿Cuándo puedo aproximar una binomial a una normal?
Cuando n×p ≥ 5 y n×(1-p) ≥ 5, es decir, cuando hay suficientes éxitos y fracasos esperados.
La aproximación funciona porque, con muchas repeticiones, la distribución binomial se vuelve simétrica y acampanada, pareciéndose a una normal. Los parámetros de esta normal son: media μ = n×p y desviación típica σ = √(n×p×(1-p)). Esta aproximación simplifica enormemente los cálculos cuando trabajar directamente con la binomial sería muy complejo.
¿Qué significa que el nivel de confianza sea del 95%?
Significa que si repitiéramos el muestreo muchas veces, el 95% de los intervalos construidos contendrían el verdadero valor del parámetro.
Es importante entender que no decimos 'hay un 95% de probabilidad de que el parámetro esté en este intervalo concreto'. El parámetro poblacional es un valor fijo (aunque desconocido). Lo que varía es el intervalo, que depende de la muestra obtenida. El 95% se refiere a la proporción de intervalos correctos si repitiéramos el procedimiento infinitas veces.
¿Por qué al aumentar el nivel de confianza aumenta también el error?
Porque para tener más certeza de capturar el parámetro, el intervalo debe ser más amplio.
Al aumentar el nivel de confianza (por ejemplo, de 95% a 99%), el valor Z(α/2) aumenta (de 1.96 a 2.576). Como el error es proporcional a Z(α/2), también aumenta. Intuitivamente, si quieres estar 'más seguro' de atrapar el verdadero valor, necesitas lanzar una 'red más grande', es decir, un intervalo más amplio.
¿Cuál es la fórmula del error admisible para proporciones?
E = Z(α/2) × √(p(1-p)/n), donde p es la proporción muestral.
Esta fórmula es análoga a la de medias, pero usando la desviación típica específica para proporciones. Si no conoces p previamente, puedes usar p = 0.5 para obtener el error máximo posible, ya que p(1-p) alcanza su valor máximo cuando p = 0.5.
¿Cómo afecta el tamaño de la muestra a la distribución de las medias muestrales?
A mayor tamaño de muestra, las medias muestrales se concentran más alrededor de la media poblacional.
La distribución de las medias muestrales tiene la misma media que la población (μ), pero su desviación típica es σ/√n. Por tanto, al aumentar n, la desviación disminuye, lo que significa que las medias muestrales estarán más agrupadas cerca del valor verdadero. Esto es el fundamento de por qué muestras más grandes dan estimaciones más precisas.
Artículos relacionados
Reunión de mejora continua en Ucademy: comunicación y experiencia educativa
Reunión del equipo de Ucademy para discutir mejoras en comunicación, actualización de materiales y cómo potenciar la experiencia educativa de los estudiantes.
Derivada por definición: cálculo paso a paso con ejemplos resueltos
Domina el cálculo de derivadas por definición con ejemplos prácticos de x³, logaritmo neperiano y función seno. Método paso a paso con límites.
Cómo resolver la indeterminación 1 elevado a infinito en límites
Método completo para resolver límites con indeterminación 1^∞ cuando x tiende a un valor finito, usando la transformación con el número e.
Tipos de discontinuidad en funciones: evitable, salto finito y salto infinito
Guía completa sobre los tipos de discontinuidad en funciones matemáticas: discontinuidad evitable, de salto finito, de salto infinito y asintótica con ejemplos.
Indeterminación infinito menos infinito: cómo resolverla paso a paso
Domina la resolución de límites con indeterminación infinito menos infinito mediante factorización y racionalización de fracciones.
Cálculo de límites indeterminados: uno elevado a infinito y el número e
Método completo para resolver indeterminaciones del tipo 1^∞ y 1^(-∞) utilizando el número e en el cálculo de límites cuando x tiende a infinito.
¿Quieres aprender más sobre este tema?
Este contenido es parte del curso Matemáticas Ciencias Sociales | Selectividad de Acceso a la Universidad Ucademy. Contacta con nosotros para más información o descarga este artículo en PDF.