Intervalos de confianza en la distribución normal: cálculo y aplicación
Respuesta rápida
Un intervalo de confianza en la distribución normal es un rango alrededor de la media que indica la probabilidad de que un valor se encuentre dentro de él. Para calcularlo, se tipifica la variable (Z = (X-μ)/σ), se consultan los valores críticos Z(α/2) en la tabla de la normal estándar según el nivel de confianza deseado, y se construye el intervalo como [μ - Z(α/2)·σ, μ + Z(α/2)·σ].
Puntos clave
Regla 68-95-99.7
μ±σ contiene 68.26%, μ±2σ contiene 95.44%, μ±3σ contiene ~100% de los datos
Nivel de confianza
Es 1-α, representa la probabilidad de que el valor esté en el intervalo
Nivel de riesgo
Es α, representa la probabilidad de error. Para 95% de confianza, α=0.05
Valores críticos
Para 95% son ±1.96, para 99% son ±2.58
Tipificación
Z = (X-μ)/σ transforma cualquier normal a N(0,1) para usar la tabla
Paso a paso
Identificar los parámetros de la distribución normal: media (μ) y desviación típica (σ)
Tipificar la variable: calcular Z = (X - μ) / σ para los extremos del intervalo
Consultar la tabla de la normal estándar para encontrar las probabilidades o valores críticos
Calcular la probabilidad del intervalo: P(a < X < b) = P(Z < z₂) - P(Z < z₁)
Si se pide el intervalo de confianza, despejar X de la expresión tipificada: X = μ ± Z(α/2)·σ
Ejemplos resueltos
Problema 1El tiempo empleado en minutos para obtener la respuesta de una prueba para detectar cierta enfermedad sigue una distribución normal de media 20 y desviación típica 4. ¿Qué porcentaje de las pruebas se obtiene el resultado entre 16 y 26 minutos?
El tiempo empleado en minutos para obtener la respuesta de una prueba para detectar cierta enfermedad sigue una distribución normal de media 20 y desviación típica 4. ¿Qué porcentaje de las pruebas se obtiene el resultado entre 16 y 26 minutos?
Solución:
- 1Identificar parámetros: μ = 20, σ = 4
- 2Tipificar los extremos: Z₁ = (16-20)/4 = -1 y Z₂ = (26-20)/4 = 1.5
- 3Calcular P(-1 < Z < 1.5) = P(Z < 1.5) - P(Z < -1)
- 4Consultar tabla: P(Z < 1.5) = 0.9332 y P(Z < -1) = 1 - P(Z < 1) = 1 - 0.8413 = 0.1587
- 5Restar: 0.9332 - 0.1587 = 0.7745
El 77.45% de las pruebas obtienen resultado entre 16 y 26 minutos
Verificación: Verificar que ambos valores tipificados están correctamente calculados y la resta de probabilidades es coherente
Problema 2Con la misma distribución anterior (μ=20, σ=4), ¿cuántos minutos son necesarios para garantizar que se ha obtenido la respuesta del 96.41% de las pruebas?
Con la misma distribución anterior (μ=20, σ=4), ¿cuántos minutos son necesarios para garantizar que se ha obtenido la respuesta del 96.41% de las pruebas?
Solución:
- 1El nivel de confianza es 0.9641, por tanto α = 1 - 0.9641 = 0.0359
- 2α/2 = 0.01795, luego buscamos P(Z < z) = 1 - 0.01795 = 0.98205
- 3En la tabla, P(Z < 2.1) ≈ 0.98205, por tanto Z(α/2) = 2.1
- 4Construir el intervalo: X = μ ± Z(α/2)·σ = 20 ± 2.1·4
- 5Calcular: 20 - 8.4 = 11.6 y 20 + 8.4 = 28.4
El intervalo de confianza es [11.6, 28.4] minutos, con una amplitud de 16.8 minutos
Verificación: Verificar que el valor crítico 2.1 corresponde aproximadamente a 0.98205 en la tabla
Problema 3El diámetro de las ciruelas de una determinada variedad se distribuye normalmente con media 4.5 cm y desviación 0.3 cm. Se desea seleccionar para exportación el 10% de las más grandes. ¿A partir de qué diámetro hay que seleccionarlas?
El diámetro de las ciruelas de una determinada variedad se distribuye normalmente con media 4.5 cm y desviación 0.3 cm. Se desea seleccionar para exportación el 10% de las más grandes. ¿A partir de qué diámetro hay que seleccionarlas?
Solución:
- 1Buscamos d tal que P(X ≥ d) = 0.10, es decir P(X < d) = 0.90
- 2Tipificar: P(Z < (d-4.5)/0.3) = 0.90
- 3Buscar en la tabla: P(Z < z) = 0.90 → z ≈ 1.285
- 4Despejar d: (d - 4.5)/0.3 = 1.285
- 5Calcular: d = 4.5 + 1.285 × 0.3 = 4.5 + 0.3855 = 4.8855
Las ciruelas deben tener un diámetro de al menos 4.88 cm (aproximadamente 4.9 cm)
Verificación: Comprobar que P(Z > 1.285) ≈ 0.10 usando la tabla
Intervalos de confianza en la distribución normal
Introducción
Cuando trabajamos con variables aleatorias continuas que siguen una distribución normal, es fundamental expresar nuestros resultados en forma de intervalos en lugar de valores puntuales. Estos intervalos, conocidos como intervalos de confianza, nos permiten establecer con qué probabilidad un valor se encontrará dentro de un rango determinado.
La confianza que depositamos en estos intervalos depende directamente del nivel de riesgo que estemos dispuestos a asumir. Cuanto mayor sea el intervalo, mayor será la probabilidad de que el valor real se encuentre en él, pero menor será la precisión de nuestra estimación.
La regla del 68-95-99.7
En cualquier distribución normal N(μ, σ²), existe una relación fundamental entre la amplitud del intervalo y el porcentaje de datos que contiene:
- El intervalo μ ± σ (una desviación típica) contiene aproximadamente el 68.26% de los datos
- El intervalo μ ± 2σ (dos desviaciones típicas) contiene aproximadamente el 95.44% de los datos
- El intervalo μ ± 3σ (tres desviaciones típicas) contiene prácticamente el 99.73% de los datos
Esta regla es extraordinariamente útil para hacer estimaciones rápidas sin necesidad de consultar tablas.
Definición formal del intervalo de confianza
Un intervalo de confianza se define como un rango alrededor de la media muestral que indica la confianza de que un valor de la variable aleatoria se encuentre dentro de él con una probabilidad determinada.
Por ejemplo, si afirmamos que la probabilidad de que una variable aleatoria X esté entre los valores a y b es de 0.95, entonces tenemos un 95% de confianza de que los valores de X se encuentran en el intervalo [a, b].
Componentes del intervalo de confianza
Nivel de confianza (1 - α)
Es la probabilidad de que el intervalo contenga el verdadero valor del parámetro. Se expresa habitualmente como porcentaje. Los niveles más comunes son:
- 90% (α = 0.10)
- 95% (α = 0.05)
- 99% (α = 0.01)
Nivel de riesgo (α)
Es la probabilidad de cometer un error, es decir, de que el verdadero valor no esté en el intervalo calculado. Es el complemento del nivel de confianza: α = 1 - nivel de confianza.
Valores críticos (Z(α/2))
Son los valores de la distribución normal estándar que delimitan el intervalo de confianza. Para un intervalo bilateral simétrico, el riesgo α se reparte equitativamente en ambas colas, por lo que buscamos los valores ±Z(α/2).
Cálculo de valores críticos
Para encontrar los valores críticos, utilizamos la tabla de la distribución normal estándar N(0,1). El procedimiento es:
- Determinar el nivel de confianza deseado (1 - α)
- Calcular α/2
- Buscar en la tabla el valor z tal que P(Z < z) = 1 - α/2
Valores críticos más utilizados
| Nivel de confianza | α | α/2 | Z(α/2) |
|---|---|---|---|
| 90% | 0.10 | 0.05 | 1.645 |
| 95% | 0.05 | 0.025 | 1.96 |
| 99% | 0.01 | 0.005 | 2.576 |
Construcción del intervalo de confianza
Una vez conocidos los valores críticos en la distribución N(0,1), debemos transformarlos a la escala de nuestra variable original X ~ N(μ, σ²).
El intervalo de confianza para X se construye como:
[μ - Z(α/2)·σ, μ + Z(α/2)·σ]
Donde:
- μ es la media de la distribución
- σ es la desviación típica
- Z(α/2) es el valor crítico correspondiente al nivel de confianza elegido
Proceso de tipificación
Para calcular probabilidades en cualquier distribución normal, es necesario tipificar la variable, es decir, transformarla a la distribución normal estándar N(0,1).
La fórmula de tipificación es:
Z = (X - μ) / σ
Este proceso es esencial porque:
- Solo existe tabla para la distribución N(0,1)
- Permite comparar distribuciones con diferentes parámetros
- Facilita el cálculo de probabilidades
Ejemplo resuelto 1: Prueba de detección médica
Enunciado: El tiempo empleado en minutos para obtener la respuesta de una prueba para detectar cierta enfermedad sigue una distribución normal de media 20 y desviación típica 4.
a) ¿Qué porcentaje de las pruebas se obtiene el resultado entre 16 y 26 minutos?
Solución:
Tenemos X ~ N(20, 16), donde μ = 20 y σ = 4.
Paso 1: Tipificar los extremos del intervalo
- Z₁ = (16 - 20) / 4 = -1
- Z₂ = (26 - 20) / 4 = 1.5
Paso 2: Calcular la probabilidad P(16 < X < 26) = P(-1 < Z < 1.5)
Paso 3: Usar la tabla
- P(Z < 1.5) = 0.9332
- P(Z < -1) = 1 - P(Z < 1) = 1 - 0.8413 = 0.1587
Paso 4: Calcular la diferencia P(-1 < Z < 1.5) = 0.9332 - 0.1587 = 0.7745
Respuesta: El 77.45% de las pruebas obtienen resultado entre 16 y 26 minutos.
b) ¿Cuántos minutos son necesarios para garantizar que se ha obtenido la respuesta del 96.41% de las pruebas?
Solución:
Nivel de confianza = 0.9641, por tanto α = 0.0359 y α/2 = 0.01795.
Buscamos en la tabla: P(Z < z) = 1 - 0.01795 = 0.98205
El valor correspondiente es aproximadamente z = 2.1.
Construimos el intervalo:
- Límite inferior: 20 - 2.1 × 4 = 11.6 minutos
- Límite superior: 20 + 2.1 × 4 = 28.4 minutos
Respuesta: El intervalo de confianza es [11.6, 28.4] minutos.
Ejemplo resuelto 2: Selección de ciruelas
Enunciado: El diámetro de las ciruelas de una determinada variedad se distribuye normalmente con media 4.5 cm y desviación 0.3 cm. Se desea seleccionar para exportación el 10% de las más grandes. ¿A partir de qué diámetro hay que seleccionarlas?
Solución:
Tenemos X ~ N(4.5, 0.09), donde μ = 4.5 y σ = 0.3.
Buscamos el valor d tal que P(X ≥ d) = 0.10, lo que equivale a P(X < d) = 0.90.
Paso 1: Tipificar P(Z < (d - 4.5) / 0.3) = 0.90
Paso 2: Buscar en la tabla El valor z tal que P(Z < z) = 0.90 es aproximadamente z = 1.285.
Paso 3: Despejar d (d - 4.5) / 0.3 = 1.285 d = 4.5 + 1.285 × 0.3 d = 4.5 + 0.3855 d = 4.8855 ≈ 4.88 cm
Respuesta: Las ciruelas con diámetro igual o superior a 4.88 cm representan el 10% de las más grandes.
Errores frecuentes a evitar
Error 1: Confundir varianza con desviación típica
En la tipificación siempre se divide por σ (desviación típica), no por σ² (varianza). Si el problema da la varianza, hay que calcular primero la raíz cuadrada.
Error 2: No dividir α entre 2
Para intervalos bilaterales simétricos, el nivel de riesgo se reparte entre las dos colas. Si no dividimos α entre 2, obtendremos valores críticos incorrectos.
Error 3: Interpretar mal la tabla
La tabla de la normal estándar proporciona probabilidades acumuladas P(Z ≤ z). Para calcular P(Z > z), hay que hacer 1 - P(Z ≤ z).
Error 4: Olvidar transformar al problema original
Después de trabajar con la normal estándar, hay que expresar el resultado en las unidades del problema original multiplicando por σ y sumando/restando μ.
Conclusiones
Los intervalos de confianza son herramientas fundamentales en estadística que nos permiten:
- Expresar resultados de manera más realista que los valores puntuales
- Cuantificar la incertidumbre asociada a nuestras estimaciones
- Tomar decisiones basadas en niveles de riesgo controlados
El dominio del proceso de tipificación y el uso correcto de las tablas de la distribución normal son habilidades esenciales para resolver problemas de intervalos de confianza en selectividad y en aplicaciones prácticas de la estadística.
Errores comunes
Confundir nivel de confianza (1-α) con nivel de riesgo (α)
Si el resultado parece invertido o la probabilidad no tiene sentido en el contexto
Recordar que nivel de confianza + nivel de riesgo = 1. Un 95% de confianza significa α = 0.05
Olvidar que la tabla da probabilidades acumuladas desde -∞
Obtener probabilidades mayores que 1 o resultados negativos
Para P(Z > z), calcular 1 - P(Z < z). Para P(Z < -z), usar P(Z < -z) = 1 - P(Z < z)
No tipificar correctamente: usar varianza en lugar de desviación típica
Valores Z muy grandes o muy pequeños que no aparecen en la tabla
Siempre dividir por σ (desviación típica), no por σ² (varianza)
Usar α en lugar de α/2 para intervalos bilaterales
El intervalo de confianza es demasiado estrecho o ancho
En intervalos simétricos alrededor de la media, dividir α entre 2 para cada cola
No transformar el resultado de la tabla al intervalo original
Dar la respuesta en términos de Z en lugar de la variable X original
Siempre despejar X = μ + Z·σ para expresar el resultado en las unidades del problema
Glosario
- Intervalo de confianza
- Rango de valores alrededor de la media muestral que indica la probabilidad de que el parámetro poblacional se encuentre dentro de él con un nivel de confianza determinado.
- Nivel de confianza (1-α)
- Probabilidad de que el intervalo de confianza contenga el verdadero valor del parámetro. Se expresa como porcentaje (ej: 95%) o decimal (ej: 0.95).
- Nivel de riesgo (α)
- Probabilidad de error al afirmar que el parámetro está en el intervalo. Es el complemento del nivel de confianza: α = 1 - nivel de confianza.
- Valores críticos (Z(α/2))
- Valores de la distribución normal estándar que delimitan el intervalo de confianza. Para un nivel de confianza del 95%, los valores críticos son ±1.96.
- Tipificación
- Transformación de una variable normal X ~ N(μ,σ²) a la normal estándar Z ~ N(0,1) mediante la fórmula Z = (X - μ)/σ.
- Distribución normal estándar N(0,1)
- Distribución normal con media 0 y desviación típica 1. Es la distribución de referencia cuyas probabilidades están tabuladas.
- Función de densidad
- Función que describe la probabilidad relativa de que una variable aleatoria continua tome un valor dado. El área bajo la curva entre dos puntos da la probabilidad del intervalo.
- Desviación típica (σ)
- Medida de dispersión que indica cuánto se alejan los valores de la media. Es la raíz cuadrada de la varianza.
Preguntas frecuentes
¿Qué porcentaje de datos contiene el intervalo μ ± σ en una distribución normal?
Aproximadamente el 68.26% de los datos.
El intervalo de una desviación típica alrededor de la media contiene el 68.26% de los datos. Si ampliamos a μ ± 2σ, contenemos el 95.44%, y con μ ± 3σ prácticamente el 100% (99.73%).
¿Cómo se relacionan el nivel de confianza y el nivel de riesgo?
Son complementarios: nivel de confianza = 1 - α, donde α es el nivel de riesgo.
Si tenemos un nivel de confianza del 95% (0.95), el nivel de riesgo es α = 0.05 (5%). Esto significa que hay un 5% de probabilidad de que el verdadero valor esté fuera del intervalo calculado.
¿Por qué hay que tipificar la variable para usar la tabla?
Porque solo existe tabla para la distribución normal estándar N(0,1).
Sería imposible tener tablas para todas las posibles combinaciones de media y desviación típica. La tipificación Z = (X-μ)/σ transforma cualquier normal a N(0,1), permitiendo usar una única tabla universal.
¿Qué son los valores críticos y cómo se encuentran?
Son los extremos del intervalo de confianza en la normal estándar, se buscan en la tabla según el nivel de confianza.
Para un nivel de confianza del 95%, buscamos en la tabla el valor z tal que P(Z < z) = 0.975 (porque α/2 = 0.025 queda en cada cola). Este valor es Z(0.025) = 1.96, y los valores críticos son ±1.96.
¿Por qué dividimos α entre 2 para encontrar los valores críticos?
Porque el intervalo es bilateral y el riesgo se reparte equitativamente en ambas colas.
En un intervalo de confianza simétrico, dejamos α/2 de probabilidad en la cola izquierda y α/2 en la cola derecha. Por ejemplo, para 95% de confianza (α=0.05), dejamos 2.5% en cada cola.
¿Cómo calculo la probabilidad de que una variable esté entre dos valores?
Tipifica ambos valores, busca sus probabilidades acumuladas en la tabla y resta.
P(a < X < b) = P(Z < z₂) - P(Z < z₁), donde z₁ = (a-μ)/σ y z₂ = (b-μ)/σ. Esto equivale a calcular el área bajo la curva entre los dos valores tipificados.
¿Cómo se calcula la probabilidad en la cola derecha P(X > a)?
Tipifica el valor y calcula 1 - P(Z < z).
Como la tabla da probabilidades acumuladas desde -∞, para calcular P(Z > z) usamos P(Z > z) = 1 - P(Z < z). Por ejemplo, P(Z > 1.5) = 1 - 0.9332 = 0.0668.
Si aumento el nivel de confianza, ¿qué pasa con el intervalo?
El intervalo se hace más ancho.
A mayor confianza, los valores críticos son mayores (por ejemplo, de 1.96 para 95% a 2.58 para 99%), lo que genera un intervalo más amplio. Hay un compromiso entre precisión (intervalo estrecho) y confianza.
Artículos relacionados
Reunión de mejora continua en Ucademy: comunicación y experiencia educativa
Reunión del equipo de Ucademy para discutir mejoras en comunicación, actualización de materiales y cómo potenciar la experiencia educativa de los estudiantes.
Derivada por definición: cálculo paso a paso con ejemplos resueltos
Domina el cálculo de derivadas por definición con ejemplos prácticos de x³, logaritmo neperiano y función seno. Método paso a paso con límites.
Cómo resolver la indeterminación 1 elevado a infinito en límites
Método completo para resolver límites con indeterminación 1^∞ cuando x tiende a un valor finito, usando la transformación con el número e.
Tipos de discontinuidad en funciones: evitable, salto finito y salto infinito
Guía completa sobre los tipos de discontinuidad en funciones matemáticas: discontinuidad evitable, de salto finito, de salto infinito y asintótica con ejemplos.
Indeterminación infinito menos infinito: cómo resolverla paso a paso
Domina la resolución de límites con indeterminación infinito menos infinito mediante factorización y racionalización de fracciones.
Cálculo de límites indeterminados: uno elevado a infinito y el número e
Método completo para resolver indeterminaciones del tipo 1^∞ y 1^(-∞) utilizando el número e en el cálculo de límites cuando x tiende a infinito.
¿Quieres aprender más sobre este tema?
Este contenido es parte del curso Matemáticas Ciencias Sociales | Selectividad de Acceso a la Universidad Ucademy. Contacta con nosotros para más información o descarga este artículo en PDF.