Доверительные интервалы: построение и интерпретация

Что такое доверительный интервал и зачем он нужен?

Представьте, что вы пытаетесь угадать рост человека, которого никогда не видели. Вы вряд ли назовете точное число (например, 182.3 см), но сможете сказать: «Рост между 175 и 190 см». Доверительный интервал в статистике работает похожим образом! 📏

Это диапазон значений, который с заданной вероятностью (уровнем доверия) накрывает истинный параметр генеральной совокупности (например, среднее значение или долю). Мы используем выборочные данные, чтобы оценить неизвестный параметр всей популяции.

💡 Ключевая идея: мы никогда не знаем истинное значение наверняка (если не изучим всю популяцию), но можем построить «коридор» значений, где оно likely находится.

Основные компоненты доверительного интервала

  • Точечная оценка ➕ — значение, вычисленное по выборке (например, выборочное среднее )
  • Предельная ошибка 🔺 — «полуширина» интервала, которая зависит от:
    • Изменчивости данных
    • Размера выборки
    • Выбранного уровня доверия
  • Уровень доверия 🎯 (например, 95%) — вероятность того, что метод построения даст интервал, содержащий истинный параметр

⚠️ Важно: 95% доверия НЕ означает, что истинный параметр с вероятностью 95% лежит в вашем конкретном интервале. Это означает, что если бы мы многократно повторяли выборку и строили интервалы, то 95% из них содержали бы истинное значение.


Построение доверительного интервала для среднего (известная дисперсия)

Это классический случай, который помогает понять логику. Предположим, мы знаем стандартное отклонение генеральной совокупности σ.

Формула для доверительного интервала выглядит так:

X̄ ± Z * (σ / √n)

Где:

  • — выборочное среднее
  • Z — Z-критическое значение, соответствующее выбранному уровню доверия
  • σ — стандартное отклонение генеральной совокупности
  • n — объем выборки

Распространенные Z-критические значения:

Уровень доверия Z-значение (прибл.)
90% 1.645
95% 1.96
99% 2.576

🔢 Практическая задача 1

Условие: Фабрика производит шарики. Известно, что стандартное отклонение диаметра шариков в партии составляет σ = 0.2 см. Мы взяли случайную выборку из n = 50 шариков и вычислили средний диаметр X̄ = 5.1 см. Постройте 95% доверительный интервал для истинного среднего диаметра всех шариков.

Решение:

  1. Уровень доверия = 95%, значит Z = 1.96
  2. Стандартная ошибка среднего: σ / √n = 0.2 / √50 ≈ 0.2 / 7.07 ≈ 0.0283
  3. Предельная ошибка: Z * (σ / √n) = 1.96 * 0.0283 ≈ 0.0555
  4. Доверительный интервал: 5.1 ± 0.0555
  5. Округляем: [5.0445, 5.1555] или примерно [5.04 см, 5.16 см]

Интерпретация: Мы на 95% уверены, что истинный средний диаметр всех шариков на фабрике лежит между 5.04 см и 5.16 см.


Более реалистичный случай: неизвестная дисперсия

На практике мы редко знаем σ (стандартное отклонение генеральной совокупности). В этом случае мы используем выборочное стандартное отклонение s и t-распределение Стьюдента вместо нормального.

Формула меняется на:

X̄ ± t * (s / √n)

Критическое значение t зависит от уровня доверия и числа степеней свободы df = n - 1. t-распределение более «тяжелохвостое», что дает более широкие интервалы при малых выборках, компенсируя дополнительную неопределенность.

📘 Совет: При n > 30 t-распределение очень близко к нормальному, и часто используют Z-значения как приближение.

🔢 Практическая задача 2

Условие: Мы хотим оценить среднее время доставки пиццы. По выборке из n = 20 заказов: X̄ = 28 мин, s = 5 мин. Постройте 90% доверительный интервал.

Решение:

  1. Степени свободы df = n - 1 = 19
  2. Для 90% доверия и df = 19 находим по таблице t-распределения: t ≈ 1.729
  3. Стандартная ошибка: s / √n = 5 / √20 ≈ 5 / 4.47 ≈ 1.118
  4. Предельная ошибка: t * (s / √n) = 1.729 * 1.118 ≈ 1.933
  5. Доверительный интервал: 28 ± 1.933
  6. Округляем: [26.067 мин, 29.933 мин]

Интерпретация: Мы на 90% уверены, что истинное среднее время доставки лежит между примерно 26.1 и 29.9 минут.

Скрыть рекламу навсегда

📘 VK Видео — обучение без ограничений

Все уроки доступны без VPN, без блокировок и зависаний.

Можно смотреть с телефона, планшета или компьютера — в любое время.

▶️ Смотреть на VK Видео