Выборочное распределение среднего

Что такое выборочное распределение среднего?

Представьте, что вы хотите узнать средний рост студентов в университете. Вместо того чтобы измерять всех 10 000 студентов (что займет много времени), вы берете несколько случайных групп по 30 человек и вычисляете средний рост в каждой группе.

Выборочное распределение среднего — это распределение средних значений, полученных из множества случайных выборок одинакового размера из одной и той же совокупности.

🎯 Ключевая идея: хотя отдельные выборки могут давать разные средние значения, их распределение следует предсказуемой закономерности!

Центральная предельная теорема 🎯

Это самая важная концепция в статистике! Центральная предельная теорема гласит:

Независимо от формы исходного распределения совокупности, распределение выборочных средних будет стремиться к нормальному распределению по мере увеличения размера выборки.

Давайте разберем это на примере:

  • 👕 Исходное распределение: неравномерное (например, цены на футболки)
  • 📊 Берем много выборок по 30 наблюдений
  • 📈 Вычисляем среднее для каждой выборки
  • ✅ Распределение этих средних будет нормальным!

Формулы для работы

Для выборочного распределения среднего нам важны два параметра:

Параметр Формула Описание
Среднее распределения средних μₓ̄ = μ Равно среднему генеральной совокупности
Стандартная ошибка среднего σₓ̄ = σ/√n Показывает изменчивость выборочных средних

💡 Стандартная ошибка уменьшается с увеличением размера выборки! Чем больше выборка, тем точнее наша оценка.

Практический пример с данными 📊

Представим, что средняя цена пиццы в городе составляет 500 рублей со стандартным отклонением 100 рублей. Мы берем 100 случайных выборок по 25 пиццерий.

Что мы получим в распределении средних цен?

μ = 500 рублей
σ = 100 рублей
n = 25

μₓ̄ = 500 рублей
σₓ̄ = 100/√25 = 100/5 = 20 рублей

Таким образом, среднее значение выборочных средних будет 500 рублей, а стандартное отклонение — 20 рублей.

Задача для решения 🧠

В компании средняя зарплата сотрудников составляет 75 000 рублей со стандартным отклонением 15 000 рублей. Мы случайным образом отбираем 36 сотрудников.

1. Каково ожидаемое среднее значение выборочного распределения?
2. Чему равна стандартная ошибка среднего?
3. Какова вероятность, что средняя зарплата в выборке будет между 70 000 и 80 000 рублей?


Пошаговое решение 🔍

Шаг 1: Ожидаемое среднее значение

Среднее выборочного распределения всегда равно среднему генеральной совокупности:

μₓ̄ = μ = 75 000 рублей

Шаг 2: Стандартная ошибка среднего

Используем формулу стандартной ошибки:

σₓ̄ = σ/√n = 15000/√36 = 15000/6 = 2 500 рублей

Шаг 3: Вероятность для интервала

Поскольку n > 30, мы можем использовать нормальное распределение.

Сначала найдем Z-оценки для обеих границ:

Z₁ = (70000 - 75000)/2500 = -5000/2500 = -2,0
Z₂ = (80000 - 75000)/2500 = 5000/2500 = 2,0

По таблице Z-распределения находим:

P(Z < 2,0) = 0,9772
P(Z < -2,0) = 0,0228

Вероятность между этими значениями:

P(-2,0 < Z < 2,0) = 0,9772 - 0,0228 = 0,9544

Таким образом, вероятность составляет примерно 95,44%.

📘 На практике это означает, что в 95% случаев средняя зарплата в выборке из 36 человек будет отличаться от истинной средней не более чем на 5000 рублей!

Почему это важно для Data Science? 🚀

Выборочное распределение среднего лежит в основе:

  • 📏 Доверительных интервалов
  • ✅ Проверки статистических гипотез
  • 📊 A/B-тестирования
  • 🔮 Предсказательного моделирования

Когда вы понимаете, как ведут себя выборочные средние, вы можете делать обоснованные выводы о всей совокупности на основе ограниченных данных!

✨ Запомните: большие выборки дают более точные оценки, и даже из не-normalльных данных можно получать normalльно распределенные средние!

Заключение

Выборочное распределение среднего — это мощный инструмент, который позволяет Data Scientist'ам делать надежные выводы о больших совокупностях на основе ограниченных данных. Центральная предельная теорема гарантирует, что даже при работе с ненормальными данными мы можем использовать методы, основанные на нормальном распределении.

Практикуйтесь в вычислениях, запоминайте ключевые формулы, и вы сможете уверенно применять эти знания в реальных проектах! 📊➡️🎯

Скрыть рекламу навсегда

🎥 YouTube: программирование простым языком

Канал, где я спокойно и по шагам объясняю сложные темы — без заумных терминов и лишней теории.

Подходит, если раньше «не заходило», но хочется наконец понять.

▶️ Смотреть курсы на YouTube