Биномиальное распределение: формула и примеры
Что такое биномиальное распределение?
Представьте, что вы подбрасываете монетку 10 раз. Биномиальное распределение — это математический инструмент, который помогает нам ответить на вопрос: «Какова вероятность, что орёл выпадет ровно 3 раза?». Оно описывает количество успехов в серии из нескольких независимых экспериментов, где у каждого эксперимента есть только два возможных исхода: «успех» или «неудача».
Это одно из самых фундаментальных распределений в статистике и Data Science, так как оно моделирует огромное количество реальных процессов: от A/B-тестирования до прогнозирования оттока клиентов.
Условия применения 🎯
Чтобы ситуацию можно было описать биномиальным распределением, должны выполняться следующие условия:
- Фиксированное количество испытаний (n): количество экспериментов заранее известно (например, 10 подбрасываний монеты).
- Два исхода: каждый эксперимент имеет только два возможных результата — «успех» (p) или «неудача» (1-p).
- Постоянная вероятность успеха (p): вероятность «успеха» одинакова для каждого эксперимента.
- Независимость: результат одного эксперимента не влияет на результат следующего.
💡 Совет: Запомните аббревиатуру FIPS для проверки условий: Fixed number of trials, Two outcomes, Independent trials, Same probability.
Формула биномиального распределения
Вероятность получить ровно k успехов в n независимых испытаниях вычисляется по формуле:
P(k) = C(n, k) * p^k * (1-p)^(n-k)
Давайте разберём её по частям:
P(k)— вероятность получить ровно k успехов.C(n, k)— биномиальный коэффициент (число сочетаний), который показывает, сколькими способами можно выбрать k успехов из n испытаний. Рассчитывается по формуле:C(n, k) = n! / (k! * (n-k)!).p— вероятность успеха в одном испытании.1-p— вероятность неудачи (часто обозначается как q).p^k— вероятность получить k успехов.(1-p)^(n-k)— вероятность получить n-k неудач.
📘 Простыми словами: Формула перемножает количество способов добиться k успехов и вероятность каждого такого конкретного исхода.
Разбираем пример шаг за шагом ➕
Давайте решим классическую задачу.
Задача 1: Подбрасывание монеты
Условие: Какова вероятность выбросить орла ровно 3 раза в 10 подбрасываниях идеальной монеты?
Решение:
- Определяем параметры:
- Количество испытаний:
n = 10 - Желаемое количество успехов:
k = 3 - Вероятность успеха (орёл):
p = 0.5 - Вероятность неудачи (решка):
1-p = 0.5
- Количество испытаний:
- Подставляем значения в формулу:
P(3) = C(10, 3) * (0.5)^3 * (0.5)^(10-3)
- Вычисляем биномиальный коэффициент
C(10, 3):C(10, 3) = 10! / (3! * 7!) = (10*9*8) / (3*2*1) = 120
- Вычисляем остальные части формулы:
(0.5)^3 = 0.125 (0.5)^7 ≈ 0.0078125
- Перемножаем все компоненты:
P(3) = 120 * 0.125 * 0.0078125 ≈ 0.1172
Ответ: Вероятность выбросить орла ровно 3 раза составляет примерно 11.72%.
Ещё пример из реальной жизни 📊
Задача 2: Конверсия на сайте
Условие: Известно, что 5% посетителей интернет-магазина совершают покупку. За день сайт посетили 100 человек. Какова вероятность, что покупку совершат ровно 10 человек?
Решение:
- Определяем параметры:
n = 100(число посетителей)k = 10(желаемое число покупателей)p = 0.05(вероятность конверсии)1-p = 0.95
- Записываем формулу:
P(10) = C(100, 10) * (0.05)^10 * (0.95)^90
- Вычисляем (значения округлены для удобства):
C(100, 10) ≈ 1.7310e+13 (очень большое число) (0.05)^10 ≈ 9.7656e-14 (0.95)^90 ≈ 0.0087
- Перемножаем:
P(10) ≈ 1.7310e+13 * 9.7656e-14 * 0.0087 ≈ 0.0167
Ответ: Вероятность того, что покупку совершат ровно 10 человек, составляет примерно 1.67%.
🔺 Обратите внимание: При больших n вычисления вручную становятся громоздкими. На практике Data Scientist'ы используют встроенные функции библиотек (например,
scipy.stats.binomв Python), которые мгновенно производят все расчёты.