Биномиальное распределение: формула и примеры

Что такое биномиальное распределение?

Представьте, что вы подбрасываете монетку 10 раз. Биномиальное распределение — это математический инструмент, который помогает нам ответить на вопрос: «Какова вероятность, что орёл выпадет ровно 3 раза?». Оно описывает количество успехов в серии из нескольких независимых экспериментов, где у каждого эксперимента есть только два возможных исхода: «успех» или «неудача».

Это одно из самых фундаментальных распределений в статистике и Data Science, так как оно моделирует огромное количество реальных процессов: от A/B-тестирования до прогнозирования оттока клиентов.

Условия применения 🎯

Чтобы ситуацию можно было описать биномиальным распределением, должны выполняться следующие условия:

Фиксированное количество испытаний (n): количество экспериментов заранее известно (например, 10 подбрасываний монеты).
Два исхода: каждый эксперимент имеет только два возможных результата — «успех» (p) или «неудача» (1-p).
Постоянная вероятность успеха (p): вероятность «успеха» одинакова для каждого эксперимента.
Независимость: результат одного эксперимента не влияет на результат следующего.

💡 Совет: Запомните аббревиатуру FIPS для проверки условий: Fixed number of trials, Two outcomes, Independent trials, Same probability.

Формула биномиального распределения

Вероятность получить ровно k успехов в n независимых испытаниях вычисляется по формуле:

P(k) = C(n, k) * p^k * (1-p)^(n-k)

Давайте разберём её по частям:

P(k) — вероятность получить ровно k успехов.
C(n, k) — биномиальный коэффициент (число сочетаний), который показывает, сколькими способами можно выбрать k успехов из n испытаний. Рассчитывается по формуле: C(n, k) = n! / (k! * (n-k)!).
p — вероятность успеха в одном испытании.
1-p — вероятность неудачи (часто обозначается как q).
p^k — вероятность получить k успехов.
(1-p)^(n-k) — вероятность получить n-k неудач.

📘 Простыми словами: Формула перемножает количество способов добиться k успехов и вероятность каждого такого конкретного исхода.

Разбираем пример шаг за шагом ➕

Давайте решим классическую задачу.

Задача 1: Подбрасывание монеты

Условие: Какова вероятность выбросить орла ровно 3 раза в 10 подбрасываниях идеальной монеты?

Решение:

Определяем параметры:
- Количество испытаний: n = 10
- Желаемое количество успехов: k = 3
- Вероятность успеха (орёл): p = 0.5
- Вероятность неудачи (решка): 1-p = 0.5
Подставляем значения в формулу:
```
P(3) = C(10, 3) * (0.5)^3 * (0.5)^(10-3)
```
Вычисляем биномиальный коэффициент C(10, 3):
```
C(10, 3) = 10! / (3! * 7!) = (10*9*8) / (3*2*1) = 120
```
Вычисляем остальные части формулы:
```
(0.5)^3 = 0.125
(0.5)^7 ≈ 0.0078125
```
Перемножаем все компоненты:
```
P(3) = 120 * 0.125 * 0.0078125 ≈ 0.1172
```

Ответ: Вероятность выбросить орла ровно 3 раза составляет примерно 11.72%.

Ещё пример из реальной жизни 📊

Задача 2: Конверсия на сайте

Условие: Известно, что 5% посетителей интернет-магазина совершают покупку. За день сайт посетили 100 человек. Какова вероятность, что покупку совершат ровно 10 человек?

Решение:

Определяем параметры:
- n = 100 (число посетителей)
- k = 10 (желаемое число покупателей)
- p = 0.05 (вероятность конверсии)
- 1-p = 0.95

Записываем формулу:

P(10) = C(100, 10) * (0.05)^10 * (0.95)^90

Вычисляем (значения округлены для удобства):

C(100, 10) ≈ 1.7310e+13 (очень большое число)
(0.05)^10 ≈ 9.7656e-14
(0.95)^90 ≈ 0.0087

Перемножаем:

P(10) ≈ 1.7310e+13 * 9.7656e-14 * 0.0087 ≈ 0.0167

Ответ: Вероятность того, что покупку совершат ровно 10 человек, составляет примерно 1.67%.

🔺 Обратите внимание: При больших n вычисления вручную становятся громоздкими. На практике Data Scientist'ы используют встроенные функции библиотек (например, scipy.stats.binom в Python), которые мгновенно производят все расчёты.