Основы теории вероятностей: события, вероятность, условная вероятность
Что такое события и вероятность?
Представьте, что вы бросаете игральный кубик 🎲. Выпадение конкретного числа (например, 3) — это и есть событие. В теории вероятностей событие — это любой исход или результат эксперимента, который мы можем наблюдать.
Вероятность — это численная мера того, насколько возможно наступление события. Она измеряется числом от 0 до 1:
- 0 — событие точно не произойдет (невозможное событие)
- 1 — событие точно произойдет (достоверное событие)
- 0.5 — равные шансы (как орёл или решка)
Вероятность события A вычисляется по формуле:
P(A) = количество благоприятных исходов / общее количество возможных исходов
Давайте разберем на простом примере:
🎯 Задача 1: Какова вероятность выпадения четного числа при броске игрального кубика?
Решение:
- Всего возможных исходов: 6 (числа 1, 2, 3, 4, 5, 6)
- Благоприятные исходы: 3 (числа 2, 4, 6)
- Вероятность:
P(четное) = 3/6 = 0.5
Ответ: вероятность выпадения четного числа равна 0.5 или 50%.
Типы событий и их комбинации
События могут быть разными, и важно понимать, как они взаимодействуют:
| Тип события | Описание | Пример |
|---|---|---|
| Несовместные | Не могут произойти одновременно | Выпадение орла и решки одновременно |
| Совместные | Могут произойти одновременно | Быть программистом и любить музыку |
| Независимые | Одно не влияет на вероятность другого | Два последовательных броска кубика |
| Зависимые | Одно влияет на вероятность другого | Вытягивание карт из колоды без возврата |
💡 Совет: Для несовместных событий вероятность того, что произойдет хотя бы одно из них, вычисляется как сумма их вероятностей: P(A или B) = P(A) + P(B)
🎯 Задача 2: В колоде 52 карты. Какова вероятность вытянуть туза или короля?
Решение:
- Вероятность туза:
P(туз) = 4/52 - Вероятность короля:
P(король) = 4/52 - События несовместны (карта не может быть и тузом и королем)
- Итоговая вероятность:
P(туз или король) = 4/52 + 4/52 = 8/52 ≈ 0.154
Условная вероятность ➕ 📘
Теперь перейдем к одной из самых важных тем в Data Science — условной вероятности. Это вероятность наступления события A при условии, что событие B уже произошло.
Обозначается как P(A|B) и читается "вероятность A при условии B".
Формула условной вероятности:
P(A|B) = P(A и B) / P(B)
Давайте разберем на практическом примере:
🎯 Задача 3: В группе из 100 человек 40 изучают Python, 30 изучают математику, а 20 изучают и то, и другое. Какова вероятность, что случайно выбранный человек изучает математику, если известно, что он уже изучает Python?
Решение:
- Событие A: изучает математику
- Событие B: изучает Python
- P(A и B) = 20/100 = 0.2 (изучают и то, и другое)
- P(B) = 40/100 = 0.4 (изучают Python)
- P(A|B) = P(A и B) / P(B) = 0.2 / 0.4 = 0.5
Ответ: вероятность того, что человек изучает математику при условии, что он изучает Python, равна 0.5.
💡 Важно: Условная вероятность — основа для многих алгоритмов машинного обучения, включая байесовские методы, которые широко используются в классификации и рекомендательных системах.
Формула Байеса 🔺
Нельзя говорить об условной вероятности, не упомянув формулу Байеса — мощный инструмент для переоценки вероятностей на основе новой информации:
P(A|B) = P(B|A) × P(A) / P(B)
Где:
- P(A|B) — апостериорная вероятность (что мы хотим найти)
- P(B|A) — правдоподобие
- P(A) — априорная вероятность
- P(B) — полная вероятность события B
🎯 Задача 4: Медицинский тест на заболевание имеет точность 95%. Заболевание встречается у 1% населения. Если у человека положительный тест, какова вероятность, что он действительно болен?
Решение:
- P(болен) = 0.01
- P(здоров) = 0.99
- P(тест+|болен) = 0.95
- P(тест+|здоров) = 0.05 (ложноположительные)
- P(тест+) = P(тест+|болен)×P(болен) + P(тест+|здоров)×P(здоров) = 0.95×0.01 + 0.05×0.99 ≈ 0.059
- P(болен|тест+) = P(тест+|болен)×P(болен) / P(тест+) = (0.95×0.01) / 0.059 ≈ 0.161
Ответ: вероятность того, что человек действительно болен при положительном тесте, составляет всего около 16.1%!
💡 Совет: Эта задача показывает, почему важно понимать условные вероятности — интуиция часто нас подводит, и только точные расчеты показывают реальную картину.