Проверка гипотез: нулевая и альтернативная гипотезы

Что такое проверка гипотез и зачем она нужна?

Представьте, что вы аналитик в интернет-магазине. Ваш босс говорит: "Мы изменили цвет кнопки "Купить" с синего на красный. Кажется, это увеличило продажи!" 🎯 Но как проверить, действительно ли это улучшение, а не просто случайное колебание? Вот здесь на помощь приходит проверка гипотез — мощный статистический метод, который помогает принимать обоснованные решения на основе данных.

Проверка гипотез — это формализованный процесс, позволяющий сделать статистический вывод о популяции на основе выборки данных. Мы формулируем две противоположные гипотезы и используем данные, чтобы решить, какую из них поддержать.

💡 Совет: Всегда помните, что проверка гипотез не доказывает истинность какой-либо гипотезы. Она лишь предоставляет доказательства в пользу одной гипотезы против другой на основе доступных данных.


Нулевая гипотеза (H₀)

Нулевая гипотеза — это гипотеза "по умолчанию" или статус-кво. Она обычно представляет собой утверждение об отсутствии эффекта, различий или изменений. В контексте Data Science это часто означает, что наблюдаемая разница вызвана случайностью.

В нашем примере с кнопкой нулевая гипотеза будет звучать так: "Изменение цвета кнопки не повлияло на конверсию".

Нулевая гипотеза всегда содержит знак равенства (=), неравенства ( или ) и предполагает, что любые наблюдаемые различия случайны.

  • Обозначение: H₀
  • Всегда содержит утверждение о равенстве параметра
  • Предполагает отсутствие эффекта или различий

📘 Запомните: Нулевую гипотезу мы либо отвергаем, либо не можем отвергнуть. Мы никогда не "принимаем" нулевую гипотезу как истинную — мы просто не находим достаточных доказательств против нее.


Альтернативная гипотеза (H₁ или Hₐ)

Альтернативная гипотеза — это то, что мы хотим доказать. Она представляет собой утверждение, противоречащее нулевой гипотезе, и обычно указывает на наличие эффекта, различий или изменений.

В нашем примере альтернативная гипотеза может быть: "Изменение цвета кнопки повлияло на конверсию".

Альтернативная гипотеза может быть:

  • Двусторонней: параметр не равен определенному значению ()
  • Односторонней: параметр больше (>) или меньше (<) определенного значения

Тип гипотезы Нулевая (H₀) Альтернативная (H₁)
Двусторонняя μ = μ₀ μ ≠ μ₀
Левосторонняя μ ≥ μ₀ μ < μ₀
Правосторонняя μ ≤ μ₀ μ > μ₀


Как работают вместе нулевая и альтернативная гипотезы

Процесс проверки гипотез похож на судебный процесс:

  1. Предполагаем невиновность (нулевая гипотеза — эффекта нет)
  2. Собираем доказательства (данные)
  3. Принимаем решение: либо недостаточно доказательств против предположения о невиновности, либо доказательства достаточно убедительны, чтобы отвергнуть это предположение

Важно понимать, что эти две гипотезы:

  • Взаимоисключающие — не могут быть истинными одновременно
  • Вместе исчерпывают все возможности
  • Охватывают все возможные значения параметра

🔺 Важно: Формулируйте гипотезы до сбора данных! Формулирование гипотез после анализа данных может привести к предвзятым выводам.


Практический пример из Data Science

Давайте рассмотрим реальный пример. Предположим, мы тестируем два алгоритма рекомендаций: старый (A) и новый (B). Мы хотим узнать, действительно ли новый алгоритм дает более высокий CTR (click-through rate).

Формулируем гипотезы:

  • H₀: CTR алгоритма A равен CTR алгоритма B → CTR_A = CTR_B
  • H₁: CTR алгоритма A не равен CTR алгоритма B → CTR_A ≠ CTR_B

Мы собираем данные, проводим статистический тест (например, t-тест) и получаем p-значение. Если p-значение меньше выбранного уровня значимости (обычно 0.05), мы отвергаем H₀ в пользу H₁.


Решим задачу вместе!

Задача: Компания утверждает, что их батарейки работают в среднем 100 часов. Вы как data scientist проверяете партию из 50 батареек и находите среднее время работы 98 часов со стандартным отклонением 5 часов. Проверьте гипотезу на уровне значимости 0.05.

Решение:

  1. Формулируем гипотезы:
    • H₀: μ = 100 часов (батарейки работают заявленное время)
    • H₁: μ < 100 часов (батарейки работают меньше заявленного)
  2. Выбираем уровень значимости: α = 0.05
  3. Рассчитываем тестовую статистику (z-score):
    z = (x̄ - μ) / (σ/√n) = (98 - 100) / (5/√50) = (-2) / (5/7.07) = (-2) / 0.707 ≈ -2.83
  4. Находим критическое значение для одностороннего теста: z = -1.645
  5. Сравниваем: -2.83 < -1.645 → наша тестовая статистика попадает в критическую область
  6. Вывод: Отвергаем H₀. Есть статистически значимые доказательства, что батарейки работают меньше заявленных 100 часов.
Скрыть рекламу навсегда

📘 VK Видео — обучение без ограничений

Все уроки доступны без VPN, без блокировок и зависаний.

Можно смотреть с телефона, планшета или компьютера — в любое время.

▶️ Смотреть на VK Видео