Критерий Стьюдента: сравнение средних
Что такое критерий Стьюдента и зачем он нужен?
Представьте, что вы сравниваете средние оценки двух групп студентов или среднюю выручку двух магазинов. Критерий Стьюдента (или t-тест) — это статистический инструмент, который помогает определить, является ли разница между средними значениями двух групп статистически значимой или она могла возникнуть случайно. 📊
Этот метод особенно полезен в Data Science для проверки гипотез, например:
- ➡️ Повлияла ли новая маркетинговая стратегия на продажи?
- ➡️ Даёт ли новый алгоритм машинного обучения более точные прогнозы?
- ➡️ Различается ли средний рост между мужчинами и женщинами в выборке?
💡 Важно помнить: критерий Стьюдента не говорит о том, насколько велика разница, а только о том, является ли она статистически значимой.
Основные типы t-критериев
Существует три основных типа t-тестов. Выбор зависит от того, какие данные вы сравниваете.
| Тип теста | Когда использовать? | Пример |
|---|---|---|
| Одновыборочный | Сравнение среднего значения одной группы с известным средним (например, теоретическим значением). | Средний рост студентов равен 175 см? |
| Двухвыборочный для независимых выборок | Сравнение средних двух разных, независимых групп. | Сравнить средние оценки студентов факультета A и факультета B. |
| Парный t-тест | Сравнение средних значений для одной и той же группы в двух разных условиях (до и после). | Сравнить продуктивность сотрудников до и после тренинга. |
🎯 Совет: Для независимых выборок сначала всегда проверяйте равенство дисперсий с помощью F-теста, чтобы выбрать правильную формулу t-теста.
Формула и расчёт t-статистики
Сердце критерия Стьюдента — это вычисление t-статистики. Для двух независимых выборок с равными дисперсиями формула выглядит так:
t = (X̄1 - X̄2) / √(S²p * (1/n1 + 1/n2))
Где:
X̄1иX̄2— выборочные средние двух группn1иn2— размеры выборокS²p— объединённая дисперсия (pooled variance), которая вычисляется так:
S²p = ((n1 - 1)*S²1 + (n2 - 1)*S²2) / (n1 + n2 - 2)
Полученное значение t-статистики сравнивается с критическим значением из таблицы распределения Стьюдента для заданного уровня значимости (обычно 0.05) и числа степеней свободы df = n1 + n2 - 2.
📘 Простыми словами: t-статистика показывает, во сколько раз разница между средними превышает её стандартную ошибку. Чем больше значение t (по модулю), тем меньше вероятность, что такая разница возникла случайно.
Интерпретация результата: p-value и значимость
Ключевой этап — интерпретация результата. Вместо ручного сравнения с таблицей современные инструменты (Python, R) сразу рассчитывают p-value.
- p-value < 0.05: Различие статистически значимо на уровне 5%. Мы отвергаем нулевую гипотезу об отсутствии различий. ✅
- p-value >= 0.05: Нет оснований отвергать нулевую гипотезу. Наблюдаемая разница могла возникнуть случайно. ❌
⚠️ Предупреждение: Статистическая значимость не равно практическая значимость. Большая выборка может выявить очень маленькую, но статистически значимую разницу, которая не имеет практической ценности.
Практическая задача: применяем знания
Давайте решим задачу шаг за шагом, чтобы закрепить понимание.
Условие
Мы хотим выяснить, влияет ли новый метод обучения на результаты экзаменов. У нас есть две независимые группы студентов по 15 человек в каждой. Группа A училась по старому методу, группа B — по новому. Их средние баллы на экзамене и стандартные отклонения следующие:
- Группа A (старый метод):
X̄₁ = 75 баллов,S₁ = 10 баллов,n₁ = 15 - Группа B (новый метод):
X̄₂ = 82 балла,S₂ = 9 баллов,n₂ = 15
Проверьте гипотезу на уровне значимости α = 0.05 о том, что новый метод обучения эффективнее.
Решение
Шаг 1: Формулируем гипотезы
- Нулевая гипотеза (H₀): μ₁ = μ₂ (Новый метод не повлиял на результаты. Средние баллы равны).
- Альтернативная гипотеза (H₁): μ₁ < μ₂ (Новый метод улучшил результаты. Средний балл группы B выше).
Шаг 2: Рассчитываем объединённую дисперсию (S²p)
S²p = ((15 - 1)*10² + (15 - 1)*9²) / (15 + 15 - 2)
S²p = (14*100 + 14*81) / 28
S²p = (1400 + 1134) / 28
S²p = 2534 / 28 ≈ 90.5
Шаг 3: Рассчитываем t-статистику
t = (75 - 82) / √(90.5 * (1/15 + 1/15))
t = (-7) / √(90.5 * (0.0667 + 0.0667))
t = (-7) / √(90.5 * 0.1334)
t = (-7) / √(12.0727)
t = (-7) / 3.475 ≈ -2.014
Шаг 4: Определяем число степеней свободы и критическое значение
df = n1 + n2 - 2 = 15 + 15 - 2 = 28
Для одностороннего теста на уровне значимости α=0.05 и df=28, критическое значение tкрит ≈ 1.701 (берётся из таблицы).