Критерий Стьюдента: сравнение средних

Что такое критерий Стьюдента и зачем он нужен?

Представьте, что вы сравниваете средние оценки двух групп студентов или среднюю выручку двух магазинов. Критерий Стьюдента (или t-тест) — это статистический инструмент, который помогает определить, является ли разница между средними значениями двух групп статистически значимой или она могла возникнуть случайно. 📊

Этот метод особенно полезен в Data Science для проверки гипотез, например:

➡️ Повлияла ли новая маркетинговая стратегия на продажи?
➡️ Даёт ли новый алгоритм машинного обучения более точные прогнозы?
➡️ Различается ли средний рост между мужчинами и женщинами в выборке?

💡 Важно помнить: критерий Стьюдента не говорит о том, насколько велика разница, а только о том, является ли она статистически значимой.

Основные типы t-критериев

Существует три основных типа t-тестов. Выбор зависит от того, какие данные вы сравниваете.

Тип теста	Когда использовать?	Пример
Одновыборочный	Сравнение среднего значения одной группы с известным средним (например, теоретическим значением).	Средний рост студентов равен 175 см?
Двухвыборочный для независимых выборок	Сравнение средних двух разных, независимых групп.	Сравнить средние оценки студентов факультета A и факультета B.
Парный t-тест	Сравнение средних значений для одной и той же группы в двух разных условиях (до и после).	Сравнить продуктивность сотрудников до и после тренинга.

🎯 Совет: Для независимых выборок сначала всегда проверяйте равенство дисперсий с помощью F-теста, чтобы выбрать правильную формулу t-теста.

Формула и расчёт t-статистики

Сердце критерия Стьюдента — это вычисление t-статистики. Для двух независимых выборок с равными дисперсиями формула выглядит так:

t = (X̄1 - X̄2) / √(S²p * (1/n1 + 1/n2))

Где:

X̄1 и X̄2 — выборочные средние двух групп
n1 и n2 — размеры выборок
S²p — объединённая дисперсия (pooled variance), которая вычисляется так:

S²p = ((n1 - 1)*S²1 + (n2 - 1)*S²2) / (n1 + n2 - 2)

Полученное значение t-статистики сравнивается с критическим значением из таблицы распределения Стьюдента для заданного уровня значимости (обычно 0.05) и числа степеней свободы df = n1 + n2 - 2.

📘 Простыми словами: t-статистика показывает, во сколько раз разница между средними превышает её стандартную ошибку. Чем больше значение t (по модулю), тем меньше вероятность, что такая разница возникла случайно.

Интерпретация результата: p-value и значимость

Ключевой этап — интерпретация результата. Вместо ручного сравнения с таблицей современные инструменты (Python, R) сразу рассчитывают p-value.

p-value < 0.05: Различие статистически значимо на уровне 5%. Мы отвергаем нулевую гипотезу об отсутствии различий. ✅
p-value >= 0.05: Нет оснований отвергать нулевую гипотезу. Наблюдаемая разница могла возникнуть случайно. ❌

⚠️ Предупреждение: Статистическая значимость не равно практическая значимость. Большая выборка может выявить очень маленькую, но статистически значимую разницу, которая не имеет практической ценности.

Практическая задача: применяем знания

Давайте решим задачу шаг за шагом, чтобы закрепить понимание.

Условие

Мы хотим выяснить, влияет ли новый метод обучения на результаты экзаменов. У нас есть две независимые группы студентов по 15 человек в каждой. Группа A училась по старому методу, группа B — по новому. Их средние баллы на экзамене и стандартные отклонения следующие:

Группа A (старый метод): X̄₁ = 75 баллов, S₁ = 10 баллов, n₁ = 15
Группа B (новый метод): X̄₂ = 82 балла, S₂ = 9 баллов, n₂ = 15

Проверьте гипотезу на уровне значимости α = 0.05 о том, что новый метод обучения эффективнее.

Решение

Шаг 1: Формулируем гипотезы

Нулевая гипотеза (H₀): μ₁ = μ₂ (Новый метод не повлиял на результаты. Средние баллы равны).
Альтернативная гипотеза (H₁): μ₁ < μ₂ (Новый метод улучшил результаты. Средний балл группы B выше).

Шаг 2: Рассчитываем объединённую дисперсию (S²p)

S²p = ((15 - 1)*10² + (15 - 1)*9²) / (15 + 15 - 2)
S²p = (14*100 + 14*81) / 28
S²p = (1400 + 1134) / 28
S²p = 2534 / 28 ≈ 90.5

Шаг 3: Рассчитываем t-статистику

t = (75 - 82) / √(90.5 * (1/15 + 1/15))
t = (-7) / √(90.5 * (0.0667 + 0.0667))
t = (-7) / √(90.5 * 0.1334)
t = (-7) / √(12.0727)
t = (-7) / 3.475 ≈ -2.014

Шаг 4: Определяем число степеней свободы и критическое значение

df = n1 + n2 - 2 = 15 + 15 - 2 = 28

Для одностороннего теста на уровне значимости α=0.05 и df=28, критическое значение tкрит ≈ 1.701 (берётся из таблицы).