Элементы статистики: сбор и группировка данных
Что такое статистика и зачем она нужна? 🎯
Представь, что ты капитан корабля, и тебе нужно принять важное решение: куда плыть? Чтобы выбрать правильный курс, ты сначала изучаешь карты, погоду, направление ветра. Статистика — это и есть такие «карты» для принятия решений в мире чисел! Она помогает собирать, упорядочивать и анализировать информацию, чтобы делать выводы.
Мы сталкиваемся со статистикой каждый день: средняя температура за неделю, проценты успеваемости в классе, рейтинг любимого сериала. Сегодня мы научимся правильно собирать и упорядочивать данные — это первый и самый важный шаг!
Сбор данных: с чего начать? 📊
Допустим, мы хотим узнать, какой вид спорта самый популярный в нашем классе. Нам нужно собрать информацию. Это и есть данные.
Данные бывают двух видов:
- Количественные ➕: их можно измерить и выразить числом (рост, вес, количество оценок).
- Качественные 🔤: описывают свойство или признак (цвет волос, любимый предмет, вид спорта).
В нашем случае «вид спорта» — это качественные данные.
💡 Совет: прежде чем собирать данные, четко определи цель исследования. Что именно мы хотим узнать? Это поможет не запутаться.
Самый простой способ собрать данные — провести опрос. Мы можем опросить всех учеников в классе и записать их ответы в список.
Пример сырых данных (так данные выглядят до обработки):
Футбол, Баскетбол, Плавание, Футбол, Волейбол, Баскетбол, Футбол, Легкая атлетика, Футбол, Волейбол
Группировка данных: приводим всё в порядок 📘
Смотреть на беспорядочный список неудобно. Чтобы понять, какой вид спорта лидирует, нужно данные сгруппировать и упорядочить.
Создадим таблицу частот. Частота — это число, которое показывает, сколько раз встретился тот или иной вариант данных.
Давай посчитаем, сколько раз каждый вид спорта встретился в нашем списке:
| Вид спорта | Счет | Частота (раз) |
|---|---|---|
| Футбол | |||| | 4 |
| Баскетбол | || | 2 |
| Волейбол | || | 2 |
| Плавание | | | 1 |
| Легкая атлетика | | | 1 |
Счет — это удобный способ подсчета черточками (как зарубки на дереве). Каждая пятая черточка перечеркивает четыре предыдущие для удобства: ||||
📏 Запомни: сумма всех частот всегда равна общему количеству данных. Давай проверим:
4 + 2 + 2 + 1 + 1 = 10. Все верно, мы опросили 10 человек!
Решаем задачу вместе: рост учеников 🧮
Давай поработаем с количественными данными. Измерим рост (в см) 15 учеников нашего класса:
155, 160, 162, 158, 165, 170, 172, 168, 158, 155, 170, 165, 162, 160, 168
Смотришь на эти числа и голова идет кругом? Давай наведем порядок!
Когда разных числовых значений много, их группируют в интервалы (промежутки).
- Найдем наименьшее и наибольшее значение в наборе.
- Наименьший рост:
155 - Наибольший рост:
172
- Наименьший рост:
- Определим размах:
172 - 155 = 17см. - Выберем удобную ширину интервала. Часто берут интервал шириной 5. Давай так и сделаем.
- Составим интервалы. Начнем с 155 см.
Наша таблица частот для интервалов будет выглядеть так:
| Интервал роста (см) | Счет | Частота (чел.) |
|---|---|---|
| 155 - 159 | |||| | 4 |
| 160 - 164 | |||| | 4 |
| 165 - 169 | |||| | 4 |
| 170 - 174 | ||| | 3 |
Запись 155 - 159 означает «от 155 включительно до 159 включительно».
Теперь сразу видно, что рост большинства учеников (аж 12 человек!) находится в промежутке между 155 и 169 см. А высоких ребят (170-174 см) у нас трое. Данные стали наглядными!
Практическое задание для закрепления ✏️
Условие:
В школе проходила неделя чтения. Ученики 8Б класса записывали, сколько страниц они прочитали за день. Вот что получилось:
15, 20, 10, 25, 30, 15, 10, 5, 20, 25, 15, 30, 10, 5, 20
1. Определи, какой это тип данных (количественный или качественный).
2. Построй таблицу частот для этих данных (без интервалов).
3. Ответь на вопрос: сколько страниц читали чаще всего?