Элементы статистики: сбор и группировка данных

Что такое статистика и зачем она нужна? 🎯

Представь, что ты капитан корабля, и тебе нужно принять важное решение: куда плыть? Чтобы выбрать правильный курс, ты сначала изучаешь карты, погоду, направление ветра. Статистика — это и есть такие «карты» для принятия решений в мире чисел! Она помогает собирать, упорядочивать и анализировать информацию, чтобы делать выводы.

Мы сталкиваемся со статистикой каждый день: средняя температура за неделю, проценты успеваемости в классе, рейтинг любимого сериала. Сегодня мы научимся правильно собирать и упорядочивать данные — это первый и самый важный шаг!


Сбор данных: с чего начать? 📊

Допустим, мы хотим узнать, какой вид спорта самый популярный в нашем классе. Нам нужно собрать информацию. Это и есть данные.

Данные бывают двух видов:

  • Количественные ➕: их можно измерить и выразить числом (рост, вес, количество оценок).
  • Качественные 🔤: описывают свойство или признак (цвет волос, любимый предмет, вид спорта).

В нашем случае «вид спорта» — это качественные данные.

💡 Совет: прежде чем собирать данные, четко определи цель исследования. Что именно мы хотим узнать? Это поможет не запутаться.

Самый простой способ собрать данные — провести опрос. Мы можем опросить всех учеников в классе и записать их ответы в список.

Пример сырых данных (так данные выглядят до обработки):

Футбол, Баскетбол, Плавание, Футбол, Волейбол, Баскетбол, Футбол, Легкая атлетика, Футбол, Волейбол


Группировка данных: приводим всё в порядок 📘

Смотреть на беспорядочный список неудобно. Чтобы понять, какой вид спорта лидирует, нужно данные сгруппировать и упорядочить.

Создадим таблицу частот. Частота — это число, которое показывает, сколько раз встретился тот или иной вариант данных.

Давай посчитаем, сколько раз каждый вид спорта встретился в нашем списке:

Вид спорта Счет Частота (раз)
Футбол |||| 4
Баскетбол || 2
Волейбол || 2
Плавание | 1
Легкая атлетика | 1

Счет — это удобный способ подсчета черточками (как зарубки на дереве). Каждая пятая черточка перечеркивает четыре предыдущие для удобства: ||||

📏 Запомни: сумма всех частот всегда равна общему количеству данных. Давай проверим: 4 + 2 + 2 + 1 + 1 = 10. Все верно, мы опросили 10 человек!


Решаем задачу вместе: рост учеников 🧮

Давай поработаем с количественными данными. Измерим рост (в см) 15 учеников нашего класса:

155, 160, 162, 158, 165, 170, 172, 168, 158, 155, 170, 165, 162, 160, 168

Смотришь на эти числа и голова идет кругом? Давай наведем порядок!

Когда разных числовых значений много, их группируют в интервалы (промежутки).

  1. Найдем наименьшее и наибольшее значение в наборе.
    • Наименьший рост: 155
    • Наибольший рост: 172
  2. Определим размах: 172 - 155 = 17 см.
  3. Выберем удобную ширину интервала. Часто берут интервал шириной 5. Давай так и сделаем.
  4. Составим интервалы. Начнем с 155 см.

Наша таблица частот для интервалов будет выглядеть так:

Интервал роста (см) Счет Частота (чел.)
155 - 159 |||| 4
160 - 164 |||| 4
165 - 169 |||| 4
170 - 174 ||| 3

Запись 155 - 159 означает «от 155 включительно до 159 включительно».

Теперь сразу видно, что рост большинства учеников (аж 12 человек!) находится в промежутке между 155 и 169 см. А высоких ребят (170-174 см) у нас трое. Данные стали наглядными!


Практическое задание для закрепления ✏️

Условие:

В школе проходила неделя чтения. Ученики 8Б класса записывали, сколько страниц они прочитали за день. Вот что получилось:

15, 20, 10, 25, 30, 15, 10, 5, 20, 25, 15, 30, 10, 5, 20

1. Определи, какой это тип данных (количественный или качественный).
2. Построй таблицу частот для этих данных (без интервалов).
3. Ответь на вопрос: сколько страниц читали чаще всего?

Скрыть рекламу навсегда

📘 VK Видео — обучение без ограничений

Все уроки доступны без VPN, без блокировок и зависаний.

Можно смотреть с телефона, планшета или компьютера — в любое время.

▶️ Смотреть на VK Видео