Урок статистики

Конспект занятия
В материале дается разработка теории по статистике
Наталья Николаевна Бережнова
Содержимое публикации

Как вы уже догадались, тема нашего урока – статистика. Статистика – наука, которая занимается получением, обработкой и анализом количественных данных о разнообразных массовых явлениях, происходящих в природе и обществе.

Задача сегодняшнего урока – научиться группировать и частично анализировать имеющуюся у нас информацию.

Сейчас я предоставлю вам ваши оценки по алгебре за предыдущую контрольную работу. Не применяя никакой системы, я просто выписала данные из вашего журнала.

Не глядя на эти данные, ответьте, какие числа могут встретиться среди них? (наводящие вопросы: какая у нас система оценивания? (пятибалльная). Значит, какие отметки мы здесь можем увидеть? (1;2;3;4;5.)). В статистике цепочку данных, которая может встретиться среди измерений, называют общим рядом данных (открываю данные).

3 3 4 4 5 3
5 4 3 4 3 4
4 4 4 5 3 3
2 3 3 4 3 4 3.

Но теперь мы видим, что не все из указанных чисел здесь имеются, а только 2; 3; 4; 5. Числа, которые действительно встретились в нашей цепочке, называют рядом данных.

Глядя на эти данные, что мы можем сказать о вашей успеваемости? (варианты ответов).

Если не пытаться проанализировать данные, сказать мы можем очень мало. Но для анализа запись очень неудачна – в ней нет системы, нет закономерности. Какая запись, по-вашему, будет удачнее? (варианты ответов, останавливаемся на расположении в порядке возрастания).

2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5.

Такой порядок данных называют сгруппированным рядом данных.

Сколько у нас различных данных? (4).

Каждый результат называют вариантой измерения. Запомнить очень легко – один из вариантов, только женского рода.

(Записываем в тетрадь определение: Варианта измерения – один из результатов этого измерения).

Так как количество данных невелико, мы уже сейчас можем сказать, что наибольшее число оценок составляют «тройки» и «четвёрки», наименьшее (слава Богу!) «двойки». Но на сколько? Таких расплывчатых данных явно недостаточно. Сколько у нас двоек? Троек? Четвёрок? Пятёрок?

Запишем определение: Каждая варианта наблюдается в ряде данных определённое количество раз. Это количество называется кратностью варианты.

Давайте оформим результаты наблюдений, а точнее, измерений, в виде таблицы: (рекомендую после таблицы оставить немного места, так как таблицу мы будем дополнять).

 

варианта

сумма

  2  

  3  

  4  

  5  

Кратность варианты

1

11

10

3

25

Если сложить все кратности, то получится общее количество оценок в классе, в статистике общее количество данных измерения называют объёмом измерения. (Записываем в тетрадь: Количество всех данных измерения – объём измерения).

Итак, группировка данных завершена. Количество двоек у нас – 1. Если это среди ста обучающихся, то это немного, а если среди пяти? То есть нам нужно связать кратность варианты с объёмом измерения. Какую часть составляет наша варианта от общего объёма измерения? (Вычисляем:; ;  ; .)

Мы нашли с вами частоту варианты.

(Записываем: Частота варианты = кратность варианты/ объём измерения).

Часто частоту переводят в проценты, для этого полученные результаты умножают на 100%.

Итак, запишем результаты в таблицу.

 

варианта

сумма

2

3

4

5

Кратность варианты

1

11

10

3

25

частота

0,04

0,44

0,40

0,12

1

Частота, %

4

44

40

12

100

Теперь информация о вашей успеваемости стала намного понятней: успеваемость в вашем классе составляет 96%, это те, кто успевает по предмету (имеет положительную оценку). Хорошим результатом это назвать нельзя, так как успевать должны все 100%. Качество знаний составляет 52%, это те, кто учится качественно, то есть на «4» и «5».

Какой вывод можно сделать из нашего исследования? Нам есть куда расти!

IV. Закрепление.

№ 19.3.Вопросы задания меняю.

Давайте составим общий ряд данных. Не думаю, что могут встретиться арбузы массой меньше 3 кг и больше 15 кг.
3; 3,5; 4; 4,5; 5; 5,5; 6; 6,5; 7; 7,5; 8; 8,5; 9; 9,5; 10; 10,5; 11; 11,5; 12; 12,5; 13; 13,5; 14; 14,5; 15.

А теперь составим ряд данных, то есть тех, которые имеются у нас в действительности.
5; 6; 6,5; 7; 8; 8,5; 9; 9,5; 10; 10,5; 11; 12.

Сейчас мы заполним таблицу, такую же, как в предыдущем примере:

 

варианта

Сумма

5

6

6,5

7

8

8,5

9

9,5

10

10,5

11

12

Кратность варианты

2

5

2

9

14

3

5

1

7

3

6

3

60

Частота

0,03

0,08

0,03

0,15

0,24

0,05

0,08

0,02

0,12

0,05

0,1

0,05

1

Частота, %.

3

8

3

15

24

5

8

2

12

5

10

5

100

 

(Дополнительные вопросы могут быть различными: Какова разница между самым тяжёлым и самым лёгким арбузом? Арбуз какой массы встречается чаще всего? Реже всего?)

(В зависимости от уровня класса эту таблицу можно закончить дома или задать другое домашнее задание).

V. Итоги урока.

(повторяем основные понятия, изученные на уроке, в тетради находим определения этих понятий). Домашнее задание: 19.4, 19.5.

Пример

В финал конкурса “Мисс факультета” вышли 10 студенток, за которых болели и голосовали 90 студентов. В таблице приведены результаты голосования за участниц с номерами 1-10. Прежде всего возникает вопрос о наглядном отражении результатов голосования. Из алгебры вы знаете, что графическая информация нагляднее табличной. Поэтому применяют три вида графического отражения информации - диаграммы.

№ участницы

1

2

3

4

5

6

7

8

9

10

Число голосов

7

3

14

15

7

4

3

7

20

10

Первый вид диаграммы - линейная диаграмма (или многоугольник распределения) строится как обычный график. По оси абсцисс откладываются номера участниц, по оси ординат - число голосов, отданных за данную участницу, т. е. точки (1; 7), (2; 3); (3; 14) и т. д. Для наглядности отмеченные точки соединены отрезками.

Второй вид диаграммы - столбчатая диаграмма (или гистограмма распределения) строится следующим образом. В окрестности каждой отмеченной точки по оси абсцисс строят прямоугольник, высота которого равна соответствующей ординате. При этом обычно ширину прямоугольников делают одинаковой. Достаточно часто прямоугольники изображаются таким образом, что два соседних имеют общую сторону. При этом прямоугольники могут штриховаться (см. учебник).

Третья диаграмма - круговая (или камамбер, по названию французского сыра) представляет собой круг, разделенный на 10 секторов с различными центральными углами. Так как всего было подано 90 голосов, то каждому голосу соответствует 360° : 90 = 4°. Далее легко пересчитать углы секторов. Например, для первой участницы строим сектор с углом 4° ∙ 7 = 28°. Каждый сектор маркируется номером соответствующей участницы.

На практике применяют все три вида диаграмм. Итак, на конкретном примере были рассмотрены основные этапы простейшей статистической обработки данных:

1. Систематизация, упорядочивание и группировка.

2. Составление таблицы распределения данных.

3. Построение диаграммы распределения данных (любого вида).

4. Паспорт данных измерения (основные характеристики информации).

Обсудим некоторые характеристики рассматриваемого примера.

Объем измерения - количество источников информации (т. е. число опрошенных или число голосов). В данном случае 90.

Размах измерения - разница между наибольшим и наименьшим значениями результатов измерения. В данном случае 20 - 3 = 17, так как наибольшее число поданных голосов 20, наименьшее - 3.

Мода измерения - наиболее часто встречающийся результат. В данном случае 9, так как за участницу № 9 было подано 20 голосов (наибольшее количество).

Среднее (или среднее арифметическое) - частное от деления суммы всех результатов измерения на объем измерения. Обычно его вычисляют после составления таблицы распределения. В данном случае получают: 

Обычно результатами измерений являются некоторые числа. Каждое число, встретившееся в конкретном измерении, называют вариантой измерения. В конкретном измерении его варианты могут быть никак не связаны (например, билетики с результатами голосования). Однако обычно результаты обрабатываются. Если записать все варианты измерения в некотором порядке (например, по времени поступления голосов в жюри), то получится ряд данных измерения. Обычно упорядочивание происходит определенным образом. Запишем полученные варианты в порядке их возрастания (точнее, неубывания). Получим сгруппированный ряд данных:

Среднюю варианту в сгруппированном ряде данных в случае нечетного количества чисел или среднее арифметическое двух стоящих посередине вариант в случае четного количества чисел называют медианой измерения. В нашем случае средних варианты две, это варианты 45 и 46. Каждая из них равна 5, значит, и медиана равна 

В нашем примере ответ 1 встретился 7 раз (за участницу № 1 проголосовали 7 человек). Поэтому говорят, что абсолютная частота (или кратность) варианты 1 равна семи. Поэтому (в другой терминологии) ранее приведенная таблица имеет вид:

Варианта

1

2

3

4

5

6

7

8

9

10

Сумма

Кратность

7

3

14

15

7

4

3

7

20

10

90

Таким образом, получаем таблицу распределения данных измерения. Графа “Сумма” добавляется для контроля: число в этой графе обязательно равняется объему измерения.

Заметим, что при вычислении среднего арифметического в неявном виде уже использовалось понятие кратности варианты.

Введем еще понятие частоты данной варианты - частное от деления кратности варианты на объем измерения. Например, для варианты 1 находим частоту  Частоту варианты можно выразить в процентах. Тогда получим: 

Элементы статистики

Продолжаем изучать элементарные задачи по математике. Сегодня мы поговорим о статистике.

Статистика — это раздел математики в котором изучаются вопросы сбора, измерения и анализа информации, представленной в числовой форме. Происходит слово статистика от латинского слова status (состояние или положение дел).

Так, с помощью статистики мы можем узнать свое положение дел, касающихся финансов. С начала месяца можно вести дневник расходов и по окончании месяца, воспользовавшись статистикой, узнать сколько денег в среднем мы тратили каждый день или какая потраченная сумма была наибольшей в этом месяце либо узнать какую сумму мы тратили наиболее часто.

На основе этой информации можно провести анализ и сделать определенные выводы: следует ли в следующем месяце

Выборка. Объем. Размах

Что такое выборка? Если говорить простым языком, то это отобранная нами информация для исследования. Например, мы можем сформировать следующую выборку — суммы денег, потраченных в каждый из шести дней. Давайте нарисуем таблицу в которую занесем расходы за шесть дней

Выборка состоит из n-элементов. Вместо переменной n может стоять любое число. У нас имеется шесть элементов, поэтому переменная n равна 6

n = 6

Элементы выборки обозначаются с помощью переменных с индексами . Последний  элемент является шестым элементом выборки, поэтому вместо n будет стоять число 6.

Обозначим элементы нашей выборки через переменные 

Количество элементов выборки называют объемом выборки. В нашем случае объем равен шести.

Размахом выборки называют разницу между самым большим и маленьким элементом выборки.

В нашем случае, самым большим элементом выборки является элемент 250, а самым маленьким — элемент 150. Разница между ними равна 100

Мода и медиана

Модой называют элемент, который встречается в выборке чаще других.

Рассмотрим следующую выборку: шестеро спортсменов, а также время в секундах за которое они пробегают 100 метров

Элемент 14 встречается в выборке чаще других, поэтому элемент 14 назовем модой.

Рассмотрим еще одну выборку. Тех же спортсменов, а также смартфоны, которые им принадлежат

Элемент iphone встречается в выборке чаще других, значит элемент iphone является модой. Говоря простым языком, носить iphone модно.

Конечно элементы выборки в этот раз выражены не числами, а другими объектами (смартфонами), но для общего представления о моде этот пример вполне приемлем.

Рассмотрим следующую выборку: семеро спортсменов, а также их рост в сантиметрах:

Упорядочим данные в таблице так, чтобы рост спортсменов шел по возрастанию. Другими словами, построим спортсменов по росту:

Выпишем рост спортсменов отдельно:

180, 182, 183, 184, 185, 188, 190

В получившейся выборке 7 элементов. Посередине этой выборки располагается элемент 184. Слева и справа от него по три элемента. Такой элемент как 184 называют медианой упорядоченной выборки.

Медианой упорядоченной выборки называют элемент, располагающийся посередине.

Отметим, что данное определение справедливо в случае, если количество элементов упорядоченной выборки является нечётным.

В рассмотренном выше примере, количество элементов упорядоченной выборки было нечётным. Это позволило нам быстро указать медиану

Но возможны случаи, когда количество элементов выборки чётно.

К примеру, рассмотрим выборку в которой не семеро спортсменов, а шестеро:

Построим этих шестерых спортсменов по росту:

Выпишем рост спортсменов отдельно: 180, 182, 184, 186, 188, 190

В данной выборке не получается указать элемент, который находился бы посередине. Если указать элемент 184 как медиану, то слева от этого элемента будут располагаться два элемента, а справа — три. Если как медиану указать элемент 186, то слева от этого элемента будут располагаться три элемента, а справа — два.

В таких случаях для определения медианы выборки, нужно взять два элемента выборки, находящихся посередине и найти их среднее арифметическое. Полученный результат будет являться медианой.

Вернемся к нашим спортсменам. В упорядоченной выборке 180, 182, 184, 186, 188, 190 посередине располагаются элементы 184 и 186

Найдем среднее арифметическое элементов 184 и 186

Элемент 185 является медианой выборки, несмотря на то, что этот элемент не является членом исходной и упорядоченной выборки. Спортсмена с ростом 185 нет среди остальных спортсменов. Рост в 185 см используется в данном случае для статистики, чтобы можно было сказать о том, что срединный рост спортсменов составляет 185 см.

Поэтому более точное определение медианы зависит от количества элементов в выборке.

Если количество элементов упорядоченной выборки нечётно, то медианой выборки называют элемент, располагающийся посередине.

Если количество элементов упорядоченной выборки чётно, то медианой выборки называют среднее арифметическое двух чисел, располагающихся посередине этой выборки.

Медиана и среднее арифметическое по сути являются «близкими родственниками», поскольку и то и другое используют для определения среднего значения. Например, для предыдущей упорядоченной выборки 180, 182, 184, 186, 188, 190 мы определили медиану, равную 185. Этот же результат можно получить путем определения среднего арифметического элементов 180, 182, 184, 186, 188, 190

Но медиана в некоторых случаях отражает более реальную ситуацию. Например, рассмотрим следующий пример:

Было подсчитано количество имеющихся очков у каждого спортсмена. В результате получилась следующая выборка:

0, 1, 1, 1, 2, 1, 2, 3, 5, 4, 5, 0, 1, 6, 1

Определим среднее арифметическое для данной выборки — получим значение 2,2

По данному значению можно сказать, что в среднем у спортсменов 2,2 очка

Теперь определим медиану для этой же выборки. Упорядочим элементы выборки и укажем элемент, находящийся посередине:

0, 0, 1, 1, 1, 1, 112, 2, 3, 4, 5, 5, 6

В данном примере медиана лучше отражает реальную ситуацию, поскольку половина спортсменов имеет не более одного очка.

Частота

Частота это число, которое показывает сколько раз в выборке встречается тот или иной элемент.

Предположим, что в школе проходят соревнования по подтягиваниям. В соревнованиях участвует 36 школьников. Составим таблицу в которую будем заносить число подтягиваний, а также число участников, которые выполнили столько подтягиваний.

По таблице можно узнать сколько человек выполнило 5, 10 или 15 подтягиваний. Так, 5 подтягиваний выполнили четыре человека, 10 подтягиваний выполнили восемь человек, 15 подтягиваний выполнили три человека.

Количество человек, повторяющих одно и то же число подтягиваний в данном случае являются частотой. Поэтому вторую строку таблицы переименуем в название «частота»:

Такие таблицы называют таблицами частот.

Частота обладает следующим свойством: сумма частот равна общему числу данных в выборке.

Это означает, что сумма частот равна общему числу школьников, участвующих в соревнованиях, то есть тридцати шести. Проверим так ли это. Сложим частоты, приведенные в таблице:

4 + 5 + 10 + 8 + 6 + 3 = 36

Относительная частота

Относительная частота это в принципе та же самая частота, которая была рассмотрена ранее, но только выраженная в процентах.

Относительная частота равна отношению частоты на общее число элементов выборки.

Вернемся к нашей таблице:

Пять подтягиваний выполнили 4 человека из 36. Шесть подтягиваний выполнили 5 человек из 36. Восемь подтягиваний выполнили 10 человек из 36 и так далее. Давайте заполним таблицу с помощью таких отношений:

Выполним деление в этих дробях:

Выразим эти частоты в процентах. Для этого умножим их на 100. Умножение на 100 удобно выполнить передвижением запятой на две цифры вправо:

Теперь можно сказать, что пять подтягиваний выполнили 11% участников, 6 подтягиваний выполнили 14% участников, 8 подтягиваний выполнили 28% участников и так далее.

Комментировать
Свидетельство участника экспертной комиссии
Оставляйте комментарии к работам коллег и получите документ бесплатно!
Подробнее
Также Вас может заинтересовать
Алгебра
Презентации по алгебре для 10 класса «Понятие призмы»
Алгебра
Алгебра
Презентации по алгебре для 8 класса «Неравенства. Числовые промежутки»
Алгебра
Конспект занятия по алгебре для 9 класса «Итоговый урок по алгебре в 9 классе»
Комментарии
Добавить
публикацию
После добавления публикации на сайт, в личном кабинете вы сможете скачать бесплатно свидетельство и справку о публикации в СМИ.
Cвидетельство о публикации сразу
Получите свидетельство бесплатно сразу после добавления публикации.
Подробнее
Свидетельство за распространение педагогического опыта
Опубликует не менее 15 материалов и скачайте бесплатно.
Подробнее
Рецензия на методическую разработку
Опубликуйте материал и скачайте рецензию бесплатно.
Подробнее
Свидетельство участника экспертной комиссии
Стать экспертом и скачать свидетельство бесплатно.
Подробнее
Помощь