Математическая статистика — основы
Слово «статистика» происходит от латинского слова «status» (статус), что означает «состояние и положение дел/вещей».
Статистика занимается изучением количественной стороны массовых общественных явлений и процессов в числовой форме, выявляя особые закономерности.
На сегодняшний день статистика применяется практически во всех сферах общественной жизни, начиная от моды, кулинарии, садоводства и заканчивая астрономией, экономикой, медициной.
Перво-наперво, при знакомстве со статистикой необходимо изучить основные статистические характеристики, применяемые для анализа данных.
Ну вот, с этого и начнем!
Математическая статистика — коротко о главном
Определения математической статистики:
Статистическая выборка – выбранное из всего числа объектов конкретное число объектов для исследования.
Объем выборки – количество элементов \( ,,\ …,\ \), попавших в выборку.
Размах выборки – разность между максимальным и минимальным значениями элементов выборки.
Среднее арифметическое ряда чисел – это частное от деления суммы этих чисел на их количество (объем выборки).
Среднее арифметическое ряда чисел \( \left( \right)\) – это частное от деления суммы этих чисел \( \left( ++…+ \right)\) на их количество \( \left( n \right)\)
Модой ряда чисел называется число, наиболее часто встречающееся в данном ряду.
Медиана упорядоченного ряда чисел с нечетным числом членов – число, которое окажется посередине.
Медиана упорядоченного ряда чисел с четным числом членов –среднее арифметическое двух чисел, записанных посередине.
Частота представляет собой число повторений, сколько раз за какой-то период происходило некоторое событие, проявлялось определенное свойство объекта либо наблюдаемый параметр достигал данной величины.
Частота – число повторений определенного значения параметра в выборке.
Относительная частота – это отношение частоты к общему числу данных в ряду.
Для наглядности удобно представлять данные в виде соответствующих диаграмм/графиков.
Статистические характеристики
К основным статистическим характеристикам выборки данных…
Какая еще такая «выборка»!?
Под словом «выборка» подразумевается просто данные, которые ты собираешься исследовать.
Дальше на примерах будет все понятно.
Так вот к основным статистическим характеристикам выборки данных относятся:
- объем выборки,
- размах выборки,
- среднее арифметическое,
- мода,
- медиана,
- частота,
- относительная частота.
Стоп-стоп-стоп! Сколько новых слов! Давай обо всем по порядку.
Объем и размах выборкиВыборка состоит из элементов \( ,,\ …,\ \), попавших в нее. Количество этих элементов \( \left( n \right)\) называется объемом выборки.
Например, в таблице ниже приведен рост игроков сборной по футболу:
Данная выборка представлена \( \displaystyle 11\) элементами \( \displaystyle \left( =183;\ =194;\ =187;\ …;\ =181 \right)\).
Таким образом, объем выборки \( \displaystyle \left( n \right)\) равен \( \displaystyle 11\).
Разность между максимальным и минимальным значениями элементов выборки называется размахом выборки.
Размах представленной выборки составляет \( -=194-176=18\) см.
Среднее арифметическое выборкиСреднее арифметическое ряда чисел \( \left( \right)\) – это частное от деления суммы этих чисел \( \left( ++…+ \right)\) на их количество \( \left( n \right)\).
Не очень понятно? Давай смотреть на наш пример.
Определите средний рост игроков.
Ну что, приступим? Мы уже разбирались, что \( \displaystyle =183;\ =194;\ =187;\ …;\ =181\); \( \displaystyle n=11\).
Можем сразу смело все подставлять в нашу формулу:
Таким образом, средний рост игрока сборной составляет \( \displaystyle 183,8\) см.
Ну или вот такой пример:
Ученикам 9 класса на неделю было задано решить как можно больше примеров из задачника. Количество примеров, решенных учениками за неделю, приведены ниже:
Найдите среднее количество решенных задач.
Итак, в таблице нам представлены данные по \( \displaystyle 20\) ученикам. Таким образом, \( \displaystyle n=20\). \( \displaystyle =88;\ =90;\ =51;\ …;\ =47.\)
Ну что ж, найдем для начала сумму (общее количество) всех решенных задач двадцатью учениками:
Теперь можем смело приступать к расчету среднего арифметического решенных задач, зная, что \( \displaystyle ++…+=1560\), а \( \displaystyle n=20\):
Таким образом, в среднем ученики 9 класса решили по \( \displaystyle 78\) задач.
Еще один пример:
На рынке помидоры реализуются \( \displaystyle 7\) продавцами, причем цены за \( \displaystyle 1\) кг распределены следующим образом (в руб.): \( \displaystyle 60,\text< >55,\text< >54,\text< >70,\text< >65,\text< >67,\text< >63\).
Какова средняя цена килограмма помидоров на рынке?
Решение.
Итак, чему в данном примере равно \( \displaystyle n\)? Все верно: семь продавцов предлагают семь цен, значит, \( \displaystyle n=7\)! \( \displaystyle =60;\ =55;\ …;\ =63\).
Ну вот, со всеми составляющими разобрались, теперь можем приступить к расчету средней цены:
Ну что, разобрался?
Тогда посчитай самостоятельно среднее арифметическое в следующих выборках:
- \( \displaystyle 34;\ 46;\ 67;\ 37;\ 45;\text< >60\)
- \( \displaystyle 5;\ 4;\ 7;\ 9;\ 10;\ 12;\ 17;\ 8\)
- \( \displaystyle 156;\ 180;\ 164;\ 172\)
Ответы: \( \displaystyle 48,17;\text< >9;\ 168\).
Решил? Можем двигаться дальше.
Мода и медианаМодой ряда чисел называется число, наиболее часто встречающееся в данном ряду.
Обратимся снова к нашему примеру со сборной по футболу:
Чему в данном примере равна мода? Какое число наиболее часто встречается в этой выборке?
Все верно, это число \( \displaystyle 181\), так как два игрока имеют рост \( \displaystyle 181\) см; рост же остальных игроков не повторяется.
Тут все должно быть ясно и понятно, да и слово знакомое, правда?
Перейдем к медиане, ты ее должен знать из курса геометрии. Но мне не сложно напомнить, что в геометрии медиана (в переводе с латинского- «средняя») — отрезок внутри треугольника, соединяющий вершину треугольника с серединой противоположной стороны.
Ключевое слово – СЕРЕДИНА. Если ты знал это определение, то тебе легко будет запомнить, что такое медиана в статистике.
Медианой ряда чисел с нечетным числом членов называется число, которое окажется посередине, если этот ряд упорядочить (проранжировать, т.е. расположить значения в порядке убывания или возрастания).
Медианой ряда чисел с четным числом членов называется среднее арифметическое двух чисел, записанных посередине, если этот ряд упорядочить.
Ну что, вернемся к нашей выборке футболистов?
Ты заметил в определении медианы важный момент, который нам еще здесь не встречался? Конечно, «если этот ряд упорядочить»!
Для того, чтобы в ряду чисел был порядок, можно расположить значения роста футболистов как в порядке убывания, так и в порядке возрастания. Мне удобней выстроить этот ряд в порядке возрастания (от самого маленького к самому большому).
Вот, что у меня получилось:
Так, ряд упорядочили, какой еще есть важный момент в определении медианы? Правильно, четное и нечетное количество членов в выборке.
Заметил, что для четного и нечетного количества даже определения отличаются? Да, ты прав, не заметить – сложно. А раз так, то нам надо определиться, четное у нас количество игроков в нашей выборке или нечетное?
Все верно – игроков \( \displaystyle 11\), значит, количество нечетное! Теперь можем применять к нашей выборке менее заковыристое определение медианы для нечетного количества членов в выборке.
Ищем число, которое оказалось посередине в нашем упорядоченном ряду:
Ну вот, чисел у нас \( \displaystyle 11\), значит, по краям остается по пять чисел, а рост \( \displaystyle 183\) см будет медианой в нашей выборке.
Не так уж и сложно, правда?
А теперь разберем пример с нашими отчаянными ребятами из 9 класса, которые решали примеры в течение недели:
Готов искать в этом ряду моду и медиану?
Для начала, упорядочим этот ряд чисел (расположим от самого маленького числа к самому большому). Получился вот такой вот ряд:
Теперь можно смело определить моду в данной выборке. Какое число встречается чаще других? Все верно, \( \displaystyle 77\)!
Таким образом, мода в данной выборке равна \( \displaystyle 77\).
Моду нашли, теперь можем приступать к нахождению медианы. Но прежде, ответь мне: каков объем рассматриваемой выборки? Посчитал? Все верно, объем выборки равен \( \displaystyle 20\).
А \( \displaystyle 20\) – это четное число. Таким образом, применяем определение медианы для ряда чисел с четным количеством элементов.
То есть нам надо в нашем упорядоченном ряду найти среднее арифметическое двух чисел, записанных посередине. Какие два числа располагаются посередине?
Все верно, \( \displaystyle 80\) и \( \displaystyle 81\)!
Таким образом, медианой этого ряда будет среднее арифметическое чисел \( \displaystyle 80\) и \( \displaystyle 81\):
\( 80,5\)— медиана рассматриваемой выборки.
Частота и относительная частотаЧастота представляет собой число повторений, сколько раз за какой-то период происходило некоторое событие, проявлялось определенное свойство объекта либо наблюдаемый параметр достигал данной величины.
То есть частота определяет то, как часто повторяется та или иная величина в выборке.
Разберемся на нашем примере с футболистами. Перед нами вот такой вот упорядоченный ряд:
Частота – это число повторений какой-либо величины параметра. В нашем случае, это можно считать вот так. Сколько игроков имеет рост \( 176\)?
Все верно, один игрок. Таким образом, частота встречи игрока с ростом \( 176\) в нашей выборке равна \( 1\).
Сколько игроков имеет рост \( 178\)? Да, опять же один игрок. Частота встречи игрока с ростом \( 178\) в нашей выборке равна \( 1\).
Задавая такие вопросы и отвечая на них, можно составить вот такую табличку:
Ну вот, все довольно просто. Помни, что сумма частот должна равняться количеству элементов в выборке (объему выборки).
То есть в нашем примере: \( 1+1+1+2+1+1+1+1+1+1=11\)
Перейдем к следующей характеристике – относительная частота.
Относительная частота – это отношение частоты к общему числу данных в ряду. Как правило, относительная частота выражается в процентах.
Обратимся опять к нашему примеру с футболистами. Частоты для каждого значения мы рассчитали, общее количество данных в ряду мы тоже знаем \( \left( n=11 \right)\) .
Рассчитываем относительную частоту для каждого значения роста и получаем вот такую табличку:
А теперь сам составь таблицы частот и относительных частот для примера с 9-классниками, решающими задачи.