Математическая статистика — основы

Математическая статистика — основы

Слово «статистика» происходит от латинского слова «status» (статус), что означает «состояние и положение дел/вещей».

Статистика занимается изучением количественной стороны массовых общественных явлений и процессов в числовой форме, выявляя особые закономерности.

На сегодняшний день статистика применяется практически во всех сферах общественной жизни, начиная от моды, кулинарии, садоводства и заканчивая астрономией, экономикой, медициной.

Перво-наперво, при знакомстве со статистикой необходимо изучить основные статистические характеристики, применяемые для анализа данных.

Ну вот, с этого и начнем!

Математическая статистика — коротко о главном

Определения математической статистики:

Статистическая выборка – выбранное из всего числа объектов конкретное число объектов для исследования.

Объем выборки – количество элементов \( ,,\ …,\ \), попавших в выборку.

Размах выборки разность между максимальным и минимальным значениями элементов выборки.

Среднее арифметическое ряда чисел – это частное от деления суммы этих чисел на их количество (объем выборки).

Среднее арифметическое ряда чисел \( \left( \right)\) – это частное от деления суммы этих чисел \( \left( ++…+ \right)\) на их количество \( \left( n \right)\)

Модой ряда чисел называется число, наиболее часто встречающееся в данном ряду.

Медиана упорядоченного ряда чисел с нечетным числом членов – число, которое окажется посередине.

Медиана упорядоченного ряда чисел с четным числом членов –среднее арифметическое двух чисел, записанных посередине.

Частота представляет собой число повторений, сколько раз за какой-то период происходило некоторое событие, проявлялось определенное свойство объекта либо наблюдаемый параметр достигал данной величины.

Частота – число повторений определенного значения параметра в выборке.

Относительная частота – это отношение частоты к общему числу данных в ряду.

Для наглядности удобно представлять данные в виде соответствующих диаграмм/графиков.

Статистические характеристики

К основным статистическим характеристикам выборки данных…

Какая еще такая «выборка»!?

Под словом «выборка» подразумевается просто данные, которые ты собираешься исследовать.

Дальше на примерах будет все понятно.

Так вот к основным статистическим характеристикам выборки данных относятся:

  • объем выборки,
  • размах выборки,
  • среднее арифметическое,
  • мода,
  • медиана,
  • частота,
  • относительная частота.

Стоп-стоп-стоп! Сколько новых слов! Давай обо всем по порядку.

Объем и размах выборки

Выборка состоит из элементов \( ,,\ …,\ \), попавших в нее. Количество этих элементов \( \left( n \right)\) называется объемом выборки.

Например, в таблице ниже приведен рост игроков сборной по футболу:

Данная выборка представлена \( \displaystyle 11\) элементами \( \displaystyle \left( =183;\ =194;\ =187;\ …;\ =181 \right)\).

Таким образом, объем выборки \( \displaystyle \left( n \right)\) равен \( \displaystyle 11\).

Разность между максимальным и минимальным значениями элементов выборки называется размахом выборки.

Размах представленной выборки составляет \( -=194-176=18\) см.

Среднее арифметическое выборки

Среднее арифметическое ряда чисел \( \left( \right)\) – это частное от деления суммы этих чисел \( \left( ++…+ \right)\) на их количество \( \left( n \right)\).

Не очень понятно? Давай смотреть на наш пример.

Определите средний рост игроков.

Ну что, приступим? Мы уже разбирались, что \( \displaystyle =183;\ =194;\ =187;\ …;\ =181\); \( \displaystyle n=11\).

Можем сразу смело все подставлять в нашу формулу:

Таким образом, средний рост игрока сборной составляет \( \displaystyle 183,8\) см.

Ну или вот такой пример:

Ученикам 9 класса на неделю было задано решить как можно больше примеров из задачника. Количество примеров, решенных учениками за неделю, приведены ниже:

Найдите среднее количество решенных задач.

Итак, в таблице нам представлены данные по \( \displaystyle 20\) ученикам. Таким образом, \( \displaystyle n=20\). \( \displaystyle =88;\ =90;\ =51;\ …;\ =47.\)

Ну что ж, найдем для начала сумму (общее количество) всех решенных задач двадцатью учениками:

Теперь можем смело приступать к расчету среднего арифметического решенных задач, зная, что \( \displaystyle ++…+=1560\), а \( \displaystyle n=20\):

Таким образом, в среднем ученики 9 класса решили по \( \displaystyle 78\) задач.

Еще один пример:

На рынке помидоры реализуются \( \displaystyle 7\) продавцами, причем цены за \( \displaystyle 1\) кг распределены следующим образом (в руб.): \( \displaystyle 60,\text< >55,\text< >54,\text< >70,\text< >65,\text< >67,\text< >63\).

Какова средняя цена килограмма помидоров на рынке?

Решение.

Итак, чему в данном примере равно \( \displaystyle n\)? Все верно: семь продавцов предлагают семь цен, значит, \( \displaystyle n=7\)! \( \displaystyle =60;\ =55;\ …;\ =63\).

Ну вот, со всеми составляющими разобрались, теперь можем приступить к расчету средней цены:

Ну что, разобрался?

Тогда посчитай самостоятельно среднее арифметическое в следующих выборках:

  • \( \displaystyle 34;\ 46;\ 67;\ 37;\ 45;\text< >60\)
  • \( \displaystyle 5;\ 4;\ 7;\ 9;\ 10;\ 12;\ 17;\ 8\)
  • \( \displaystyle 156;\ 180;\ 164;\ 172\)

Ответы: \( \displaystyle 48,17;\text< >9;\ 168\).

Решил? Можем двигаться дальше.

Мода и медиана

Модой ряда чисел называется число, наиболее часто встречающееся в данном ряду.

Обратимся снова к нашему примеру со сборной по футболу:

Чему в данном примере равна мода? Какое число наиболее часто встречается в этой выборке?

Все верно, это число \( \displaystyle 181\), так как два игрока имеют рост \( \displaystyle 181\) см; рост же остальных игроков не повторяется.

Тут все должно быть ясно и понятно, да и слово знакомое, правда?

Перейдем к медиане, ты ее должен знать из курса геометрии. Но мне не сложно напомнить, что в геометрии медиана (в переводе с латинского- «средняя») — отрезок внутри треугольника, соединяющий вершину треугольника с серединой противоположной стороны.

Ключевое слово – СЕРЕДИНА. Если ты знал это определение, то тебе легко будет запомнить, что такое медиана в статистике.

Медианой ряда чисел с нечетным числом членов называется число, которое окажется посередине, если этот ряд упорядочить (проранжировать, т.е. расположить значения в порядке убывания или возрастания).

Медианой ряда чисел с четным числом членов называется среднее арифметическое двух чисел, записанных посередине, если этот ряд упорядочить.

Ну что, вернемся к нашей выборке футболистов?

Ты заметил в определении медианы важный момент, который нам еще здесь не встречался? Конечно, «если этот ряд упорядочить»!

Для того, чтобы в ряду чисел был порядок, можно расположить значения роста футболистов как в порядке убывания, так и в порядке возрастания. Мне удобней выстроить этот ряд в порядке возрастания (от самого маленького к самому большому).

Вот, что у меня получилось:

Так, ряд упорядочили, какой еще есть важный момент в определении медианы? Правильно, четное и нечетное количество членов в выборке.

Заметил, что для четного и нечетного количества даже определения отличаются? Да, ты прав, не заметить – сложно. А раз так, то нам надо определиться, четное у нас количество игроков в нашей выборке или нечетное?

Все верно – игроков \( \displaystyle 11\), значит, количество нечетное! Теперь можем применять к нашей выборке менее заковыристое определение медианы для нечетного количества членов в выборке.

Ищем число, которое оказалось посередине в нашем упорядоченном ряду:

Ну вот, чисел у нас \( \displaystyle 11\), значит, по краям остается по пять чисел, а рост \( \displaystyle 183\) см будет медианой в нашей выборке.

Не так уж и сложно, правда?

А теперь разберем пример с нашими отчаянными ребятами из 9 класса, которые решали примеры в течение недели:

Готов искать в этом ряду моду и медиану?

Для начала, упорядочим этот ряд чисел (расположим от самого маленького числа к самому большому). Получился вот такой вот ряд:

Теперь можно смело определить моду в данной выборке. Какое число встречается чаще других? Все верно, \( \displaystyle 77\)!

Таким образом, мода в данной выборке равна \( \displaystyle 77\).

Моду нашли, теперь можем приступать к нахождению медианы. Но прежде, ответь мне: каков объем рассматриваемой выборки? Посчитал? Все верно, объем выборки равен \( \displaystyle 20\).

А \( \displaystyle 20\) – это четное число. Таким образом, применяем определение медианы для ряда чисел с четным количеством элементов.

То есть нам надо в нашем упорядоченном ряду найти среднее арифметическое двух чисел, записанных посередине. Какие два числа располагаются посередине?

Все верно, \( \displaystyle 80\) и \( \displaystyle 81\)!

Таким образом, медианой этого ряда будет среднее арифметическое чисел \( \displaystyle 80\) и \( \displaystyle 81\):

\( 80,5\)— медиана рассматриваемой выборки.

Частота и относительная частота

Частота представляет собой число повторений, сколько раз за какой-то период происходило некоторое событие, проявлялось определенное свойство объекта либо наблюдаемый параметр достигал данной величины.

То есть частота определяет то, как часто повторяется та или иная величина в выборке.

Разберемся на нашем примере с футболистами. Перед нами вот такой вот упорядоченный ряд:

Частота – это число повторений какой-либо величины параметра. В нашем случае, это можно считать вот так. Сколько игроков имеет рост \( 176\)?

Все верно, один игрок. Таким образом, частота встречи игрока с ростом \( 176\) в нашей выборке равна \( 1\).

Сколько игроков имеет рост \( 178\)? Да, опять же один игрок. Частота встречи игрока с ростом \( 178\) в нашей выборке равна \( 1\).

Задавая такие вопросы и отвечая на них, можно составить вот такую табличку:

Ну вот, все довольно просто. Помни, что сумма частот должна равняться количеству элементов в выборке (объему выборки).

То есть в нашем примере: \( 1+1+1+2+1+1+1+1+1+1=11\)

Перейдем к следующей характеристике – относительная частота.

Относительная частота – это отношение частоты к общему числу данных в ряду. Как правило, относительная частота выражается в процентах.

Обратимся опять к нашему примеру с футболистами. Частоты для каждого значения мы рассчитали, общее количество данных в ряду мы тоже знаем \( \left( n=11 \right)\) .

Рассчитываем относительную частоту для каждого значения роста и получаем вот такую табличку:

А теперь сам составь таблицы частот и относительных частот для примера с 9-классниками, решающими задачи.

📎📎📎📎📎📎📎📎📎📎