Основные статистики и t-критерий Стьюдента

Основные статистики и t-критерий Стьюдента

В ходе рассмотрения примера мы будем использовать вымышленные сведения, чтобы читатель мог провести необходимые преобразования самостоятельно.

Так, допустим, в ходе исследований изучали влияние препарата А на содержание вещества В (в ммоль/г) в ткани С и концентрацию вещества D в крови (в ммоль/л) у пациентов, разделенных по какому-то признаку Е на 3 группы равного объема (n = 10). Результаты такого выдуманного исследования приведены в таблице:

Вещество D, ммоль/л

исходное содержание в крови

Хотим вас предупредить, что выборки объема 10 рассматриваются нами для простоты представления данных и вычислений, на практике такого объема выборок обычно оказывается недостаточно для формирования статистического заключения.

В качестве примера рассмотрим данные 1-го столбца таблицы.

Описательные статистики Выборочное среднее

Среднее арифметическое, которое очень часто называют просто «среднее», получают путем сложения всех значений и деления этой суммы на число значений в наборе. Это можно показать с помощью алгебраической формулы. Набор n наблюдений переменной x можно изобразить как x1, x2, х3, . xn

Формула для определения среднего арифметического наблюдений (произносится «икс с чертой»):

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

Выборочная дисперсия

Один из способов измерения рассеяния данных за­ключается в том, чтобы определить степень отклоне­ния каждого наблюдения от средней арифметической. Очевидно, что чем больше отклонение, тем больше изменчивость, вариабельность наблюдений. Однако мы не можем использовать среднее этих отклонений как меру рассеяния, потому что положительные от­клонения компенсируют отрицательные отклонения (их сумма равна нулю). Чтобы решить эту проблему, мы возводим в квадрат каждое отклонение и находим среднее возведенных в квадрат отклонений; эта величина называется вариацией, или дисперсией. Возьмем n наблюдений x1, x2, х3, . xn , средняя которых равняется . В ычисляем диспер сию, обычно обозначаемую как s 2 , этих наблюдений:

Выборочная дисперсия данного показателя равна s 2 = 3,2.

Среднеквадратичное отклонение

Стандартное (среднеквадратичное) отклоне­ние — это положительный квадратный корень из дисперсии. На примере n наблюдений это выглядит следующим образом:

Мы можем представить себе стандартное отклоне­ние как своего рода среднее отклонение наблюдений от среднего. Оно вычисляется в тех же единицах (размерностях), что и исходные данные.

s = sqrt ( s 2 ) = sqrt (3,2) = 1,79 [sqrt (x) - функция извлечения квадратного корня из х].

Коэффициент вариации

Если разделить стандартное отклонение на сред­нее арифметическое и выразить результат в процен­тах, то получится коэффициент вариации.

CV = (1,79 / 13,1) * 100% = 13,7

Ошибка выборочного среднего

1,79 / sqrt (10) = 0,57 [sqrt (x)- функция извлечения квадратного корня из х];

Коэффициент Стьюдента t (одновыборочный t-критерий)

Применяется для проверки гипотезы об отличии среднего значения от некоторого известного значения m

Количество степеней свободы рассчитывается как f=n-1.

В данном случае доверительный интервал для среднего заключен между границами 11,87 и 14,39.

Для уровня доверительной вероятности 95% m=11,87 или m=14,39, то есть = |13,1-11,82| = |13,1-14,38| = 1,28

Соответственно, в данном случае для числа степеней свободы f = 10 - 1 = 9 и уровня доверительной вероятности 95% t=2,26.

Диалог Основные статистики и таблицы

В модуле Основные статистики и таблицы выберем Описательные статистики.

Откроется диалоговое окно Описательные статистики.

В поле Перменные выберем Группу 1.

Нажав на Ок, получим таблицы результатов с описательными статистиками выбранных переменных.

Чтобы посчитать t-критерий Стьюдента, в модуле Основные статистики и таблицы выберем Одновыборочный t-критерий.

Откроется диалоговое окно Одновыборочный t-критерий.

Предположим, нам известно, что среднее содержание вещества B в ткани С равно 11.

Таблица результатов с описательными статистиками и t-критерием Стьюдента выглядит следующим образом:

Нам пришлось отвергнуть гипотезу о том, что среднее содержание вещества В в ткани С равно 11.

Так как вычисленное значение критерия больше табличного (2,26), нулевая гипотеза отвергается на выбранном уровне значимости, и различия между выборкой и известной величиной признаются статистически значимыми. Таким образом, вывод о существовании различий, сделанный с помощью критерия Cтьюдента, подтверждается с помощью данного метода.

Выводы

Статистики и процедуры, включенные в одноименный модуль, условно называются основными статистиками и рассматриваются в одной группе, т.к. обычно они используются совместно, особенно на начальной, разведочной стадии анализа данных. Эти статистики являются базовыми и полезны для самых разнообразных исследований. Вычисление описательных статистик является неотъемлемой частью любого статистического анализа.

📎📎📎📎📎📎📎📎📎📎