Задача проверки гипотезы в известном смысле напоминает задачу оценки параметров генеральной совокупности по данным выборки: высказывается некоторое утверждение и на основании данных выборки выносится суждение о справедливости этого утверждения.
Статистические гипотезыутверждают что-либо о статистически устойчивыхсобытиях (события, которые могут протекать многократно при идентичных условиях).
1. Генеральная совокупность распределена по нормальному закону;
2. Дисперсии двух нормальных распределений равны;
3. дисперсия признака, распределенного в генеральной совокупности
0< D <2.
Определения.
· Если в гипотезе утверждается что-то о значении какого-то параметра, то гипотеза называется параметрической.
Если гипотеза предполагает что-то, количественно не измеряемое (например, «признак имеет нормальное распределение»), то гипотеза называется непараметрической.
· Основной (нулевой) гипотезой называют выдвинутую гипотезу.
· Альтернативной (конкурирующей) называют гипотезу, которая противоречит выдвинутой.
· Гипотеза называется простой, если ответ на неё однозначен («признак распределения нормальный, дисперсия распределения равна 2»)
Если ответ неоднозначен, гипотеза называется сложной.
§2. Ошибки первого и второго рода.
Выдвинутая гипотеза может быть правильной или неправильной, поэтому её необходимо проверить по эмпирическим данным (по выборки). Поскольку содержимое выборки случайно, то и высказывания, сделанные на основании исследования выборки, случайны, т.е. они могут быть и правильны, и неправильны.
В итоге проверки гипотезы может быть приняты неверные решения в двух случаях, т.е. могут быть допущены ошибки двух типов:
1. Ошибкой первого рода – называют ошибку, допускаемую в случае, когда отвергнута правильная основная гипотеза ( отвергнута, хотя верна);
2. Ошибкой второго рода – называют ошибку, допускаемую в случае принятия неправильной, основной гипотезы ( принята, хотя она не верна);
Результат проверки основной гипотезы
Возможные состояния проверяемой гипотезы.
Верна основная гипотеза
Верна альтернативная гипотеза
Гипотеза отклоняется
Ошибка 1-ого рода
Правильное решение
Гипотеза не отклоняется
Правильное решение
Ошибка 2-ого рода
Замечание
Не отрицательный результат статистической проверки гипотезы не означает, что высказанная нами гипотеза является наилучшей и единственной подходящей, просто она не противоречит имеющимся у нас выборочным данным, однако такими же свойствами могут обладать и другие гипотезы.
Принятие решения о правильности гипотезы или её ложности основано на статистических критериях.
§ 3. Статистический критерий. Критическая область. Область принятия гипотезы. Критические точки.
Для проверки гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно.
Случайная величина Q, служащая для проверки гипотезы называется статистическим критерием или просто критерием. Наблюдаемым значением называют значение критерия, вычисленное по выборке.
После выбора критерия множество всех его возможных значений разбивают на 2 непересекающихся подмножества:
· Одно из них содержит значение критерия, при котором отвергается – оно называется критической областью S.
· Другое содержит значение критерия, при котором гипотеза принимается – оно называется областью принятия гипотезы. (допустимая область ) .
Критическими точками называют точки, определяющие критическую область от области принятия гипотезы, различают;
1. односторонние и двусторонние критические области.
Односторонние делятся на:
· правостороннюю критическую область;
· левостороннюю критическую область;
В частности, если критические точки симметричны относительно нуля, то двусторонняя область определяется по модулю |Q|> .
В общем случае критерий представляет собой многомерную случайную величину, однако, в дальнейшем будем рассматривать простейшие одномерные критерии.
Критическая и допустимая область есть одномерные числовые множества. Вид критической области зависит от вида основной и альтернативной гипотезы.
§ 4. Уровень значимости и мощность критерия.
Определение.
1. Вероятность совершить ошибку первого рода называют уровнем значимостикритерия и обозначают, .
Вероятность ошибки второго рода обозначают .
2. Мощностью критерия называют вероятность попадания критерия в критическую область при условии, что справедлива альтернативная гипотеза , (т. е мощность критерия - это вероятность недопустимости ошибки второго рода.)
Обычно для используют стандартное значение: α = 0,05, α = 0,01.
Как бы ни была мала величина , попадание в критическую область есть только маловероятное, но не абсолютно невозможное событие.
Чем меньше , тем менее вероятно допустить ошибку первого рода. С уменьшением уменьшается критическая область.
При = 0, гипотеза - будет всегда приниматься независимо от результатов выборки. Уменьшение , влечет за собой увеличение вероятности ошибки второго рода.
Одновременное уменьшение ошибок первого и второго рода возможно лишь при увеличении объема выборки.
Обычно при проверке гипотеза задаются определенным уровнем значимости и объемом выборки n. Критерий выбирается так, чтобы мощность критерия была максимальной.
§ 5. Виды критических областей.
Пусть проверяется гипотеза о равенстве некоторого параметра генерального распределения, например генерального среднего , и для проверки гипотезы используется критерий Q, распределения которого имеет вид :
1. Если в качестве альтернативной гипотезы выдвигается , , то критическую область естественно определять , т.е выбрать левостороннюю критическую область .
Задавшись уровнем значимости из уравнения , находим левостороннюю область .
2. При альтернативной гипотезе . Критическая область определяется из уравнения , называется правосторонняя критическая область.
3. Если альтернативная гипотеза формулируется в виде , то строится двусторонняя критическая область.
Критические точки находятся из уравнения .
Чаще всего двустороннюю критическую область строят как симметричную:
.
§6. Методика проверки гипотезы.
Существует множество различных статистических критериев для решения различных статистических задач. Однако можно описать общую схему.
Методика проверки статистических гипотез сводится к следующим этапам:
1 Этап. Формулируется основная проверяемая гипотеза ; одновременно указывается, относительно каких альтернатив должна быть произведена проверка, т.е. формулируется альтернативная гипотеза .
2 Этап. Подбирается статистический критерий – это случайная величина, вычисляемая по результатам выборки.
3 Этап. Формулируется правило проверки, определяется соответствующий объем выборки n по заданным уровню значимости и мощности критерия или из условия минимизации при данных и .
4 Этап. В зависимости от проверяемой гипотезы и её альтернатив выбирается односторонняя или двусторонняя проверка.
Выбор альтернативной гипотезы диктуется существом проверки.
5 Этап. По известному распределению критерия вычисляются критические точки.
6 Этап. Производится выборка и для полученной реализации выборки вычисляется наблюдаемое значение критерия . Если это значение попадает в критическую область, гипотеза признается не соответствующей данным наблюдения и поэтому отклоняется. Если попадает в допустимую область, то гипотеза признается не противоречащей выборочным данным и может быть признана правдоподобной.
Для каждого вида проверяемых гипотез разработаны соответствующие критерии. Чаще всего используется случайные величины, имеющие нормальное распределение, распределение (квадрат Пирсона), распределение Стьюдента, F- распределение Фишера - Снедекора.
Приведенная выше схема исследования предполагает, что закон распределения генеральной совокупности известен и оценке подлежат один или несколько параметров распределения.
Такие гипотезы носят название параметрические.
Наряду с подобными гипотезами приходится проводить статистические проверки и при неизвестном законе распределения генеральной совокупности. Соответствующие гипотезы называются непараметрические.
Непараметрические критерии обладают значительно меньшей мощностью, чем параметрические, т.е. для сохранения той же величины необходимо больше опытных данных.
С другой стороны, непараметрические критерии могут применяться при любом законе распределения генеральной совокупности и применимы как к количественным, так и к качественным признакам.
§ 7. Некоторые типичные задачи проверки параметрических гипотез.
Рассмотрим некоторые наиболее часто встречающиеся задачи, решающиеся с помощью проверки гипотез. Это прежде всего:
· Задачи сравнения (сравнение выборочных характеристик с нормативными характеристиками)
· Сравнение характеристик двух выборок между собой (для проверки гипотезы о принадлежности этих выборок к одной генеральной совокупности).
Типичные непараметрические задачи:
· Проверка гипотез о виде выборочного распределения;
а) Сравнение среднего значения с нормативным значением.
Такие задачи встречаются при проверке качества продукции, характеризуемого некоторым средним показателем:
1. среднее время работы устройства;
2. средний размер детали и т.д.
б) Сравнение средних значений двух совокупностей.
Пусть имеются две совокупности, характеризующиеся средними значениями и , дисперсиями и .
Выдвигается гипотеза, что эти средние равны , т. е
Для проверки основной гипотезы используют критерий
Так как , при справедливости нулевой гипотезы будем иметь .
Используя свойства дисперсии и предполагая выборки независимыми, получим:
Сделав дополнительное предположение, что дисперсии обеих совокупностей равны, т.е. получим:
.
Предположение о равенстве дисперсий нуждается в специальной проверке, о чем речь пойдет в следующем разделе.
Подставляя это выражение в формулу для критерия, получаем:
Если обе выборки достаточного большого объема, то случайная величина и случайная величина имеют нормальное распределение, поэтому нормально будет распределен и критерий .
Заменяя неизвестную дисперсию генеральной совокупности на её несмещенную выборочную оценку .
Придем к нормально распределенному критерию:
Дальнейшая проверка ведется обычным образом с использованием таблиц функций распределения Лапласа.
Если выборки малого объема и применение нормального распределения может привести к ошибкам, для того же критерия Z используют t-распределение Стьюдента с числом степеней свобода .
7.2 Сравнение дисперсий 2-ух совокупностей.
Пусть имеются две нормально распределенные совокупности, дисперсии которых равны ; нулевая гипотеза .
Так как дисперсии генеральных совокупностей неизвестны, проверка гипотезы осуществляется на основе сопоставления выборочных дисперсий и . Если отношение : близко к 1, нет оснований отклонять нулевую гипотезу, если значительно отличается – гипотеза отклоняется. Для решения вопроса, насколько большим должно быть отличие выборочных дисперсий, чтобы отклонение нулевой гипотезы было достаточно обоснованным, используется отношение
; ( )
или
; ( )
Распределение этого отношения, называющееся F–распределением Фишера – Снедекора, зависит от двух параметров – чисел степеней свободы числителя и знаменателя и , гдеи – объемы выборок. Числа и указываются в фигурных скобках рядом с вычисленным значением F:
Критическая область строится в зависимости от вида альтернативной гипотезы:
1. Нулевая гипотеза . Альтернативная гипотеза , если ( ).
По заданному α и известным и по таблице распределения Фишера – Снедекора находим критическое значение . Проверка гипотезы H0сводится к следующему правилу: если отношение выборочных дисперсий , гипотеза H0отклоняется; если , гипотеза H0не отклоняется.
2. Альтернативная гипотеза .
В этом случае строим симметричную двустороннюю критическую область с критическими точками и , определяемыми из неравенств
;
Правая критическая точка находится непосредственно по таблице критических точек распределения Фишера – Снедекора для уровня значимости и степеней свободы и . Левых критических точек таблица не содержит, но, при выбранном симметричном способе построения критической области, достигается попадание критерия F в критическую область с вероятностью, равной уровню значимости .Так как из определения уровня значимости , то выбирая , мы одновременно достигаем и . Проверка гипотезы H0производится по тому же правилу, что и в случае односторонней критической области, но табличные значения критерия ищутся для значения , вдвое меньшего, чем заданный уровень значимости: если отношение выборочных дисперсий , нулевая гипотеза H0 отклоняется, если гипотеза H0 не отклоняется.
§ 8. Непараметрические гипотезы. Критерии согласия Пирсона и Колмогорова.
Ранее рассматривались методы проверки гипотезы относительно отдельных параметров генерального распределения.
Особое место занимают гипотезы относительно согласованности выборочного распределения с теоретическим (генеральным) распределением.
Критерии согласия позволяют ответить на вопрос о том, являются ли различия между выборочным и теоретическим распределением столь незначительным, что они могут быть приписаны влиянию случайных факторов, или нет.
Пусть закон распределения генеральной совокупности неизвестен, но есть основания предполагать, что он имеет определенный вид.
В частности:
1) Если выполняются условия центральной предельной теоремы, есть основание ожидать, что генеральное распределение - нормальное;
2) Если выборочное среднее и выборочная дисперсия равны, то можно предполагать, что генеральная совокупность распределена по закону Пуассона и т.д.
Эти утверждения носят характер гипотез и должны быть подвергнуты статистической проверке.
Для проверки гипотезы : закон распределения имеет данный вид (нормальный, равномерный, показательный), используется специально подобранная случайная величина, которая называется критерием согласия.
Критерий согласия есть критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Имеется несколько критериев согласия:
- (хи-квадрат) Пирсона, критерий Колмогорова, Мизеса - Смирнова и др.
8.1 Критерий Пирсона.
Рассмотрим случай, когда выборка представляется интервальным статистическим рядом. Для изучения случайной величины Х, проведено n- опытов, диапазон наблюдавшихся значений величины Х разбит на q интервалов. Ряд распределения имеет вид:
Интервал
( )
………..
…………
- количество экспериментальных данных в i -м интервале.
В соответствии с предполагаемым теоретическим законом распределения, вычислим вероятности попадания с.в. в соответствующий интервал и рассмотрим величину
,
которая характеризует степень расхождения теоретических и эмпирических данных. Учитывая, что , получим
.
Можно показать, что при n→∞ распределение этой с.в., независимо от того, каков закон распределения генеральной совокупности, стремится к распределению Пирсона с числом степеней свободы , где – число параметров генерального распределения, оцениваемых на основании наблюденных данных. Если проверяется согласие выборочного распределения с распределение Пуассона, единственный параметр которого оценивается по выборочным данным, то , если проверяется согласие с нормальным распределением, для которого по выборочным данным оцениваются два параметра и , то и т.д.
При полном совпадении теоретического и экспериментального распределений , в противном случае .Задавшись уровнем значимости , находим табличное критическое значение , при принимаем гипотезу , при отклоняем гипотезу о виде распределения.
В связи с асимптотическим характером закона Пирсона должны выполняться следующие условия:
1) выборка должна образовываться в результате случайного отбора;
2) объем выборки n должен быть достаточно большим (практически не менее 50 единиц);
3) численность каждой группы должна быть не менее 5 (если это условие не выполняется, производится объединение малочисленных интервалов).