б) вычисляется выборочная дисперсия ( ) и среднеквадратическое отклонение (Sx).
(2)
Вначале оценивается принадлежность крайних элементов выборки Xmin, Xmax к данной нормальной совокупности.
Для этого составляются статистики (Umax, Umin)
(3)
подчиняющиеся b- закону распределения, который зависит только от объема выборки (n). Значения квантилей распределения находятся по таблице Б.1 (Приложение Б). Полученные значения Umax и Umin сравнивают с величиной , взятой из таблицы для данного объема выборки и принятого уровня значимости (= 0.05),
если U minmaxb (4)
то результат Xmin или Xmax анормален и из выборки исключается. Все параметры выборки после этого нужно пересчитать. В противном случае результаты считают однородным и из выборки не исключают.
3.2 Сравнение двух или нескольких дисперсий
При обработке результатов измерений характеристик технологического процесса часто возникает необходимость сравнить две или несколько дисперсий. Цель сравнения - выявить, можно ли считать сравниваемые выборочные дисперсии оценками одной и той же генеральной дисперсии, то есть, являются ли сравниваемые дисперсии однородными.
3.2.1 Сравнение двух дисперсий
Рассмотрим две выборки:
X1,X2,X3,.....Xn; Y1,Y2,Y3,...Yk;
а) вычисляем математическое ожидание каждой выборки по формулам:
б) вычисляем выборочные дисперсии:
;
;
где n- объем выборки X;
к- объем выборки Y.
в) вычисляем степени свободы выборок (fn, fk)
fn = n -1 ; fk = k - 1; (5)
Проверка однородности двух дисперсий производится по критерию Фишера (F - распределение). F - распределение зависит от числа степеней свободы выборок fx , fk и уровня значимости a.
Вычисляем расчетный критерий Фишера (F) по формуле
(6)
при условии, что , в противном случае .
Затем по таблице Б.2 выбираем критерий Фишера. Дисперсии однородны (являются оценкой одной генеральной дисперсии) если Fрасч.<Fтабл . В противном случае дисперсии неоднородны, следует более внимательно проверить анормальность результатов и проверить однородность дисперсий заново.
3.2.2 Сравнение нескольких дисперсий
Сравнение нескольких дисперсий проводят по критерию Кохрена или Бартлета. Если выборочные дисперсии получены по выборкам одинаковых объемов, то есть с равными степенями свободы, то для их сравнения используют критерий Кохрена (G):
(7)
где -выборочная дисперсия каждой выборки,
-максимальная выборочная дисперсия,
n - количество суммируемых дисперсий.
Затем по таблице Б.3 “Квантили распределения Кохрена” находят табличный критерий Кохрена (G табл.), который зависит от количества степеней свободы (f), при оценке каждой из (f = n -1), от количества дисперсий (n) и от уровня значимости a .
Если G расч. окажется меньше G табл. дисперсии однородны, то есть являются оценкой одной генеральной дисперсии. В противном случае дисперсии неоднородны и следует проверить анормальность результатов измерений в каждой выборке, в первую очередь в выборке, по результатам которой вычислена , a затем повторить все расчеты заново.
Если выборочные дисперсии получены по выборкам разного объема, то есть с разными степенями свободы, то проверка их однородности проводится по критерию Бартлета. Но расчет этого критерия несколько трудоемок. В этом случае можно пользоваться сравнением по критерию Фишера. Этот метод менее точен, но предельно прост.
Для расчета критерия Фишера в данном случае можно взять наибольшую и наименьшую из сравниваемых дисперсий. При этом . Fтабл. находится по таблице Б.2 “Квантили распределения Фишера” аналогично, описанному в разделе 3.2.1.
Если , дисперсии однородны.
3.3 Сравнение двух средних
Задача сравнения средних значений выборок (выборочных математических ожиданий) - также одна из самых распространенных. Цель сравнения - выявить, можно ли считать сравниваемые средние значения выборок (математических ожиданий) оценками одного и того же генерального математического ожидания, то есть являются ли сравниваемые средние однородными. Однородность сравниваемых средних говорит о том, что эти выборки принадлежат к одной генеральной совокупности. Необходимо заметить следующее: если сравниваемые выборки имеют неоднородные дисперсии, то процедура сравнения резко усложняется. В этом случае можно рекомендовать специальные методы, которые в данном курсе не рассматриваются. Рассматриваемый здесь метод предполагает, что дисперсии однородны, то есть .
Предварительно рассчитываем среднюю дисперсию по формуле:
(8)
где - выборочные дисперсии первой и второй выборок;
,степени свободы сравниваемых выборок.
Для сравнения двух средних арифметических используют критерий Стьюдента (t - критерий). Расчетное значение критерия Стьюдента вычисляют по следующей формуле:
(9)
где X1,Х2 - средние арифметические (математические ожидания) сравниваемых выборок;
n 1,n2 -объем сравниваемых выборок.
Табличный критерий Стьюдента находится по таблице Б.4“Квантили распределения Стьюдента”, который зависит от числа степеней свободы выборок (f) и уровня значимости (a). Число степеней свободы выборок , при этом следует учесть, что ; . Если , то и есть оценки одного генерального математического ожидания, а выборки относятся к одной генеральной совокупности.
При сравнении нескольких средних можно также использовать критерий Стьюдента, проводя сравнения попарно. Однако, для использования при сравнении полной информации о всех средних такое сравнение проводят при помощи множественного рангового критерия Дункана. В данном курсе этот метод не рассматривается.
4 ПРИМЕР ВЫПОЛНЕНИЯ ЛАБОРАТОРНОЙ РАБОТЫ
Метод проверки статистических гипотез можно использовать для сравнения эффективности двух технологических процессов. Рассмотрим это на следующем примере:
Условие задачи. Очистку химического вещества от примесей железа проводили двумя различными способами. Необходимо определить какой способ очистки эффективнее. Результаты опытов (по 7 опытов по каждому способу) приведены в таблице 2.
Таблица 2 Результаты опытов по первому и второму способам
№
содержание Fe,%
опыта
1 способ
2 способ
Х1
Х2
0.050
0.039
0.047
0.032
0.045
0.051
0.057
0.045
0.050
0.041
0.040
0.034
0.100
0.038
; ;
; ;
Расчет проводится в следующей последовательности:
1 Проверка анормальности результатов
а) вычисляем по формулам (1), (2) математическое ожидание и дисперсии выборок Х1 и Х2;
б) Вычисляем статистики по формулам (3) для выборок X1 и X2 :
для выборки получаем:
;
для выборки получаем:
;
По таблице Б.1 находим квантиль распределения b при объеме выборки равном 7 и уровне значимости a = 0,05
b;
Сравнение с вычисленными статистиками показывает, что максимальный элемент выборки анормален, так как 2.2>1.94, а остальные результаты однородны.
Анормальный результат исключаем из выборки. В выборке осталось 6 опытов. Далее необходимо проверить в оставшейся выборке максимальный элемент на анормальность. Для этого следует пересчитать математическое ожидание и дисперсию оставшейся выборки
;
вычисляем Umax=(0.053- 0.0475)/= 1.22
bтабл.=1,82 при n=6, a=0,05;
Umax=1,22<b=1,82
следовательно, результаты однородны.
2 Проверка однородности двух дисперсий
а) вычисляем расчетный критерий Фишера по формуле (6)
Fрасч.==1,99
Fтабл.= 5.0 при числе степеней свободы числителя (выборка X2) f2=n-1=7-1=6, a знаменателя (выборка X1 ) f1=(n -1) = 6 -1 =5, уровене значимости a =0.05
Fрасч.<Fтабл.; 1,99 < 5.0
Следовательно, дисперсии однородны и можно продолжать расчеты дальше.
3 Сравнение двух средних
Поскольку дисперсии однородны, можно вычислить среднюю дисперсию двух выборок по формуле (8)
S2==3.25*10-5
Рассчитываем критерий Стьюдента по формуле (9)
tрасч.=*=2.36
t табл. = 2.2 при числе степеней свободы f = f1+ f2=5 + 6 = 11 и уровне значимости a=0.05
tрасч.= 2.36 > tтабл.= 2.2
Следовательно, X1 и X2 не являются оценкой одного генерального
математического ожидания и выборки X1 и X2 не относятся к одной генеральной совокупности.
Вывод: с вероятностью допустить ошибку, равной 5%, можно утверждать, что способы очистки химического вещества от примесей дают продукт разной чистоты, то есть имеют разную эффективность. Первый способ менее эффективен, чем второй, так как X1 > X2 , т. е. по первому способу примесей железа остается больше, чем по второму.
5. ВОПРСЫ ДЛЯ ПОГОТОВКИ К ЗАЩИТЕ ЛАБОРАТОРНОЙ РАБОТЫ
1 Дать определение понятия модели, математической модели.
2 Перечислить основные требования, предъявляемые к моделированию.