I. Точечные оценки параметров генеральной совокупности.

· Несмещенной и состоятельной оценкой математического ожидания генеральной совокупности – генерального среднего являетсявыборочное среднее : .

В случае нормального распределения Х эта оценка является эффективной.

· Несмещенной и состоятельной оценкой генеральной дисперсии S²является исправленная выборочная дисперсия:

II. Интервальные оценки параметров генеральной совокупности.

Точечные оценки могут быть приняты в качестве первоначальных результатов обработки наблюдений. Их недостаток в том, что неизвестна точность, с которой они оценивают параметр. Все точечные оценки параметров распределения генеральной совокупности вычисляется по выборкам, но из-за случайности выборок оценки является случайными величинами, которые могут отличаться от постоянного истинного значения параметра.

Если при большом числе опытов точечная оценка (в силу несмещённости, состоятельности и эффективности) близка к неизвестному параметру, то для выборок небольшого объема вопрос о точности существен.

Пусть - неизвестный параметр распределения и - его оценка.

Величина называется точностью оценки. Зададим малое положительное число и условимся, чтобы . Нельзя наверняка утверждать, что это равенство всегда выполняется, т.к. случайная величина. Можно лишь задать некоторую вероятность (надежность оценки), с которой это неравенство выполняется, т.е. .

Интервал называется доверительным интервалом, покрывающим оцениваемый параметр с вероятностью . Величину выбирают близкой к единице: 0,95; 0,99; 0,999. Событие, состоящее в том, что доверительный интервал , где , , накроет исследуемый параметрм – практически достоверное, а границы симметричны относительно соответствующее точечной оценки.

1) Доверительный интервал для математического ожидания нормально распределенного признака генеральной совокупности: , где выборочное чсреднее, среднее квадратичное отклонение наблюдаемого признака генеральной совокупности, n – объем выборки, величину t находят из условия: значение интегральной функции Лапласа, по этому значению функции из таблиц выбирают t.

Если среднее квадратичное отклонение наблюдаемого признака генеральной совокупности неизвестно, то доверительный интервал: , где , квантиль уровня , значения выбирают из таблиц квантилей распределения Стьюдента.

При n>30 числа t и , найденные по таблицам, практически совпадают.

2) Доверительный интервал для среднего квадратического отклонения нормально распределенного признака генеральной совокупности по исправленному выборочному среднему квадратичному отклонению : , при ;

при ; – выбирают из таблиц.

Замечание. В теории ошибок принято точность измерений (точность прибора) характеризовать с помощью среднего квадратичного отклонения случайных ошибок измерений. Так как обычно результаты измерений взаимно независимы, имеют одно и то же математическое ожидание (истинное значение измеряемой величины) и одинаковую дисперсию (в случае равноточных измерений), то вопрос о нахождении точности прибора с надежностью сводится к нахождению доверительного интервала, покрывающего c заданной надежностью .

3.3. Статистические методы проверки адекватности
математических моделей

Математически задача проверки адекватности модели формулируется как задача проверки предположения о том, что значение отклика модели W_m отличается от реального отклика системы W не более чем на заданную величину e* .

Однако, истинное значение отклика системы никогда неизвестно. Полученный в результате эксперимента отклик в силу неконтролируемого изменения системы, разброса характеристик ее элементов и, наконец, просто ошибок измерения представляет собой случайную величину, отличающуюся от W. Поэтому при сравнении результатов математического и физического экспериментов будет получена совокупность случайных величин {e_i}: , среди которых могут оказаться как величины, удовлетворяющие условию , так и не удовлетворяющие ему.

Можно ли считать, что полученные отклонения (e_I>e*) объясняются случайными причинами или их наличие должно быть признано существенным, что приводит к отказу от проверяемой модели. Для решения этого вопроса на основе выборки случайных величин {e_i} строят статистические критерии, по которым оценивают адекватность модели.

Гипотеза об адекватности модели действительности (гипотеза Н₀) может быть сформулирована как предположение о том, что полученная совокупность {e_i} не дает оснований отказаться от рассматриваемой модели. Иными словами, модель удовлетворяет заданной точности e*.

Альтернативная гипотеза Н₁ состоит в том, что модель не отвечает заданному условию и, следовательно, должна быть отвергнута.

Так как выборка {e_i} случайна, решение о выборе одной из гипотез Н₀ или Н₁ носит вероятностный характер. При этом может быть допущена ошибка первого рода, состоящая в отказе от правильной модели (принимается Н₁ в то время когда верна Н₀), или ошибка второго рода, состоящая в принятии ошибочной модели (принимается Н₀ в то время когда верна Н₁). Вероятность ошибки первого рода называют уровнем значимости и обозначают a, вероятность ошибки второго рода – b. Принято называть a риском разработчика (поставщика), b – риском потребителя. Разумеется, желательно минимизировать как a, так и b. Однако, при заданном объеме экспериментальной выборки уменьшение a влечет за собой увеличение b.

На практике a задается на определенном уровне (a = 0,05; 0,01; 0,005; 0,001), при этом в 100a% случаев правильная модель отвергается.

Величина 1–b характеризует вероятность отказа от ошибочной модели, называется мощностью критерия и является мерой его эффективности.

Выбор вероятностей ошибок a и b при проверке конкретной модели зависит от ответственности решений, принимаемых на основе моделирования.

Например, если модель предназначена для управления двигателем летательного аппарата, необходимо в первую очередь минимизировать b, так как в данном случае принятие неверной модели, а значит, возможность ошибочных решений при управлении представляет больший вред, чем отказ от правильной модели.

Для оценки гипотезы об адекватности модели существует несколько критериев, рассмотрим критерии согласия Пирсона и Смирнова-Колмогорова.

1) Критерий согласия Пирсона.

При использовании критерия проверке подлежит гипотеза о том, что рассматриваемая модель адекватна исследуемой системе с вероятностью р (например, р = 0,95). Это значит, что при n независимых испытаниях np значений e_i должно удовлетворять условию и лишь в (1– р)п случаях это условие может быть нарушено.

В результате случайного эксперимента для этих событий будут получены частоты n₁ и n₂: n₁» рп; n₂» (1– р)п; (n₁+ n₂ = п).

Частоты n₁ и n₂ отличаются от точных вероятностных оценок или из-за несоответствия модели действительности (заданная вероятность р не соблюдается), или из-за случайных отклонений. Для оценки предположения о том, что отклонения n₁ и n₂ от соответствующих вероятностей случайны, строится функция

, представляющая собой сумму квадратов отклонений, нормированных на соответствующие вероятности.

Полученное значение сравнивается с табличным значением при заданном уровне риска a. Если превышает критическое значение ( число степеней свободы, m – число частичных интервалов выборки, r – число параметров предполагаемого распределения), модель должна быть отвергнута, и принимается гипотеза Н₁. Если £ , экспериментальные данные не противоречат гипотезе об адекватности модели, и принимается гипотеза Н₀. Необходимым условием использования критерия является многочисленность экспериментальных данных (не меньше 20).

2) Критерий Смирнова-Колмогорова.

Критерий связывает эмпирическую функцию распределения с функцией распределения непрерывной случайной величины Х. Рассматривается функция , называемая статистикой Колмагорова и представляющая собой максимальное отклонение эмпирической функции распределения от теоретической .

Для выборки строится вспомогательная функция , которая сравнивается с критическим значением l_n_,_a , определенным по таблицам распределения функции Смирнова-Колмогорова. При модель должна быть отвергнута, а при экспериментальные данные не противоречат гипотезе об адекватности модели. Критерий Смирнова-Колмогорова целесообразно использовать при относительно малых выборках, когда критерий оказывается неэффективным.

3.4. Корреляционно-регрессионный анализ как метод выбора оптимальной математической модели

В корреляционно-регрессионном анализе выделены две составляющие части – корреляционный анализ и регрессионный анализ. Корреляционный анализ – это количественный метод определения тесноты и направления взаимосвязи между выборочными переменными величинами. Регрессионный анализ – это количественный метод определения вида математической функции в причинно-следственной зависимости между переменными величинами.

Предположим, что исследуются параметры X и Y наблюдаемого признака генеральной совокупности по данным выборочной модели.

Эти значения являются случайными величинами с соответствующими распределениями. Если зафиксировать некоторое значение случайной величины Х (значение х), то переменная Y , в силу ее стохастической зависимости от Х, может принимать любое значение из некоторого множества значений. Среднее арифметическое этих значений называют условным средним значением параметра y, при условии, что и обозначают . Аналогично определяется условное среднее .

Зависимость условного среднего от значений величины х (или от y) являетсяфункциональнойи называется корреляционной зависимостью.

При статистических исследованиях корреляционных зависимостей одной из главных задач является определение формы корреляционной зависимости, т.е. построение модели связи.

Выделяют ряд характеристик, ориентируясь на которые различают виды корреляционных зависимостей.

1) По форме корреляционные зависимости бывают линейные и нелинейные. Например, зависимость покупаемости товара и количества предъявлений его рекламы представляет собой нелинейную корреляцию (Рис. 15).

Рис. 15

2) По направлению связи различают прямую и обратную корреляции. Припрямом направлении корреляции усилению (увеличению) одного признака (фактора) соответствует усиление (увеличение) другого (отклика) и ослабление (уменьшение) – при обратном. На рисунке 16 изображено корреляционное поле прямой корреляции

Рис. 16

3) По количеству признаков – парная и множественная. Корреляция называется парной, если связаны между собой два каких-либо признака. Если изучается связь одного признака с несколькими (хотя бы с двумя) другими, рассматриваемыми в совокупности, то корреляция называется множественной. Выделяют также частную корреляцию, при которой изучается связь между некоторым отдельным признаком и одним из признаков совокупности при фиксированных значениях остальных признаков этой совокупности.

4) По силе (сила связи не зависит от направления связи) корреляция характеризуется абсолютной величиной коэффициента корреляцииr. При r = 1 наблюдается жесткая положительная связь, то есть при увеличении значений одного признака обязательно увеличение значений другого; при значении r = -1– гарантированное уменьшение; при значении r = 0 – изменение значений одного никоим образом не повлечет за собой изменения другого.

Классификация корреляционных связей по степени силы.

а) общая классификация:

Характеристика силы корреляции	Значение абсолютной величины коэффициента корреляции ( )
Сильная или тесная	более 0,70
Средняя	от 0,50 до 0,69
Умеренная	от 0,30 до 0,49
Слабая	от 0,20 до 0,29
Очень слабая	меньше 0,19

б) частная:

Высокая значимая корреляция	при r, соответствующем уровню статистической значимости
Значимая корреляция	при r, соответствующем уровню статистической значимости
Тенденция достоверной связи	при r, соответствующем уровню статистической значимости
Незначимая корреляция	при r, не достигающем уровня статистической значимости.

Первая из классификаций ориентирована только на величину коэффициента корреляции, а вторая определяет, какого уровня значимости достигает данная величина коэффициента корреляции при данном объеме выборки. Чем больше объем выборки, тем меньшей величины коэффициента корреляции оказывается достаточно для того, чтобы корреляция была признана достоверной. В результате, при малом объеме выборки и сильная корреляция может оказаться недостоверной (что объясняется большой возможностью обнаружения случайных связей). В то же время, при больших объемах выборки даже слабая корреляция между какими либо признаками может оказаться достоверной.

Для аналитических целей корреляционную зависимость представляют при помощи математических функций, т.е. придают ей функциональную форму ( ). Под формой связи понимают тенденцию, которая проявляется в изменении результативного признака в связи с изменением признака-фактора.

Форма корреляционной связи может быть выражена различными математическими функциями. Выбор формы связи решается на основе теоретического анализа изучаемых явлений и исследования эмпирических данных. Линейная форма связи может быть выражена уравнением прямой (Рис. 17):

Рис.17

Нелинейная форма связи может быть выражена уравнениями:

уравнением параболы ;

уравнением гиперболы ;

показательной функцией ;

степенной функцией

и другими функциями.

Главной проблемой при построении модели связи является определение вида аналитической функции, отражающей механизм связи между факторным и результативным признаками и позволяющей дать количественную оценку этой связи.

Уравнение связи ( ) называется модельным уравнением регрессии (или уравнением регрессии),график – линия регрессии, а анализ, производимый с помощью уравнения регрессии, называется регрессионным анализом. Уравнение регрессии является статистической моделью связи между исследуемыми признаками.

Корреляционная зависимость между исследуемыми параметрами Х и Y называется линейной корреляцией, если обе функции регрессии и являются линейными. В этом случае обе линии регрессии являются прямыми, они называется прямыми регрессии.

Эмпирическое исследование формы связи включает построение графиков корреляционных полей, эмпирических линий регрессии, а также анализ параллельных рядов. Изучение эмпирического материала дает возможность установить направление и форму связи.

После установления вида функции для модели связи определяются параметры а и b уравнения регрессии. Параметры уравнения регрессии определяются методом наименьших квадратов. Рассмотрим теоретические основы метода.

Пусть требуется установить зависимость между двумя величинами и , при условии проведения наблюдений. Результаты наблюдений внесены в таблицу:

			…
			…

Предположим, что табличным значениям переменных соответствует эмпирическая функция . Рассмотрим сумму квадратов разностей значений , полученных экспериментально, и значений функции в соответствующих точках:

здесь - квадрат отклонения ординаты функции в точке от экспериментальной ординаты данной точки. Подберем параметры такими, чтобы сумма имела наименьшее значение:

Используя необходимые условия экстремума функции нескольких переменных, получаем следующую систему уравнений для определения неизвестных параметров:

Рассмотрим применение метода наименьших квадратов к нахождению коэффициентов функций.

1) Если эмпирическая функция имеет вид , то функция в этом случае имеет вид .

Эта функция с двумя переменными а и ( и - экспериментальные данные из таблицы). Используя необходимые условия экстремума, перейдем к системе:

После преобразований получим систему двух линейных уравнений с двумя неизвестными, называемую нормальной системой для определения параметров а и :

После решения системы, найденные значения параметров а и подставим в аппроксимирующую функцию .

Пример. В результате некоторого эксперимента получены пары значений переменных X и Y:

X

Y 5.5 8.5 13.6 17.3 20.1

Методом наименьших квадратов найти аппроксимирующую функцию вида .

Очевидно, что точки с данными координатами не могут быть расположены на одной прямой, нужно построить прямую, “сглаживающую” эти точки. В нашем случае n = 5. Нормальная система для определения параметров а и в случае линейной зависимости имеет вид:

Составим вспомогательную таблицу для подсчета коэффициентов системы:

5.5

8,5

13,6 81,6

17,3 133,4

20,1

∑= 30

Таким образом, , =220, , . Подставляя эти значения в нормальную систему, получим:

а = 1,9; =1,6.

Искомая зависимость между переменными х и у выражается формулой .

2) Пусть аппроксимирующая функция является квадратичной и имеет вид

Функция в данном случае имеет вид

и принимает минимальное значение при тех значениях и с, при которых обращаются в нуль частные производные этой функции по каждой переменной: .

Находя указанные частные производные, после упрощений получим следующую нормальную систему для нахождения параметров и с:

3) Пусть экспериментальным значениям соответствует показательная функция . Логарифмируя левую и правую части равенства, получим . Введем подстановку , .

Полученная функция является линейной.

Выразим а, b: .

Принцип наименьших квадратов позволяет найти наилучшую модель идентификации для исследуемой экспериментальной выборки с заданным уравнением регрессии.

Определен ряд требований, обеспечивающих корректность применения регрессионного анализа для построения стохастических моделей [11].

1. Независимость наблюдений.

Результаты отдельных измерений – независимые случайные величины. Это означает, что отклонения от закономерностей, полученные в одних опытах, не оказывают влияния на подобные отклонения в других.

2. Одинаковая распределенность случайной ошибки наблюдений .

Значение отклика y можно мысленно разделить на две составляющие:

, где является функцией факторов, случайная, по отношению к ним, величина с нулевым математическим ожиданием.

Если понимать как ошибку измерения отклика, то измерения отклика имеют равную точность при всех значениях факторов. Если понимать как внутренне присущую отклику изменчивость, то эта изменчивость не испытывает влияния со стороны факторов. имеет неизменную статистическую природу во всех опытах.

3. Предположение о форме регрессионной зависимости.

Для достаточно полного описания особенностей корреляционной зависимости между величинами недостаточно определить форму этой зависимости. Например, одинаковыми по форме являются корреляционные зависимости возраста учеников средней школы от года их обучения в школе и возраст студентов высшего учебного заведения от года обучения. Но зависимость возраста учеников средней школы от года их обучения в школе является более тесной, чем аналогичная зависимость возраста студентов высшего учебного заведения от года обучения, поскольку среди студентов одного и того же года обучения в вузе обычно наблюдается больший разброс в возрасте, чем у школьников, обучающихся в одном классе. Показателем связи между исследуемыми величинами (факторами о откликами) является коэффициент корреляции.

3.5. Коэффициент корреляции

Коэффициент корреляции является общепринятой в математической статистике мерой, характеризующей связи между двумя случайными величинами.

Выбор метода вычисления коэффициента корреляции зависит от вида шкалы, к которой относятся переменные. Используются следующие шкалы: интервальная, шкала отношений, ранговая и шкала наименований.

По интервальной шкале числа не только упорядочены и разделены определенными интервалами. Особенность ее состоит в том, что нулевая точка выбирается произвольно. Примерами интервальной шкалы могут быть календарное время (начало летоисчисления в разных календарях устанавливалось по случайным причинам), температура, потенциальная энергия поднятого груза, потенциал электрического поля и др. Измерив параметр в интервальной шкале, мы можем сказать, что его значение на определенное количество единиц больше или меньше значения другого параметра.

Шкала отношений отличается от шкалы интервалов только тем, что в ней строго определено положение нулевой точки. Благодаря этому шкала отношений не накладывает никаких ограничений на математический аппарат, используемый для обработки результатов наблюдений. При использовании шкалы отношений измерение какой-либо величины сводится к экспериментальному определению отношения этой величины к другой подобной, принятой за единицу. Измеряя длину объекта, мы узнаем, во сколько раз эта длина больше длины другого тела, принятого за единицу длины (метровой линейки в данном случае) и т.п. С помощью таких шкал могут быть измерены масса, длина, сила, стоимость (цена), т.е. всё, что имеет гипотетический абсолютный ноль. В отличие от шкалы интервалов эта шкала может отражать то, во сколько один показатель больше другого.

Ранговая шкала – отображение отношений порядка. Единственно возможные отношения между объектами измерения в данной шкале – это больше / меньше, лучше / хуже. Самой типичной переменной этой шкалы является место, занятое спортсменом на соревнованиях. Известно, что победители соревнований получают первое, второе и третье место и мы точно знаем, что спортсмен с первым местом имеет лучшие результаты, чем спортсмен со вторым местом. Кроме места, имеем возможность узнать и конкретные результаты спортсмена. Проведя измерение по ранговой шкале нельзя узнать, на сколько единиц отличаются объекты, тем более во сколько раз они отличаются.

Шкала наименований – простейшая из шкал измерения. Числа (равно как буквы, слова или любые символы) используются для различения объектов. Отображает те отношения, посредством которых объекты группируются в отдельные непересекающиеся классы. Номер (буква, название) класса не отражает его количественного содержания. Примером шкалы такого рода может служить классификация испытуемых на мужчин и женщин, нумерация игроков спортивных команд, номера телефонов, паспортов, штрих-коды товаров. Особым подвидом шкалы наименований является дихотомическая шкала, которая кодируется двумя взаимоисключающими значениями (например, 1/0). Пол человека является типичной дихотомической переменной.

По шкале наименований нельзя сказать, что один объект больше или меньше другого, на сколько единиц они различаются и во сколько раз. Возможна лишь операция классификации – отличается / не отличается.

В зависимости от вида шкалы, по которой измеряются исследуемые величины, осуществляется выбор метода вычисления коэффициента корреляции (таблица 2).

Таблица 2. Выбор метода вычисления коэффициента корреляции

в зависимости от вида шкалы

Вид шкалы Мера связи

Параметр Х Параметр Y

интервальная или отношений интервальная или отношений коэффициент корреляции Пирсона

ранговая, интервальная или отношений ранговая, интервальная или отношений коэффициент корреляции Спирмена

ранговая ранговая коэффициент корреляции Кендалла

дихотомическая дихотомическая коэффициент четырехполевой корреляции

дихотомическая ранговая рангово-бисериальный коэффициент

дихотомическая интервальная или отношений бисериальный коэффициент

интервальная ранговая не разработан

Для переменных с интервальной и с номинальной шкалой используется коэффициент корреляции Пирсона (корреляция моментов произведений). Если, по меньшей мере, одна из двух переменных имеет порядковую шкалу либо не является нормально распределённой, то используется ранговая корреляция по Спирмену или τ (тау-грого-соая) Кендала. Если же одна из двух переменных является дихотомической, то можно использовать точечную двухрядную корреляцию. В том случае если обе переменные являются дихотомическими, используется четырёхполевая корреляция. Расчёт коэффициента корреляции между двумя недихотомическими переменными возможен только тогда, кода связь между ними линейна (однонаправлена).

Коэффициент корреляции обладает следующими основными свойствами:

1. Коэффициент корреляции – безразмерная величина.

2. Коэффициенты корреляции способны характеризовать только линейные связи, т.е. такие, которые выражаются уравнением линейной функции. При наличии нелинейной зависимости между варьирующими признаками следует использовать другие показатели связи.

3. Значения коэффициентов корреляции – это отвлеченные числа, лежащее в пределах от -1 до +1,т.е. принадлежащие промежутку [-1;1] .

4. При независимом варьировании признаков, когда связь между ними отсутствует, коэффициент корреляции равен 0.

5. При положительной, или прямой, связи, когда с увеличением значений одного признака возрастают значения другого, коэффициент корреляции положителен и находится в пределах от 0 до +1.

6. При отрицательной, или обратной, связи, когда с увеличением значений одного признака соответственно уменьшаются значения другого, коэффициент корреляции отрицателен и находится в пределах от -1 до 0.

7. Чем сильнее связь между признаками, тем ближе величина коэффициента корреляции к 1. Если коэффициент корреляции равен , то корреляционная связь переходит в функциональную, т.е. каждому значению признака Х будет соответствовать одно или несколько строго определенных значений признака Y.

8. Только по величине коэффициентов корреляции нельзя судить о достоверности корреляционной связи между признаками. Этот параметр зависит от числа степеней свободы k = n –2, где: n – число коррелируемых пар признаков Х и Y. Чем больше n, тем выше достоверность связи при одном и том же значении коэффициента корреляции.

Коэффициент корреляции Пирсона

Для вычисления коэффициента корреляции Пирсона достаточно только принять предположение о линейности связи между случайными величинами, и вычисленный коэффициент корреляции будет мерой этой линейной связи.

Коэффициент корреляции Пирсона (r или r_XY) относится к параметрическим коэффициентам и вычисляется по формуле:

, где выборочные средние значения исследуемых параметров модели.

Вычислив значение r (в случае r), необходимо определить достоверность найденного коэффициента корреляции. Обычно выдвигается основная (нулевая) гипотеза об отсутствии линейной корреляционной связи между переменными . Для проверки гипотезы выполняют следующие шаги:

1) Вычисляют наблюдаемое значение критерия , имеющее распределение Стьюдента с k=n –2 степенями свободы.

2) При заданном уровне значимости по таблице значений t-критерия Стьюдента определяют .

3) Сравнивают и . Если , то основная гипотеза отвергается. Это означает, что выборочный коэффициент корреляции значительно отличается от 0 и выявленная линейная корреляционная зависимость не является следствием случайного попадания значений наблюдаемого признака в выборку.

Коэффициент ранговой корреляции Спирмена

Рассмотрим выборку, объекты которой обладают двумя качественными признаками (т.е. признаками, которые невозможно точно измерить, но возможно сравнить между собой, располагая их в порядке убывания или возрастания качеств). Мерой связи таких признаков служит коэффициент ранговой корреляции Спирмена.

Объекты выборки сначала ранжируются в порядке в порядке ухудшения качества по признаку А при допущении, что все объекты имеют различное качество по обоим признакам. Объектам, расположенным на определенных местах, приписывают равные их порядковому номеру ранги. Т.е. объект, расположенный на первом месте, имеет ранг, равный 1 ( ), объект, расположенный на втором месте, имеет ранг, равный 2 ( ), таким образом, .

Далее объекты ранжируют в порядке убывания качеств по признаку В и каждому их них приписывают ранг , где индекс, равный порядковому номеру объекта по признаку А. Например, запись означает, что по признаку А объект стоит на третьем месте, а по признаку В – на четвертом.

В итоге получают две последовательности рангов:

по признаку А:

по признаку В: .

Введем обозначения: , , .

Коэффициент ранговой корреляции Спирмена вычисляют по формуле:

Он является непараметрическим аналогом коэффициента корреляции Пирсона, но при его расчете учитываются не связанные с распределением показатели сравниваемых переменных (среднее арифметическое и дисперсия), а ранги.

Значимость ранговой корреляции для выборок объема позволяет установить правило: для проверки гипотезы о равенстве нулю генерального коэффициента ранговой корреляции на уровне значимости , при альтернативной гипотезе , необходимо вычислить критическую точку: , где критическая точка двусторонней критической области, которую определяют по таблице критических точек распределения Стьюдента по заданному уровню значимости и числу степеней свободы . Если , то нет оснований отвергнуть ; если , то отвергают, т.е. между качественными признаками существует значимая ранговая корреляционная связь.

Контрольные вопросы

1. Что представляют собой величины, входящие в стохастическую модель?

2. Какие трудности возникают при изучении стохастических моделей?

3. Какие законы распределения случайной величины Вы знаете?

4. Как выглядит плотность распределения для нормального закона?

5. От чего зависит погрешность стохастического моделирования?

6. Сформулируйте задачу проверки адекватности модели.

7. Что означает понятие адекватности математической модели?

8. В чем заключаются ошибки первого и второго рода? Приведите примеры.

9. Какие критерии проверки адекватности математической модели Вы знаете?

Задания

1. Представлены результаты наблюдений случайной величины Х. Разделив интервал значений Х на десять равных частей, построить группировку, гистограмму, эмпирическую функцию распределения, найти оценки математического ожидания и дисперсии исследуемой случайной величины. На основе этих построений выдвинуть гипотезу о законе распределения Х и на графике гистограммы изобразить выравнивающую кривую. На уровне значимости по критерию Колмогорова установить согласие или несогласие выдвинутой гипотезы с результатами наблюдений.

0,5; 2,9; 0,7; 11,7; 0,8; 3,3; 21,8; 9,6; 5,8; 0,8; 13,7; 14,8; 9,5; 10,3; 4,6; 4,7; 15,6; 0,3; 6,0; 0,3; 5,1; 19,2; 9,5; 8,5; 14,7; 4,9; 16,8; 23,8; 0,5; 0,4; 6,5; 1,3; 7,1; 6,5; 9,3; 20,7; 3,3; 6,4; 1,7; 5,5; 2,5; 2,4; 3,3; 8,9; 3,2; 6,9; 6,1; 3,8; 0,6; 8,6; 1,1; 8,6; 7,2; 5,2; 0,4; 2,5; 3,9; 23,1; 1,5; 3,5.

2. Имеется статистическая ранжированная выборка. Построить статистический интервальный ряд, найти точечные и интервальные оценки математического ожидания, дисперсии и среднего квадратического отклонения; с помощью критерия согласия проверить гипотезу о нормальном распределении с параметрами, совпадающими с точечными оценками .

-13,38; -13,26; -13,02; -12,29; -11,57; -10,28; -10,14; -9,72; -9,66; -9,35;

-9,07; -8,77; -8,67; -8,53; -8,52; -8,05; -7,83; -7,45; -7,39; -7,38;

-7,37; -7,34; -6,93; -6,87; -6,78; -6,64; -6,64; -6,52; -6,27; -6,06;

-6,01; -5,75; -5,75; -5,73; -5,73; -5,67; -5,35; -5,16; -5,10; -4,96;

-4,84; -4,82; -4,76; -4,64; -4,63; -4,55; -4,43; -4,30; -3,66; -3,56;

-3,35; -3,34; -3,20; -3,14; -3,08; -3,06; -2,78; -2,64; -2,61; -2,42;

3. По двум независимым выборкам, объем которых соответственно равен 10 и 18, извлеченным из нормальных генеральных совокупностей Х и У, определены оценочные дисперсии = 1,23, = 0,41. При уровне значимости проверить нулевую гипотезу о равенстве дисперсий этих случайных величин.

4. Методом наименьших квадратов установить линейную зависимость между стажем работы (X, лет) и выработкой одного рабочего за смену (Y, ед.)

Стаж работы (лет)

Выработка одного рабочего за смену (ед.)

5. Данные опыта химической лаборатории представлены следующей таблицей значений переменных и :

1,5 2,5

2,2 3,1 2,4 1,3

Представить связь между переменными и в виде квадратичной функции , пользуясь для определения коэффициентов , и способом наименьших квадратов.