Постановка задачи по оценке точности результатов моделирования. Характеристики точности результатов моделирования Оценка точности результатов аналитического моделирования
12.1. Постановка задачи по оценке точности результатов моделирования.
Под оценкой точности результатов статистического моделирования сложных систем понимается оценка точности характеристик (показателей), определяемых на соответствующих математических моделях. В общем случае модели – сложные операторы преобразования входных величин в выходные.
Входные величины могут быть случайными или константами. Сначала будем рассматривать входные величины как случайные величины и одну выходную величину. Обозначим входные случайные величины через , а выходную величину – через . Тогда величина связана с функциональной зависимостью , так что = ); эта функция реализуется
математической моделью.
Любой показатель качества функционирования сложных систем можно представить в виде математического ожидания определенной функции от входных случайных величин. В этом случае выходная характеристика (показатель) модели представляет собой математическое ожидание от ), где - входные для модели случайные величины с неизвестным распределением . В модели для нахождения оценки показателя вместо вектора ( ) с неизвестным распределением используется вектор ( ) с известным распределением , которое является некоторой оценкой и в силу ограниченного объема экспериментов, в том числе и натурных, несет в себе элемент случайности
Аналитический вид и параметры закона распределения является исходными данными для задачи моделирования и определяются по результатам экспериментов (испытаний), в том числе и натурных. Поэтому точность оценки показателя будет зависеть от объема натурных экспериментов. Кроме того, ошибки расчета будут зависеть от конечного числа испытаний (прогонов) на модели. Наиболее полная характеристика качества оценки - закон ее распределения . Отсюда следует, что для оценки точности результатов статистического моделирования необходимо определить распределение оценки . В некоторых случаях для характеристики этого закона достаточно найти смещение и дисперсию оценки .
12.2. Классификация входных случайных величин
Существуют различные виды влияния случайности на функцию распределения . Для разных видов этого влияния могут быть пригодны различные методы оценки точности. С этой точки зрения входные случайные величины можно классифицировать следующим образом.
Параметрический вид. В данном случае функция распределения имеет известный функциональный (аналитический) вид, за исключением конечного числа неизвестных параметров , т.е. = ). Для этих параметров по результатам экспериментов получены оценки и функция распределения формируется в виде = ), т.е. случайность проявляется в стохастическом характере оценок параметров .
Непараметрический вид. В этом случае функциональный (аналитический) вид неизвестен. По результатам экспериментов получено эмпирическое распределение случайного вектора ( ), которое и используется как распределение в модели. Здесь случайность проявляется в стохастическом характере эмпирических функций распределения, которые являются оценками действительных функций распределения.
Смешанный вид.В этом случае у части входных случайных величин есть функция распределения с известным функциональным видом и неизвестными параметрами, для которых имеются соответствующие оценки, а остальные входные случайные величины задаются в модели своими эмпирическими функциями распределения. Здесь случайность проявляется в стохастическом характере оценок параметров и эмпирических функций распределения.
12.3. Смещение и дисперсия оценки выходного показателя
Ошибки расчета обусловлены конечностью числа реализаций на модели и погрешностями определения закона распределения . Рассмотрим смещение оценки . Случайность (обозначим ее через ), обусловленная конечностью числа реализаций на модели , не влияет на смещение, и, если бы использование распределения не приводило бы к смещению, модель давала бы несмещенную оценку показателя. Но на смещение может оказывать случайность в распределении . Смещение равно
= ) - ),
где - оператор взятия математического ожидания по распределению вектора ( ), - то же самое для распределения, характеризующего случайность .
Определим дисперсию . На будут оказывать влияние обе указанные выше случай ности и . Легко видеть, что они взаимно независимы. Итак, нужно найти = = - . Справедлива следующая теорема.
Теорема 12.1.Принезависимых случайностях и для дисперсии имеет место формула
= + = + . (1)
Доказательство. По определению = - . Далее имеют место следующие преобразования
= - + - = - ) + - + 2 - ) ( - = + +2 -
) ( - . (2)
Рассмотрим более детально выражение - ) ( - . Используя равенства = = принезависимых случайностях и , имеем - ) ( - = ( - - ) = 0, так как - ) = - = 0.
Итак, при независимых случайностях и
= + . (3)
Используя в (2) вместо выражение и проводя аналогичные выкладки, получаем = + . Отсюда приходим к (1) Теорема 9.1 доказана.
Так как случайность не вызывает смещения в , то (3) можно записать в следующем виде
= + . (4)
В (4) первое слагаемое появляется из-за случайности, обусловленной неточностью исходных данных (входной информации), второе - из-за случайности, обусловленной конечностью числа реализаций . Второе слагаемое имеет вид математического ожидания по распределению от дисперсии, обусловленной конечностью числа реализаций на модели.
Обозначим значение функции в - ой реализации модели через . В качестве несмещенной оценки выражения можно использовать формулу
= - ) . (5)
С целью уменьшения потребного объема памяти и числа операций в ЭВМ в данном случае для расчета и целесообразно использовать вместо (5) рекуррентные формулы, имеющие следующий вид:
= +( - ( -1))) ,
( ) = + .
При большом оказывает малое влияние на распределение (в большинстве практических задач 30-50). Следовательно, при большом распределение оценки будет определяться в основном распределением выражения . При достаточно большом количестве испытаний, проводимых для определения неизвестных параметров и функций распределения входных случайных величин, можно приближенно считать распределенным по нормальному закону. Следовательно, смещение и дисперсия будут полностью определять ее распределение.
Оценка точности результатов имитационного моделирования в параметрическом случае.
13.1. Оценка смещения
В этом случае функция распределения входных случайных величин имеет известный функциональный вид, за исключением конечного числа неизвестных параметров , т.е. = ), для которых по результатам испытаний получены несмещенные оценки с ковариационной матрицей = (для неизвестных элементов этой матрицы имеются оценки ) и другими моментами. Здесь смещение будет только за счетнеточности входных параметров. Поэтому можно положить .Для исследования смещения оценки представим в следующем виде = ) ) = .
Тогда смещение оценки равно
= - .
В таком общем виде эту формулу далее трудно конкретизировать. Однако, предполагая, что малы (т.е. по существу должны быть малы , поскольку = и -1 ( - коэффициент корреляции и )) и дифференцируема по , формулу для смещения можно конкретизировать и в результате вычислить смещение. Для большинства реальных сложных систем действительно малы, так как существенные материальные затраты на их создание предъявляют высокие требования к точности и достоверности оценок их характеристик, а следовательно, и к точности исходных данных. Дифференцируемость по для большинства реальных входных случайных величин также имеет место.
Для нахождения используем то обстоятельство, что малы и пропорциональны некоторому малому параметру . Введем обозначения = , = и т.д. Разложим в ряд Тейлора в окрестности точки . После несложных преобразований получаем
= + + 0,5 +
+ + 0,5 + ) +
+ … (1)
Пусть = = , = и т.д. Применяя к (1) оператор взятия математического ожидания и перенося в левую часть равенства, получаем
= 0,5 + + + 0,5 + ) +
+ …
В случае, когда для определения произведено достаточно большое число экспериментов, так что их можно в силу центральной предельной теоремы приближенно считать распределенными по многомерному нормальному закону. Тогда = 0 и смещение имеет вид
= 0,5 + +…
В частном случае, когда оценки независимы, имеем
= 0,5 +…
13.2. Оценка составляющей дисперсии за счет неточности входных параметров
Здесь можно положить . В рассматриваемом случае = и соответственно = . Используя разложение в точке , находя затем и применяя к оператор взятия математического ожидания по распределению вектора , для
получаем следующее выражение
= + 2 + +2 +
+ 2 +…
Далее по формуле = - ( определяем выражение для дисперсии
= + 2 + + 2 +…
В случае, когда можно считать приближенно распределенными по многомерному нормальному закону = 0 и дисперсия имеет вид
= + 2 +…
В частном случае, когда оценки независимы, имеем
= + +…
Для случая, когда независимы и их можно считать приближенно распределенными по нормальному закону дисперсия еще более упрощается, а именно,
= + …
13.3 Оценка частных производных от показателя эффективности сложной системы на ее математической модели
Для определения смещения и дисперсии оценки осталось найти оценки частных производных = , = и т.д. Зафиксируем . Естественная оценка для , имеющая вид
( - ), где для и определены независимые при фиксированных оценки и соответственно, не совсем корректна. Действительно, ее дисперсия при фиксированных равна ( + )/ и при стремится к бесконечности. Используем другой подход. Имеем
= = ) ) где ) есть плотность распределения ). Отсюда = ( ) ) ).
Если область интегрирования и область определения вектора конечны, что в практических задачах всегда выполняется, то можно использовать теорему о возможности дифференцирования под знаком интеграла. Из этой теоремы, легко переносимой на многомерный случай, следует, что если во всей области и области , существует ограниченная частная производная ) и ) для всех ( ) , а также ) ) , то
= ) ) .
В большинстве практических задач эти условия выполняются. Если области и бесконечные, то требуется дополнительное условие сходимости интегралов. Отсюда следует, что
= ) ) ) = ) ). Тогда имеем для состоятельную оценку , имеющую следующий вид
= ), где - - ая реализация вектора на математической модели рассматриваемой сложной системы. Аналогичным образом получаются оценки и других частных производных.
Оценка точности результатов статистического моделирования в непараметрическом случае.
В непараметрическом случае в результате экспериментов для случайной величины получены реализации ,…, . По ним построим эмпирическую функцию распределения , имеющую следующую структуру: вероятность принятия значения равна . Случайная величина имеет функцию распределения . Характер распределения оценки определяется конечностью числа реализаций на модели и случайностью эмпирических функций распределения , используемых в модели. В качестве характеристик точности будем брать смещение и дисперсию . Так как случайность, обусловленная конечностью числа реализаций на модели , не влияет на смещение, то определим зависимость величины смещения от эмпирических функций распределения , . Пусть сначала . Тогда оценка имеет вид = ) = ), где - число реализаций из , при которых принимало значение . В силу того, что = ) = , . Следовательно, при = ( = )
= ) = ,
т.е. - несмещенная оценка для = , так как есть несмещенная оценка теоретической функции распределения .
Можно показать, что это утверждение справедливо и для произвольного числа входных случайных величин ( в общем случае зависимых). Следовательно, Для входных случайных величин, задаваемых в модели эмпирическими функциями распределения, смещение оценки показателя равно нулю. Перейдем к определению . Как было показано ранее, для имеет место формула = + , где и - операции взятия дисперсии и математического ожидания по распределению . Для в качестве оценки можно использовать, как и ранее, выражение
= - ) (5)
и соответствующие рекуррентные формулы, имеющие следующий вид:
= +( - ( -1))) ,
( ) = + .
Рассмотрим возможность определения . При этом можно положить = и пусть - это при = , т.е. = .
1. Случай одной входной величины , для которой построена эмпирических функций распределения по значениям ,…, , полученных в результате экспериментов. Тогда = = ). Для имеем
= .
2. Случай двух входных величин и . По экспериментам получены реализации для , т.е. ,…, , и для , т.е. ,…, . При = оценка имеет следующий вид
= .
Для имеем в этом случае
= + -
( ) ) = +2(( ) +
( ) ),
где - независимые случайные величины с таким же распределением, как и - независимые случайные величины с таким же распределением, как и .
Покажем, что = .
Действительно, имеем
= - .
С другой стороны
= ( - ( )( - =
- ( -
Поскольку последние две формулы совпадают, то требуемое равенство доказано. Оно будет в дальнейшем использовано для практического расчета . В многомерном случае доказываются такие же равенства, которые используются для расчета соответствующих ковариаций.
3. В общем случае входных случайных величин при = имеем
= ,
где для по результатам экспериментов получены реализации ,…, ,
.
Для справедлива следующая формула
= + … ,
,
где суммирование осуществляется по множеству , представляющему собой множество всевозможных - мерных векторов с единицами и нулями.
Замечание 1. При известном функциональном виде распределениявходных случайных величин конструктивная формула для дисперсии оценки выходного показателя имеется лишь при малых дисперсиях оценок входных параметров и представляется в виде бесконечного ряда по степеням этих дисперсий (с определенным радиусом сходимости); если радиус сходимости неизвестен, то этой формулой можно пользоваться как асимптотической.
При эмпирических распределениях входных случайных величин формула для дисперсии оценки выходного показателя получается в замкнутом конечном виде.
Найдем оценки ковариаций, входящих в формулу для дисперсий, по результатам моделирования на математической модели. В качестве примера возьмем , ). Оценку для нее, получаемую на математической модели, обозначим через . Для можно получить следующую формулу
= -
( ,
где - - я реализация , - реализация , - подмножество реализаций вектора , у которых первые -1 компонент равны , из общего числа реализаций,
- количество реализаций в подмножестве , С - множество реализовавшихся в процессе счета различных векторов ( ),
(С) – мощность ( количество элементов) множества С ( при = (С) = ). Оценки других ковариаций, входящих в формулу для определяются аналогичным образом.