Цепь Маркова - это модель системы, которая переходит случайным образом из одного состояния в другое.
Формальное определение. Конечная цепь Mapкова (Finite Markov Chain - FMC) - это набор элементов:
FMC = {Θ,S,P,X,XQ}. (3.1)Рассмотрим элементы определения (3.1).
1. Θ - множество моментов времени. Мы будем рассматривать как множество дискретных моментов времени Θ-{to,t,,...,tk,...}, так и непрерывное время, Θ= R, где Rмножество рациональных чисел.
2.S - {S,,...,Sn} - конечное множество состояний. В каждый момент времени tkсистема может находиться только в одном из состояний St. Этот факт мы будем обозначать так S(tk)= Slt tke Θt St.eS
3.P(tk) = ׀ pi (tk)| - матрица переходных вероятностей. •
Состояния в системе изменяются со временем случайным образом. Каждый элемент матрицы PlJ\tk) показывает вероятность того, что если FMC в момент tkнаходилось в состоянии St, то в момент tk+1она окажется в состоянии Sj
pij(tk)=Pr{S(tk+1) = Sj|S(tk) = Si}. (3.2) При этом основное свойство марковских процессов состоит в том, что вероятности перехода из Si в Sj не зависят от предыдущих состояний системы.
Понятно, что переходы во все возможные состояния (в том числе в себя) образуют полную группу событий, поэтому
∑Plj(tk) = l для всех i = ],..,n, tk e Θ.
4. X = X{tk)=[xs(tk)..,xN(tk)] - вектор-строка распределения вероятностей нахождения FMC в соответствующих состояниях в момент tk, то есть х, (tk) - это внроятность того, что в момент tkсистема находится в
состоянии S/ При этом ∑ xi (tk) = 1, tk € Θ
По теореме об умножении вероятностей и с учетом освоенного свойства марковского процесса получим:
xj (tk+1) = ∑pk (tk) xi (tk), i= 1,…n. (3.3)
где pij (tk) выступают в роли условных вероятностей перехода в состояние Sj при условии, что система находится в состоянии Si.
Нетрудно видеть, что правая часть формулы определяет произведение вектора-строки X(tk) на матрицу P{tk) и в векторной форме эквивалентна следующей записи динамического процесса:
X{tk+l) = X{tk)-P{tk). (3.4)
5. X0=X{t0) = [x1(t0\x2{f0\..j:n{f0^ - распределение вероятностей нахождения FMC в начальный момент времени t=t0. Задание вектора X(t0) позволяет последовательно вычислять векторы X(tk), к = 1,2,...
Последовательность состояний S(to),S(tj),...,S(tk) называется конечной цепью Маркова.
Цепь называется однородной, если рjне зависит от времени. В этом случае Р - числовая матрица. Если вектор X(tk) задан, то для однородной цепи Маркова из рекуррентной формулы (3.4) следует цепочка выражений:
X(t1)= X(to)-P,
X(t2)=x(tl)-P = X(t0).P2
…
X (tk) = X(tо)Pк(3-5)
где Pk- k-я степень матрицы Р.
Цепь Маркова можно представить как динамическую систему - вероятностный автомат с обратной связью (рис. 3.1). На рисунке прямоугольник 1 означает задержку сигналов состояния на 1 такт._____________
Матрицы Р, порождающие цепи Маркова, т.е. такие у которых все элементы 0 < ptj ≤ 1, а их суммы по столбцам равны единице для всех строк
n
∑ pij=1, i=1,...,n,
j=1
называют стохастическими. Свойства этих матриц хорош! изучены [14], и мы в дальнейшем будем использовать известные факты без доказательств.
Отметим также, что, помимо аналитических методе исследования поведения FMC, большие возможности дает метод статистического моделирования [1]. Созданию и исследование программ статистического моделирования цепей Маркова» посвящена одна из работ лабораторного практикум! приведенных в конце книги.
3.2. Модель вычислительной системы
как цепь Маркова
Основные понятия, связанные с моделированием I основе цепей Маркова, рассмотрим на примере простейшей модели, в которой ВС рассматривается как конечный автомат,состоящий из центрального процессора (CPU) Foи нескольких внешних устройств F1,...,F4. Центральный процессор производит вычисления, а внешние устройства осуществляют файловый обмен, например, как показано на рисунке 3.2.
В частности, предполагается наличие следующих Серийных устройств:
F1- накопитель на жестком магнитном диске;
F2- накопитель на гибком магнитном диске;
F3 - устройство печати;
F4- клавиатура.
Система работает по следующим правилам. Вначале запускается процессор, который может либо производить вычисления, либо управлять только одним устройством. Устройства, F1 ,F2 ,F3 , окончив работу, возвращают управление процессору. Если же управление переходит к клавиатуре (F4), Цикл автоматической работы заканчивается и система останавливается в ожидании команды с клавиатуры. Система решает некоторую типовую задачу, однако ее ход может быть разным в зависимости от данных. Модель, которую мы будем рассматривать, не отражает сущности выполняемых операций, а имеет дело с временными интервалами, в течение которых работают устройства, входящие в ВС. Эти временные интервалы являются случайными величинами. Модель должна удовлетворять следующим требованиям.
1. Она должна оценивать порядок порождения алгоритмом запросов на каждый из видов обслуживания - вычисления и файловый обмен.
2. Модель должна определять трудоемкость обслуживания запросов - количество вычислительных операций и объем информации, передаваемой при файловом обмене.
3. Модель должна отображать случайную природу вычислительных процессов, т.е. случайные моменты возникновения запросов и случайную суммарную трудоемкость обслуживания запросов.
4. Принимается, что достаточная адекватность модели, реальному вычислительному процессу достигается при совпадении первых моментов одноименных характеристик - математического ожидания и дисперсии.
Будем рассматривать вычислительный процесс какпоследовательность этапов счета и файлового обмена (рис. 3.3).
Здесь сj - трудоемкость (продолжительность) счета на j-м этапе, j=1,2,...;
аij- продолжительность обмена с i-м периферийным устройством на j-м этапе, i=1,2,3.
Определим множество состояний модели системы:
S={S0,S1,S2,S3,S4}.
Здесь S0 - состояние, соответствующее работе CPU;
Si - состояние обмена с i-м устройством (i=1,2,3);
S4 - состояние ожидания (окончание вычислительного процесса).
Состояния являются функциями времени: Si=Si(t), причемсмена состояний происходит в случайные моменты t0,t1,…,tm. В рассматриваемой модели нам не важны значения интервалов времени между моментами смены состояний ВС. Эти моменты будут рассматриваться как последовательные такты работы ВС и обозначаться целыми числами. Таким образом, в дальнейшем время считается дискретным.
Процессы смены состояний в этой системе будем рассматривать как однородную марковскую цепь.
Введем вектор X, определяющий распределение вероятностей состояний в момент t. Сделаем дополнительные предположения о ходе процесса. Процесс всегда начинается с состояния So, т.е. с процессорной обработки, и любому этапу обмена должна предшествовать процессорная обработка. Отсюда следует, что вероятности начальных состояний определяются вектором
X(t0)=[x0 xl x2 x3 x4]=[10000],
а матрица вероятностей переходов не зависит от времени:
Из этой матрицы видно, что из состояния S0процесс с вероятностями р1,р2,p3,p4переходит, соответственно, в состояния S1,S2,...,S4, при этом р1+р2+р3+р4=1.
Из состояний S1,S2,S3процесс с вероятностью 1 возвращается в S0. Достигнув состояния S4, процесс навсегда остается в нем. Такое состояние называется поглощающим. Граф смены состояний рассматриваемой цепи имеет вид представленный на рисунке 3.4 а. Динамика смены состояний системы может быть представлена также обыкновенной сетью Петри со случайным срабатыванием переходов t11 —t4l(рис. 3.4 б) \
Помимо порядка смены состояний может оцениваться трудоемкостьвычислительного процесса.
Пусть С0- средняя трудоемкость этапа счета (среднее число процессорных операций или соответствующее процессорное время);
C1,C2,C3- средняя трудоемкость операций файлового обмена в байтах (или, если известна скорость обмена каналов, 1 среднее время обмена).
Значения вероятностей p1,p2,p3,p4предопределяют ход вычислительного процесса. Эти значения вычисляются следующим образом.
Трудоемкость алгоритма определяет, в частности среднее число N1,N2,N3обращений к файлам F1,F2,F3. Следовательно, среднее число переходов из состояния Soв состояния S1,S2,S3должно быть N1+N2+N3. Один раз процесс переходит в поглощающее состояние S4. Таким образом, вычислительный процесс должен выходить из состояния S0в среднем
3
N=∑Nh+1раз. (3.7)
h=1
Значение phопределяет долю переходов в состояние Shпо отношению к всевозможным переходам
Nh
из состояния S0в состояния S1,...,S4. Эта доля равна в среднем ———, где Nh- среднее число
N
переходов в состояние Sh. Nk 1
Следовательно, pk = —, h = l..3, p4. = —.
N N
Тогда средняя трудоемкость этапов счета, выполняемых за одну реализацию алгоритма, составит
Ccp = C0-N = C0(∑Nh+l)
Cср
ОткудаС0=—. (3.8) (3.8) ∑ Nh + 1
Трудоемкость конечного этапа вычислительного процесса представляет собой случайную величину со средним значением Ch, h = 0,l,...,n.
Величины Сср, Nhи Chмогут быть определены экспериментально путем анализа протоколов функционирования вычислительной системы при многократном решении рассматриваемой задачи.
Обратная задача - вычисление средних величин Niпо заданным вероятностям, рассматривается в п. 3.4.
Вернемся к примеру.Воспользовавшись основнойформулой пересчета вероятностей (3.4), выпишем векторы вероятностей в несколько последовательных моментов. Итак.
Обратим внимание, что сумма вероятностей нахождения системы во всех состояниях (т.е. сумма элементов вектора X{tk)) на каждом шаге остается равной единице.
Нетрудно убедиться, что векторы вероятностей необязательно пересчитывать последовательно. В самом деле в силу однородности цепи Маркова можно использовать формулу (3.5)
X{tk) = X(t0)Pk.
Выпишем степени матрицы Р:
Обратим внимание на то, что n-я строка матрицы Рк определяет вероятности распределения состояний системы в k-й момент времени при X(to)= [0,...,1,...,0], где единица стоит на п-м месте, а все остальные элементы нули, т.е. при старте системы из состояния Sn.
Проанализируем последовательность состояний и соответствующих матриц.
1. Наблюдается периодичность поведения системы с периодом, равным 2. Так, в четные такты вероятность работы процессора больше 0, а в нечетные - нулевая. Вероятности работы периферийных устройств больше 0 в нечетные моменты, а в четные равны нулю.
2. Вероятности работы всех устройств с увеличением числа шагов стремятся к нулю, а вероятность останова стремится к единице.
Рассмотрим теперь некоторые вопросы теории цепей Маркова.