Марковские цепи с конечным числом состояний и непрерывным временем.

0,3

0,7

Марковские цепи с конечным числом состояний и дискретным временем.

Пусть некоторая система S может находиться в одном из состояний конечного (или счетного) множества возможных состояний S₁, S₂,…, S_n, а переход из одного состояния в другое возможен только в определенные дискретные моменты времени t₁, t₂, t₃, …, называемые шагами.

Если система переходит из одного состояния в другое случайно, то говорят, что имеет место случайный процесс с дискретным временем.

Случайный процесс называется марковским, если вероятность перехода из любого состояния S_i в любое состояние S_j не зависит от того, как и когда система S попала в состояние S_i (т.е. в системе S отсутствует последствие). В таком случае говорят, что функционирование системы S описывается дискретной цепью Маркова.

Переходы системы S в различные состояния удобно изображать с помощью графа состояний (рис.1).

Рис. 1

Вершины графа S1, S₂, S₃ обозначают возможные состояния системы. Стрелка, направленная из вершины S _i в вершину S_j обозначает переход Si → Sj; число, стоящее рядом со стрелкой, обозначает величину вероятности этого перехода. Стрелка, замыкающаяся на i-той вершине графа, обозначает, что система остается в состоянии Si с вероятностью, стоящей у стрелки.

Графу системы, содержащему n вершин, можно поставить в соответствие матрицу nхn, элементами которой являются вероятности переходов p _ij между вершинами графа. Например, граф на рис.1 описывается матрицей P:

"0,7 0,1 0,2" P = 0,4 0 0,6 0,2 0,5 0,3

называемой матрицей вероятностей переходов. Элементы матрицы p _ij удовлетворяют условиям:

0<p_ij <1; (1.1)

^Yjpij = 1. (1.2)

Условие (1.1) - обычное свойство вероятностей, а условие (1.2) (сумма элементов любой стрелки равна 1) означает, что система S обязательно либо переходит их какого-то состояния Si в другое состояние, либо остается в состоянии Si.

Элементы матрицы p_ij дают вероятности переходов в системе за один шаг. Переход

Si → Sj за два шага можно рассматривать как происходящий на первом шаге из S _i в некоторое промежуточное состояние S_k и на втором шаге из S_k в Si. Таким образом, для элементов матрицы вероятностей переходов из Si в S_j за два шага получим:

pi ⁽ j ²⁾ =∑pikpkj. (13)

k=1

В (m)

общем случае перехода Si → Sj за m шагов для элементов p _i _j матрицы

вероятностей переходов справедлива формула:

pikpkj , 1 ≤ l ≤ m-1. (1.4)

k=1

Полагая в (1.4) l = 1 и l = m - 1 получим два эквивалентных выражения для p_i _j^m⁾:

pi ( jm)=∑ pik pk ( mj -1); (1.5)

k=1

n
(m) (m-1)

pij =∑ pⁱ k pkj . (1.6)

k=1

Пример 1.Для графа на рис.1 найти вероятность перехода системы из состояния S1 в состояние S₂ за 3 шага.

Решение.Вероятность перехода S1 → S₂ за 1 шаг равна p ₁₂ = p ₁₂ = 0,1. Найдем

вначале p₁⁽²₂⁾, используя формулу (1.5), в которой полагаем m = 2.

Получим:

p ₁⁽₂ = ∑ p ₁ _kpk2 =р ₁₁ р ₁₂ + р ₁₂ + р ₂₂ + р ₁₂ р ₃2 = 0,7⋅ 0,1 + 0,1 ⋅ 0+0,2 ⋅ 0,5 = 0,17.

k=1

Аналогично pп⁾ = ∑ p 1 k p k ⁽²2⁾ .

k=1

Как видно из этой формулы, в дополнение к p ₁⁽² ⁾ необходимо вычислить также

p⁽2²₂⁾ = ∑p2kpk2 =p21p12 +p₂₂p22 + p₂₃p32 = 0,4 ⋅0,1+0⋅0 + 0,6 ⋅0,5 = 0,34 .

k=1

p ₃2 = ∑ p ₃ _k pk2 = p ₃₁ p ₁2 + p32p ₂₂ + p ₃₃ p ₃2 =0⋅0,1+0,5⋅0 + 0,3⋅0,5=0,15. k=1

p ₁₂ = p ₁₁ p ₁⁽₂²⁾ + p ₁₂p₂₂ + p ₁₃ p ₃₂ = 0,7 ⋅ 0,17 + 0,1 ⋅ 0,34 + 0,2 ⋅ 0,15 = 0,183. Ответ: Вероятность перехода S1 → S₂ после третьего шага равна 0,183. Пусть система S описывается матрицей вероятностей переходов Р

Таким образом

p ₁₁ p ₁₂ ..... p ₁ _n

P =

p ₂₁ p ₂₂ ..... p2n
................................

_p_n ₁ p_n2........... p_nn

(m)

Если обозначить через P ^(m) матрицу, элементами которой являются p вероятности переходов из Si в S _j за m шагов, то справедлива формула

где матрица ^P ^m получается умножением матрицы P саму на себя m раз.

O(1)

Исходное состояние системы характеризуется вектором состояния системы Q (называемым также стохастическим вектором).

Q = (q ₁, q2,…,q _n ),

где qj-вероятность того, что исходным состоянием системы является S_j состояние. Аналогично (1.1) и (1.2) справедливы соотношения

0 ≤ q_i ≤1;

Хq_i= 1.

i=1

Обозначим через

(m)

вектор состояния системы после m шагов, где q_j - вероятность того, что после m шагов система находится в Si состоянии. Тогда справедлива формула

Q⁽m)=Q-Pm. (1.8)

Пример 2.Найти вектор состояния системы, изображенный на рис.1 после двух шагов.

Решение.Исходное состояние системы характеризуется вектором Q=(0,7; 0; 0,3).

После первого шага (m = 1) система перейдет в состояние Q ⁽¹⁾

Q⁽¹⁾ =Q-P = (0,7; 0; 0,3)-

"0,7 0,1 0,2

= (0,7 •0,7 + 0 •0,4 + 0,3 •0,2; 0,7 •0,1 +

0,4 0 0,6 0,2 0,5 0,3 + 0 •0 + 0,3 •0,5; 0,7 •0,2 + 0 •0,6 + 0,3 •0,3) = (0,55; 0,22; 0,23).

r После второго шага система окажется в состоянии Q⁽²⁾

0,7 0,1 0,2

(1)

= Q-P = (0,7;0;0,3)-

= (0,519; 0,17; 0,311).

0,4 0 0,6 0,2 0,5 0,3

Ответ: Состояние системы S после двух шагов характеризуется вектором (0,519; 0,17; 0,311).

При решении задач в примерах 1, 2 предполагалось, что вероятности переходов P_ij остаются постоянными. Такие марковские цепи называются стационарными. В противном случае марковская цепь называется нестационарной.

Если система S может переходить в другое состояние случайным образом в произвольный момент времени, то говорят о случайном процессе с непрерывным временем. В отсутствии последействия такой процесс называется непрерывной марковской цепью. При этом вероятности переходов S_i → S_j для любых i и j в любой момент времени равны нулю (в силу непрерывности времени). По этой причине вместо вероятности перехода P_ij вводится величина λ_ij - плотность вероятности перехода из состояния S_i в состояние S_j, определяемая как предел

p_i

(t ) =

lim Δ t →0

(t+Δ t)-p_ij ( t )

;

(2.1)

Δt

(i ≠ j).

Если величины λ_ij не зависят от t, то марковский процесс называется однородным. Если за время Δt система может изменить свое состояние не более чем один раз, то говорят, что случайный процесс является ординарным. Величину λ_ij называют интенсивностью перехода системы из S_i в S_j. На графе состояний системы численные значения λ_ij ставят рядом со стрелками, показывающими переходы в вершины графа (рис. 2).

Рис. 2

Зная интенсивности переходов можно найти величины p1(t), p₂(t),…, p_n(t) -вероятности нахождения системы S в состояниях S₁, S₂,…, S_n соответственно. При этом выполняется условие

j=1 Распределение вероятностей состояний системы, которое можно характеризовать вектором p(t) = (p₁(t),p₂(t),...,p_n(t)), называется стационарным, если оно не

зависит от времени, т.е. все компоненты вектора p являются константами.

Состояния Si и Sj называются сообщающимися, если возможны переходы Si ↔ S_j (на рис. 2 сообщающимися являются состояния S1 и S₂, а S ₁, S₃ и S₂, S₃ такими не являются).

Состояние Si называется существенным, если всякое S_j , достижимое из Si, является сообщающимся с Si. Состояние Si называется несущественным, если оно не является существенным (на рис. 2 существенными являются состояния S1 и S₂).

Если существуют предельные вероятности состояний системы

pj = limpj(t), (j = 1,n) (2 3)

не зависящие от начального состояния системы, то говорят, что при t → ∞ в системе устанавливается стационарный режим.

Система, в которой существуют предельные (финальные) вероятности состояний системы, называется эргодической, а протекающий в ней случайный процесс эргодическим.

Теорема 1.Если Si - несущественное состояние, то

limp_i (t) = 0, (2.4)

т.е. при t → ∞ система выходит из любого несущественного состояния (для системы

на рис. 2 limp ₃ (t ) = 0, т.к. S₃ - несущественное состояние).

Теорема 2.Чтобы система с конечным числом состояний имела единственное предельное распределение вероятностей состояний, необходимо и достаточно, чтобы все ее существенные состояния сообщались между собой (система на рис.2 удовлетворяет этому условию, т.к. существенные состояния S1 и S₂ сообщаются между собой).

Если случайный процесс, происходящий в системе с дискретными состояниями является непрерывной марковской цепью, то для вероятностей p1( t), p2(t ),…, p _n(t ) можно составить систему линейных дифференциальных уравнений, называемых уравнениями Колмогорова. При составлении уравнений удобно пользоваться графом состояний системы. Рассмотрим получение уравнений Колмогорова на конкретном примере.

Пример 3.Записать уравнения Колмогорова для системы, изображенной на рис.2. Найти финальные вероятности для состояний системы.

Решение.Рассмотрим вначале вершину графа S1. Вероятность p₁(t + Δt) того, что система в момент времени (t + Δt) будет находиться в состоянии S1 достигается двумя способами:

а) система в момент времени t с вероятностью p₁(t) находилась в состоянии S₁ и за
малое время Δt не перешла в состояние S₂. Из состояния S1 система может быть выведена
потоком интенсивностью Х₁₂; вероятность выхода системы из состояния S1 за время Δt
при этом равна (с точностью до величин более высокого порядка малости по Δt) Х₁₂ Δt, а
вероятность невыхода из состояния S1 будет равна (1 - Х₁₂ Δt). При этом вероятность
того, что система останется в состоянии S1, согласно теореме об умножении
вероятностей будет равна p ₁(t ) (1 - Х₁₂ Δt).

б) система в момент времени t находилась в состоянии S₂ и за время Δt под
воздействием потока Х₂₁ перешла в состояние S1 с вероятностью Х₂₁ Δt. Вероятность того,
что система будет находиться в состоянии S1 равна p₂(t)·X₂1Δt.

в) система в момент времени t находилась в состоянии S₃ и за время Δt под
воздействием потока h1 перешла в состояние S1 с вероятностью h1 Δt. Вероятность того,
что система будет находиться в состоянии S1 равна p₃(t)·X₃1Δt.

По теореме сложения вероятностей получим:

p1(t + Δt) = p1(t) (1 - λ ₁₂ Δt ) + p2(t) (1 - λ21 АО+ )?з(t ) (1 - λ31 Δt);=> p1(t + Δt ) - p ₁(t) = (-p ₁(t)·λ ₁2 + p2(t) λ ₂₁ + p3(0 ^зО A?^>

(t+At)-p(t) _Л л л

^p ¹—¹ = -X₁₂p ₁(t) + h₂1p₂(t) + X₃₁p₃(t). Переходя к пределу Δt → 0, получим

dt 1 = - Л₁₂ p₁ + Л₂₁p₂ + Л₃₁ p₃. (2.5)

Аналогично, рассматривая вершины графа S₂ и S₃ , получим уравнения

^dp2= 12 p 1 - Л21 p 2 + Л32 p 3 , (2.6)

(2.7)

dt

)p₃.

К уравнениям (2.5) - (2.7) следует добавить уравнение (2.2), имеющее в данном случае вид

р ₁ + р2 + р ₃ = 1. (2.8)

Уравнение (2.8) выполняет роль нормировочного условия, накладываемого на вероятности p _j.

Решение системы уравнений (2.5) - (2.8) в зависимости от времени можно найти либо аналитически, либо численно с учетом начальных условий. Мы найдем лишь финальные вероятности p _j, которые по определению при t → ∞ не зависят от времени. При этом в (2.5) - (2.7) dp_i/dt = 0 (j = 1, 2, 3). Получившиеся при этом три алгебраических уравнения являются однородными, поэтому одно из них можно отбросить. Отбросим, например, уравнение, получающееся из (2.6), а вместо него запишем уравнение (2.8). В результате система уравнений для финальных вероятностей примет вид

λ ₁₂p₁ + λ₂₁p₂ + λ₃₁p₃ = 0,

p ₁ + p₂+ p₃ = 1, (λ₃1 + λ₃₂)p₃ =0. Из последнего уравнения следует, что p₃ = 0. Решая оставшиеся уравнения, получим

p ₁= 2/3, p₂ = 1/3.

Ответ: вектор состояния системы в стационарном режиме равен p = ( 3 ; 3 ;0).

С учетом рассмотренного примера сформулируем общее правило составления уравнений Колмогорова:

В левой части каждого из них стоит производная вероятности какого-то (j-го) состояния. В правой части - сумма произведений вероятностей всех состояний, из которых идут стрелки в данное состояние, на интенсивности соответствующих потоков, минус суммарная интенсивность всех потоков, выводящих систему из данного (j-го) состояния, умноженная на вероятность данного (j-го) состояния.