Главная > Разное > Стохастические модели социальных процессов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

4.4. ПОЛУМАРКОВСКИЕ МОДЕЛИ

В последнем разделе в ходе исследования зависимости между наблюдаемыми переходными матрицами и основным процессом мы уже коснулись нескольких обобщений марковской модели. Здесь продолжим обсуждение того же вопроса и перейдем к классу моделей, в которых склонность к переходу зависит от времени пребывания в данной категории. Это позволит нам включить в рассмотрение накопленную инерцию как форму проявления уменьшения склонности к переходу.

К определению полумарковского процесса можно подойти двумя путями, что соответствует двум уже упоминавшимся способам определения марковского процесса. Один вытекает из интенсивностей переходов, другой начинается с пуассоновского процесса изменения состояний, а заканчивается вложенной марковской цепью. Эти два подхода эквивалентны, хотя в конкретных случаях либо тот, либо другой обычно оказывается более естественным. То же самое относится и к полумарковским процессам. Здесь мы займемся тем подходом, который представляется наиболее приемлемым при моделировании профессиональной мобильности.

Обобщим марковский процесс, допустив, что интенсивности переходов являются функциями времени пребывания в данном состоянии. Тогда — вероятность перехода из состояния i в состояние за малый промежуток времени . Накопленная инерция соответствует предположению, что гц есть убывающая функция t. Полумарковские модели возникают в страховом деле и при анализе

годовой смертности по разным причинам, где могут быть коэффициентами смертности по различным причинам как функции возраста. В большинстве таких приложений требуется, чтобы система была открытой, и мы приведем примеры такого рода в гл. 5.

Для многих случаев удобно принять следующие обозначения:

где — опасность ухода (см. гл. 7), связанная с перемещением из состояния — вероятность перехода из i в при условии, что уход имел место в момент i. Мы положим ее равной нулю, если и тогда

При такой формулировке нет явного условия на переход из данного состояния в самое себя. В некоторых приложениях такие перемещения бывают бессмысленными, но иногда переходы такого рода не только происходят, но их можно и наблюдать. Например, в исследовании ВКМ профессиональной мобильности состояния основывались на группировках по отраслям промышленности. Если бы мы могли наблюдать переходы только при пересечении границ групп, то приведенная выше формулировка соответствовала бы действительности. С другой стороны, если мы наблюдаем за переменами мест работы, то такие перемены могут происходить и внутри одной и той же отраслевой группы. Тогда целесообразно считать, что обозначает продолжительность пребывания на данном месте работы, а относится к переходам с одного места работы на другое. В этом случае вовсе не обязательно иметь Процесс, определенный таким способом, эквивалентен полумарковскому процессу, но тогда соотношения (4.53) уже не определяются через .

Анализ модели мы начнем с того, что выразим некоторые функции вероятности, которые легко оценить, через интенсивности переходов. Плотность времени пребывания в состоянии i, для которого — опасность ухода, равна:

В частном случае марковского процесса постоянна, так что распределение времени пребывания является экспоненциальным. Чтобы узнать, нужно ли использовать полумарковскую модель, следует проверить, распределены ли экспоненциально действительные продолжительности пребывания в данном состоянии. при моделировании стадий лечения сердечно-сосудистых заболеваний выполнил такую проверку и нашел, что распределение продолжительности стадии лечения не может быть экспоненциальным. Он также обнаружил, что время, проведенное в одном состоянии (стадии лечения), зависит от конечного состояния. Если обозначить через плотность распределения

вероятностей времени пребывания в состоянии i для тех, кто переходит в состояние то можно выразить ее через интенсивности переходов. Если то вероятность того, что индивидуум останется в состоянии i до момента t, а затем на интервале перейдет в состояние равна

Интеграл от 0 до последней величины представляет собой вероятность того, что индивидуум, находящийся в состоянии i, на следующем шаге перейдет в состояние . Этот важный параметр с полным правом можно обозначить через

Поскольку

следующий переход в то

Если процесс можно наблюдать непрерывно в течение достаточно длительного времени, то можно оценить непосредственно. Как только эти величины известны, определяется по (4.56).

Важным является частный случай, когда не зависит от что было обнаружено Янгом и Хуршем (1973) при исследовании характера сна. Он известен как модель пропорционального риска, так как это означает, что есть функция от i и t, но не от Запишем:

и, следовательно,

Это значит, что форма зависимости интенсивности от времени одинаковая, независимо от состояния, в которое совершается переход, но уровень интенсивности меняется в соответствии с состоянием, к которому делается переход. В этом случае а последнее означает, что вероятность перехода для индивидуума, который перемещается в момент t, не зависит от момента перехода.

Полумарковская модель имеет много характерных особенностей, представляющих практический интерес. Например, Као (1974) специально изучал «траектории» больных внутри больницы, в частности, путем измерения средних значений и дисперсий времени пребывания. Далее в настоящей главе мы остановимся только на двух аспектах. Первый — какова матрица переходных вероятностей для фиксированного интервала времени. Как мы видели в последнем разделе, когда

процесс может наблюдаться только в дискретные моменты времени, нам надо знать, какие выеоды можно сделать об изучаемом процессе. Второй аспект касается распределений в установившемся состоянии.

Вероятности переходов на фиксированном интервале времени

Для полумарковского процесса эти вероятности будут зависеть от состояния системы в момент начала интервала наблюдения. Возьмем индивидуума, который только что попал в состояние i. Пусть — вероятность того, что через время он окажется в состоянии Выражение для этой вероятности можно построить следующим образом. Если , то индивидуум должен совершить, по крайней мере, один переход на интервале . Предположим, что первый переход он совершает в состояние и это происходит на интервале . Тогда между он должен перейти из в . Суммируя вероятности этих событий по h и t, получаем

Если то индивидуум может оставаться в состоянии i в течение всего интервала наблюдения, и вероятность этого события есть . В соответствии с определением окончательный результат можно записать как

где для всех i, а при и нулю при . В принципе этих уравнений достаточно для вычисления требуемых вероятностей переходов. Рассматривая время как дискретную переменную, интеграл в (4.58) можно заменить суммой и вычислить вероятности рекуррентно, как в работе Валлианта и Милковича (1977). Такие вычисления сразу не позволяют судить даже о качественном поведении системы, поэтому мы продолжим анализ (4.58), введя преобразование Лапласа. Но и применение этого сильного математического аппарата позволяет получить весьма скудные результаты.

Преобразование Лапласа от функции

Нам понадобится теорема о том, что преобразование Лапласа от свертки функций

представляет собой произведение их преобразований

Теперь, применив преобразование Лапласа к обеим частям (4.58), получаем

Сумму в правой части можно представить как элемент произведения двух матриц, одна из которых имеет элементы а другая — Следовательно, (4.59) можно переписать в виде

где — диагональная матрица с элементами — матрица с элементами . Таким образом, преобразование Лапласа от находим сразу:

Несмотря на кажущуюся простоту этого выражения, получить из него явную формулу или качественную информацию о процессе нелегко, хотя в некоторых простых частных случаях все-таки извлечь кое-что удается. Во-первых, полезно проследить, как возникают известные результаты для марковского процесса.

Для марковского процесса

Тогда легко получить преобразования Лапласа, необходимые для (4.61):

Подставновка в (4.61) дает

где — диагональные матрицы с элементами на главной диагонали и соответственно. Замечая, что имеем

что представляет собой преобразование Лапласа от

Некоторые результаты можно получить для общего случая, если ввести в модель дополнительные ограничения или рассмотреть малые значения k. В простейшем случае при принимает вид

Существование обратных преобразований Лапласа в любом случае зависит от вида функций Но предельный вид матрицы при легко найти, воспользовавшись тем, что для любого преобразования

Для (4.63)

где средние значения времени пребывания в двух состояниях.

При пропорциональных рисках выражение для преобразования Лапласа упрощается, поскольку

где — диагональная матрица с элементами Вероятно, простейший пример моделей с пропорциональным риском возникает при но даже в этом случае нет явных выражений для нужных преобразований Лапласа. Значительно продвинуться вперед можно, лишь сделав дополнительное предположение о том, что для всех i. Это означает, что интенсивность переходов одинакова для всех состояний. В этом случае

Последний шаг основан на том, что преобразование Лапласа от есть Разлагая обратную матрицу в (4.65) в ряд, имеем

Теперь — преобразование Лапласа плотности сумм независимых случайных величин с функцией плотности и, в силу приведенного выше результата, преобразование функции распределения их сумм. Применяя обратное преобразование к обеим частям (4.66), получаем

Разность вероятностей представляет собой вероятность того, что на интервале происходят изменений состояния. Следовательно, окончательно имеем

что, очевидно, приводит к (4.51) и могло быть получено более простым способом. При этом необходимо помнить, что в настоящем разделе интервал , начинается с того момента, когда индивидуум попадает в исследуемое состояние.

Примеры

Проблема применения (4.68) состоит в определении ) по предполагаемым интенсивностям переходов. Сингер и Шпилерман (1979) рассмотрели случай, когда

Соотношение (4.69) представляет собой опасность перехода, которая возрастает с увеличением длительности пребывания в данном состоянии, причем скорость возрастания опасности стремится к нулю, когда t становится большим. Сингер и Шпилерман как пример применения такой модели обсуждают работу о стереотипных моделях психологов-эволюционистов. В социологии для характеристики возрастающей скорости перехода используется термин «кумулятивный стресс» в отличие от накопленной инерции, когда эта интенсивность уменьшается. Сингеру и Шпилерману (1979) удалось показать, что для модели (4.69)

где гиперболические синус и косинус как функции матричного аргумента определяются обычным способом с помощью их разложений в степенные ряды. Чтобы проанализировать, чем такой процесс отличается от марковского, сравним Возводя обе части (4.70) в квадрат, находим

Ясно, что отличаются друг от друга. Чтобы понять характер различия, рассмотрим, как в гл. 2, следы этих двух матриц. Соответствующее выражение имеет вид

где величины — собственные значения матрицы М. Последнее выражение будет положительным, если все действительные и положительные (мы знаем, что Следовательно, диагональные элементы переходной матрицы за два шага будут меньше, в среднем, чем предсказанные

марковской моделью. Более сильный результат можно получить, если рассмотреть только малые значения . Тогда

откуда следует, что каждый диагональный элемент матрицы меньше соответствующего элемента матрицы .

Непросто найти убывающую интенсивность перехода, для которой можно провести аналогичное исследование. Поэтому рассмотрим частный случай, когда Для него можно найти обратное преобразование Лапласа в (4.63). Предположим, что

Мы встретимся с этим распределением в гл. 7. Соответствующая интенсивность перехода — убывающая функция от t. В этом случае можно записать:

где

Последнее представляет собой рациональную алгебраическую дробь, следовательно, ее можно представить в виде

поэтому обратное преобразование Лапласа дает

Диагональные элементы будут больше соответствующих элементов при условии

Если принять , то

Расчеты показывают, что поэтому легко убедиться в том, что (4.46) выполняется для

Мы считаем, что накопленная инерция всегда будет приводить к увеличению диагональных элементов матрицы по сравнению с предсказанными по и что кумулятивный стресс будет приводить к их уменьшению.

Подытожим выводы, полученные в этом и предыдущем разделах, относительно поведения непрерывного по времени процесса, наблюдаемого на фиксированных интервалах времени; мы выявили три случая, когда отклонения от марковской модели могут привести к заниженному прогнозу значений диагональных элементов, а именно неоднородности в:

1) переходных матрицах Р;

2) показателе интенсивности X;

3) накопленной инерции, приводящей к убыванию интенсивности переходов.

Чтобы определить, с каким из этих случаев имеем дело, нужно располагать более подробными данными. В частности, случай 3 можно установить по характеру распределения интервалов между переходами.

Наблюдение на интервале с произвольной начальной точкой

В предыдущем исследовании рассматривались только такие временные интервалы, которые начинаются с момента попадания индивидуума в данное состояние. Если мы начинаем наблюдать процесс в некоторой произвольной точке, то вероятности переходов на интервале будут зависеть от того, как долго индивидуум находился в определенном состоянии до начала интервала. Если такая информация есть, то легко получить необходимую модификацию. Единственное слагаемое в (4.58), подлежащее изменению, — первое, содержащее вероятность постоянного пребывания в состоянии i в течение всего интервала. Для индивидуума, который находился в состоянии i в течение времени х до момента начала наблюдения, эта вероятность равна:

Тогда вероятность для случайно выбранного индивидуума определяют умножением на функцию плотности от х и интегрированием.

Если система находится в равновесии, то функцию плотности от х можно получить следующим образом. При выполнении принятых условий безразлично, с какого момента пребывания в данном состоянии начинать период наблюдения. Так что

где t имеет функцию плотности — независимая случайная величина, равномерно распределенная на интервале (0, 1). Следовательно, условная функция плотности распределения х однородна на интервале (0, t) и должна быть усреднена относительно распределения t. Плотность последнего не равна так как, если система наблюдается

в случайные моменты времени, мы попадаем в большой интервал скорее, чем в малый. Таким образом, вероятность того, что этот интервал лежит в , будет пропорциональна и t, т. е.

Отсюда первое слагаемое в (4.58) принимает вид

где Учитывая, что преобразование Лапласа от равно можно записать как

где D — диагональная матрица с элементами

Предельный режим

Предельный режим полумарковской цепи в отличие от переходного поведения получить легко. Его можно вывести эвристически следующим образом. Рассмотрим достаточно большой интервал времени после того, как система достигла своего установившегося состояния, и предположим, что на этом интервале было К изменений состояния. Тогда ожидаемое число попаданий индивидуумов системы в состояние i будет равно , где — установившаяся структура, соответствующая переходной матрице М с элементами, заданными (4.55). При каждом попадании одного индивидуума ожидаемое время пребывания в состоянии i будет и, следовательно, ожидаемое общее время пребывания в этом состоянии равно . Доля времени, проведенного в состоянии i, следовательно, равна что можно интерпретировать как вероятность обнаружения случайно выбранного индивидуума в состоянии

Таким образом, для системы размера N записываем:

Если для всех i, то среднее значение времени пребывания будет одинаковым и предельная структура будет той же, что и для вложенной марковскойцепи с переходной матрицей М. Это, по существу, результат (4.52), но в иной форме. Другие частные случаи (4.77) проявляются в (4.29) и (4.64).

Модели, основанные на более общих точечных процессах

Вполне возможно представить себе дальнейшие обобщения, вводя в рассмотрение разные точечные процессы. Хотелось бы ослабить два специфических предположения относительно полумарковского процесса: его однородность во времени и независимость длительностей последовательного времени пребывания в различных состояниях. Так как оба обобщения сохраняют особенности вложенной марковской цепи, все свойства системы, вытекающие из этих особенностей, остаются неизменными. Например, результат о стационарной структуре, приведенный в (4.52), остается достаточно общим, даже если может зависеть не только от длины интервала наблюдения, но и от других характеристик стохастического процесса. Некоторые дальнейшие обобщения следуют почти немедленно. Предположим, например, что точечный процесс является зависящим от времени пуассоновским процессом с интенсивностью к (Т). Если мы изменим масштаб времени,

то во временной шкале Y именения состояния происходят согласно однородному по времени процессу и можно пользоваться теорией, изложенной в разделах 4.2 и 4.3. Результаты, полученные в так называемом операционном масштабе времени, можно при необходимости преобразовать в «реальное» время. Серьезным препятствием на пути подобных обобщений является большое количество разнообразных данных, которые требуются для реализации таких моделей.

<< Предыдущий параграф Следующий параграф >>
Оглавление