Главная > Разное > Стохастические модели социальных процессов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

4.3. ДИСКРЕТНЫЕ НАБЛЮДЕНИЯ НЕПРЕРЫВНОГО ПРОЦЕССА

По причинам, указанным выше, нам было достаточно наблюдать непрерывный во времени процесс в двух или более фиксированных моментах времени. В плане обсуждения, которое мы до сих пор вели, это ставит ряд вопросов:

1) можно ли считать основной процесс марковским?

2) если это так, можно ли оценить его параметры? К этим вопросам можно добавить третий:

3) при каких условиях допустимо оперировать с дискретно наблюдаемым непрерывным процессом так же, как если бы он действительно был дискретным?

Последний вопрос вызван тем обстоятельством, что дискретная по времени марковская модель из гл. 2 часто подгонялась к процессу, который в действительности был непрерывным. Например, индивидуумов в модели региональной миграции часто рассматривают так, как будто изменения местожительства происходят ежегодно. Конечно, желательно знать, так ли это в действительности.

Займемся сначала последним вопросом. Если система наблюдается в моменты времени 0 и Т, то — переходная матрица за интервал . Матрицу можно оценить непосредственно по наблюдаемому количеству переходящих индивидуумов. Если рассматривать процесс как дискретный, то мы могли бы предполагать, что матрицей периода за шагов будет . Далее, поскольку периоды Т скорее всего задаются из соображений удобства наблюдений, не связанных с самим процессом, то полученный ответ должен быть согласован с другим выбором Т, т. е. хотелось бы, чтобы

Для марковского процесса, как видно из (4.8), и, следовательно, (4.30) всегда выполняется. Поэтому справедлив вывод, что если основной процесс — марковский и если он наблюдается через равные интервалы времени, то в эти моменты можно его рассматривать как дискретную марковскую цепь.

Чтобы ответить на первый из поставленных выше вопросов, мы должны учесть одно соображение. Для марковского процесса соотношение (4.30) выполняется для всех положительных и, в частности,

для . Тогда, если мы сможем оценить матрицу Р (Т), то необходимое условие того, что она порождается марковским процессом, состоит в следующем: также должна быть матрицей перехода, т. е. ее элементы неотрицательны и суммы элементов строк равны единице. Как определить, обладает ли данная матрица таким свойством? Этот вопрос всесторонне был изучен Сингером и Шпилерманом (1976а). Необходимое и достаточное условие для было получено Кингманом (1962). А именно

    (4.31)

Для условие Кингмана (1962) на практике неприменимо, но остается ряд необходимых условий, при которых некоторые не порожденные марковским процессом матрицы могут быть исключены из рассмотрения. Вероятно, простейшее из них, для которого (4.31) является частным случаем, состоит в том, что

где означает детерминант. Сингер и Шпилерман (1977а) привели пример матрицы

для которой . Так как (4.32) не выполняется, справедлив вывод, что Р (Т) не может быть порождена марковским процессом. На практике элементы Р (Т) были бы оценены, и, следовательно, они содержали бы ошибки. При отсутствии проверки на значимость надо при малых выборках с особой осторожностью относиться к слабым нарушениям неравенств. Другие необходимые условия основаны на собственных значениях матрицы Р (Т). Более подробное обсуждение можно найти в работе Сингера и Шпилермана (1977а).

Может создаться впечатление, что проще всего ответить на второй наш вопрос: как найти матрицу R по заданной матрице Так как эти две матрицы связаны соотношением

вся проблема заключается в том, имеет ли (4.33) в требуемой форме единственное для R решение. Оказывается, что это уравнение может иметь одно решение, несколько решений или не иметь их вовсе. Если решения не существует, то совершенно ясно, что матрица Р (Т) не может быть порождена марковским процессом. Если существует несколько решений, то более одного процесса могут привести к наблюдаемой матрице Р (Т), и нет способов отличить их друг от друга. Только при единственном решении мы можем быть уверены в его правильности. При можно записать:

Для существования R значение должно быть действительным и строго положительным. Так как два собственных значения Р равны соответственно, то предыдущее условие можно выразить через них. Выражение условия через собственные значения становится достаточным для всех значений k. Таким образом, если собственные значения матрицы Р (Т) действительны и положительны, то (4.33) имеет единственное решение. На практике такое предположение, по-видимому, часто выполняется. Если это так, то решение можно вычислить с помощью методов, рассмотренных Сингером и Шпилерманом (1976 а). Криди (1979) применил их метод к некоторым данным о потоках на рынке труда. В этом примере население, состоящее из белых молодых людей мужского пола в возрасте от 14 до 24 лет, в 1966 г. разделено на три категории: занятые (?), безработные (U) и нетрудоспособные (N). За 1966-1967 гг. наблюдались переходные вероятности:

Оценка матрицы R для них равна:

Если имеется программа для определения R, то проще применить ее, чем вычислять все собственные значения для проверки их положительности.

Если система наблюдается в трех и более моментах времени, то возможен дальнейший прогресс в идентификации процесса. Тогда можно прямо сравнивать матрицы перехода за два шага с квадратом матрицы перехода за один шаг. Примером является классическое исследование Блюмена и его соавторов (1955|) (далее оно обозначается ВКМ) профессиональной мобильности в Соединенных Штатах Америки. Данные включают профессиональные категории индивидуума, наблюдавшиеся ежеквартально. Никакой информации о переходах внутри этих интервалов не было. Имелось 11 категорий, причем одна состояла из безработных, а 10 других обозначались как указано в табл. 4.1. Так как в распоряжении имелись данные по восьми последовательным кварталам, можно сравнить, например, восьмую степень матрицы перехода за один шаг с матрицей перехода за восемь шагов. Результат такого сравнения показан в табл. 4.1 для мужчин в возрасте 20—24 года.

Самое удивительное, что диагональные элементы наблюдаемой матрицы перехода за восемь кварталов гораздо больше, чем предсказанные с помощью возведения переходной матрицы за один квартал в восьмую степень. С аналогичным явлением мы сталкивались при анализе модели с дискретным временем в гл. 2. Там было показано, что

Таблица 4.1. Сравнение наблюдавшихся и предсказанных вероятностей перехода за восемь кварталов для мужчин в возрасте 20—24 года. Верхнее число — наблюдавшаяся доля, нижиее — предсказанная марковской теорией

(см. скан)

его можно объяснить либо неоднородностью (т.е. различными Р), либо накопленной инерцией. Каждое из отмеченных в гл. 2 отклонений от простой модели имеет свой аналог для модели с непрерывным временем. Отклонение от диагональных элементов из-за накопленной инерции получается, если допустить, что интервалы времени между изменениями состояний имеют такое распределение, что склонности к переходу убывают по мере увеличения длительности пребывания в данном состоянии. Такие модели будут обсуждаться в разделе 4.4. Существует также третий тип отклонения, встречающийся у моделей с непрерывным временем. Здесь можно столкнуться с неоднородностью процесса, управляющего изменением состояния. Однако мы начнем анализ с непрерывной по времени МС-модели.

Как и ранее, предполагаем, что генеральная совокупность разделена на две части — «кочевников» и «оседлых». Предположим, что часть Si категории i составляют «оседлые», что означает, что их переходная матрица есть I; остальные — «кочевники» с переходной матрицей Р. Мы придерживаемся предположения, что изменения состояния происходят в точках, которые получаются из реализации пуассоновского

процесса с параметром к. Таким образом, если обозначает временной интервал наблюдения (в данном случае — квартал), то

где S — диагональная матрица с элементами на диагонали.

Теперь возникает вопрос: согласуется ли, например, переходная матрица за восемь кварталов , предсказанная по (4.35), с матрицей, полученной по результатам наблюдений? ВКМ подогнали модель к своим данным; полученные результаты для диагональных элементов по группе 20-24-летних приведены в табл. 4.2.

Таблица 4.2. Сравнение наблюдавшихся и предсказанных значений диагональных элементов в переходных матрицах за восемь кварталов для мужчин в возрасте 20—24 лет

Очевидно, что соответствие гораздо лучше, чем в табл. 4.1, так что, несмотря на свою грубость, МС-модель не оставляет желать лучшего. Можно было бы ввести и более тонкие формы неоднородности, но (по крайней мере в этом случае) они вряд ли необходимы.

Предыдущую модель можно описывать двумя способами. Выше мы предположили, что неоднородность заключена в различных переходных матрицах: I — в одном случае и Р — в другом. Второй способ состоит в предположении, что все индивидуумы имеют одинаковую матрицу перехода, но различные скорости движения, причем они будут такими: к — для «кочевников» и 0 — для «оседлых». Оба способа построения модели приводят к (4.35). Рассмотрим теперь последнюю трактовку. Предположим, что каждый индивидуум меняет свое состояние в соответствии с марковским процессом, который характеризуется распределением Пуассона с параметром к и переходной матрицей Р. Неоднородность связана с тем, что к может меняться, обеспечивая тем самым различные скорости перемещения индивидуумов. Переходная матрица для интервала легко определяется следующим образом. Для каждого данного индивидуума она равна , где — вероятность перемещений на интервале для распределения Пуассона. Это выражение дает искомые вероятности при данном . Чтобы найти безусловное распределение, мы

должны определить математическое ожидание относительно оно равно:

где функция распределения X. Меняя местами знаки суммирования и интегрирования, получаем

где

Заметим, что (4.35) оказывается частным случаем этой модели, когда распределение X концентрируется в двух точках — 0 и X.

Возникает вопрос: является ли типичным увеличение диагональных элементов матрицы за шагов по сравнению с предсказанными степенью переходной матрицы за 1 шаг, которое мы видели в МС-модели для последнего класса моделей? Ответ на этот вопрос будет получен в двух примерах, первый из них был построен ВКМ. Они рассмотрели состоящую из трех категорий систему, все члены которой характеризуются одной и той же переходной матрицей:

Изменения состояния происходят в соответствии с пуассоновским процессом, для которого половина каждой категории имеет другая половина имеет . Для всей системы число изменений состояния на интервале будет равно:

Полагая , получаем

Среднее значение для этого распределения равно 0,395, дисперсия равна 0,437, что указывает на более высокий разброс, чем у пуассоновского распределения, имеющего такое же среднее значение. Подстановка этих величин и матрицы (4.39) в (4.37) дает

Эта матрица могла бы быть рассчитана по данным, собранным в начале двух следующих друг за другом кварталов. Если рассматривать ее как переходную матрицу марковской цепи за 1 шаг, то можно предсказать переходную матрицу за 8 кварталов, возведя (4.41) в восьмую степень:

Однако переходная матрица за 8 кварталов, которую можно ожидать для данной модели, имеет вид:

Таким образом, введенная неоднородность приводит к недооценке диагональных элементов. Именно это и обнаружили Блюмен и его соавторы (1955) на практике.

Не обязательно предполагать, что в генеральной совокупности существуют индивидуальные различия. Такой же результат можно получить, если моменты решения о переходе появляются для каждого индивидуума в соответствии с (4.40). Последнее возможно в случае, если моменты решения двух типов: первый встречается с интенсивностью , а второй — с . К сожалению, пользуясь имеющимися данными, нельзя заметить различие в этих двух моделях. При прогнозировании они идентичны; если же нам требуется полностью понять суть процесса, то нужны данные об истории каждого отдельного случая.

Шпилерман (1972b) рассмотрел ситуацию, когда X распределено непрерывно, предположив, что

Это гибкая форма записи способна охарактеризовать различные типы распределений, начиная от -образного распределения и кончая унимодальным симметричным распределением. Мы воспользуемся этой записью еще раз в гл. 7. Подставляя в (4.38), временного интервала , получаем:

где по определению для всех целых Замена распределения в матричной записи (4.37) дает

Если бы Р было скаляром, то последнее выражение представляло бы собой сумму членов отрицательного биномиального распределения и в предположении сходимости было бы равно

Конечно, мы можем определить (4.44) как сумму бесконечного ряда (4.43), но это не снимает задачи вычисления (4.44), когда v — не целое число. Чтобы обойти эту трудность, воспользуемся тем, что Р можно представить в виде

где D — матрица, у которой на диагонали стоят собственные значения матрицы Р и все остальные элементы равны нулю, а в матрице столбец является собственным вектором, соответствующим i-м у собственному значению матрицы Р. Легко убедиться, что

Следовательно,

Бесконечная матричная сумма в скобках — это диагональная матрица, элемент которой представляет собой скалярную сумму

где собственное значение матрицы Р. Ряды (4.45) и (4.46) сходятся потому, что для стохастической матрицы для всех для что означает Эквивалентный способ суммирования ряда (4.43) состоит в использовании спектрального разложения приведенного в гл. 3 (см. соотношение ).

Шпилерман проделал некоторые численные сопоставления матрицы с переходной матрицей за Г шагов для описанного выше процесса. Он нашел, что последняя имеет большие диагональные элементы, подобно тому, как было в случае, когда X распределено в двух точках.

Наконец, покажем, что такого рода результат всегда будет иметь место для модели, у которой задана (4.36), если только собственные

значения Р действительные. В частности, мы найдем условие выполнения неравенства

    (4.47)

аналогичное условию из гл. 2. Из (4.37)

и, следовательно,

где — собственные значения матрицы Р. Далее имеем

где — коэффициент при в разложении квадрата.

Следовательно, условие выполнения (4.47) следующее:

Как только распределение известно, непосредственно проверяется выполнение условия (4.50). Когда имеет отрицательное биномиальное распределение (4.42), то легко обнаружить, что (4.50) выполняется для действительных .

В общем случае, когда задано (4.38), имеем

Отсюда

для всех действительных s. Если распределение Я не вырождается в единственную точку, то, полагая s равным по порядку каждому собственному значению, получаем, что (4.50) выполняется со строгими

неравенствами. Таким образом, становится ясным, что увеличение диагональных элементов можно объяснить различной интенсивностью перемещения, но нужно помнить, что оно может быть также обусловлено и неоднородностью в переходных матрицах. Позде в этой главе мы увидим, что существует и третье возможное объяснение.

Предельное поведение

При определенных обстоятельствах переходная матрица полученная из наблюдений, может дать информацию о предельном поведении основного процесса. Предположим, что все индивидуумы имеют одну и ту же переходную матрицу Р, но моменты осуществления этих переходов определяются произвольным стохастическим процессом. До сих пор мы рассматривали только процессы, полученные смешиванием пуассоновских процессов, но следующий результат является более общим. Обозначим через вероятность того, что на интервале происходят изменений состояния. (Хотя обозначение и похоже на смесь пуассоновских процессов, но в более общем случае вероятность может зависеть от распределения длительности интервала). Тогда очевидно, что

Пусть есть установившийся вектор, связанный с Р, так что Умножив обе части (4.51) на , находим

Отсюда следует, что также является установившимся вектором для матрицы , полученной из наблюдений. Этот результат позволяет найти предельную структуру вложенной марковской цепи. Вообще говоря, как мы увидим ниже, структура не та же, что предельная структура, наблюдаемая в некоторый отдаленный момент времени в будущем, поскольку данный метод не учитывает времени пребывания. Однако, если основной точечный процесс является таким, что среднее время пребывания одинаково для всех категорий, то в (4.52) будет одновременно и предельной структурой.

Если неоднородность содержится в переходных матрицах, а не в точечном процессе, то по наблюдению одной только можно выяснить очень мало о предельном поведении. В данном случае ситуация, по существу, такая же, как в дискретном случае, рассмотренном в гл. 2 (см. с. 50). Те индивидуумы, которые подчиняются переходной матрице , будут «оседать» на установившейся структуре, скажем, , и общая предельная структура тогда будет взвешенным средним этих предельных векторов.

ВКМ взяли свою переходную матрицу за один квартал и по (4.52) нашли установившийся вектор . В табл. 4.3 приведен пример, где сравнивается с наблюдаемой структурой.

Таблица 4.3. Действительная и предсказанная структуры занятости, полученные с использованием марковской модели и переходной матрицы за один квартал

Поскольку согласование очень хорошее, возникает вопрос: позволяет ли наш анализ предельного поведения объяснить этот факт? Результат из табл. 4.3, конечно, согласуется с гипотезой о том, что неоднородность лежит в переменных интенсивностях переходов и что система была замкнута до тех пор, пока не пришла к равновесию. Установившуюся структуру теперь можно было бы интерпретировать как структуру, связанную с вложенной марковской цепью. Последнее утверждение не подтверждало бы гипотезу о том, что Р меняется от индивидуума к индивидууму, если бы не было известно, что МС-модель может рассматриваться как частный случай такой, в которой переменная.

<< Предыдущий параграф Следующий параграф >>
Оглавление