Главная > Разное > Стохастические модели социальных процессов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.2. ПРАКТИЧЕСКИЙ ПРИМЕР ОПИСАНИЯ СИСТЕМЫ С ЗАДАННЫМ ВХОДОМ

Выживание после лечения заболевания раком. Изучение когорты

Наш первый пример — это система, в которой нет поступлений и есть два поглощающих (или конечных) состояния. Он был выбран с целью проиллюстрировать, что хорошая стохастическая модель имеет ряд достоинств по сравнению с приемами, которые иногда использовались для решения подобных задач. Это довольно упрощенный пример описания полной неопределенности, которая возникает после лечения заболевания раком. Пациент после лечения может по прошествии некоторого времени находиться в одном из множества состояний. Эти состояния могут классифицироваться, например, так: «здоров», «заболел вновь» (рецидив болезни), «мертв»; точность классификации, очевидно, зависит от целей исследования и от имеющихся возможностей по получению данных. Стохастическая модель описания жизни пациентов после лечения от заболевания раком была построена Фикс и Нейманом (1951) и обсуждалась в более общем виде Залем (1955). Фикс и Нейман применили эту модель для оценки эффективности лечения. Далее мы опишем, как они это делали. Отметим, кстати, что указанная модель достаточно общего вида, и у нее могут быть также другие приложения.

В модели Фикс и Неймана введены четыре состояния. Описание состояний и возможные переходы показаны на рис. 5.1. Авторы понимали

трудность определения состояния «выздоровел» и отметили, что было бы желательно некоторые из состояний разделить. Например, пациенты, находящиеся в состоянии могут быть разделены на две группы: те, кто умер по естественным (ненасильственным) причинам, и те, судьбу которых проследить не удалось.

Можно также предположить, что необходимо предусмотреть возможность перехода из состояния в состояние Мы не будем отклоняться в сторону, обсуждая эти детали, так как этот пример приведен прежде всего для того, чтобы проиллюстрировать применение теории марковских процессов к описанию жизни людей.

Рис. 5.1.

Первая задача в данном приложении — оценить интенсивности переходов. Для этого использовались данные о выживших, при этом сами данные были лишены недостатков, присущих в общем случае такого рода измерениям. Один из способов измерения — определение доли выживших в году. Это относительное число оставшихся в живых, по крайней мере, в течение Т лет от всех прошедших курс лечения. Такие измерения были бы удовлетворительными, если бы рак был единственной причиной смерти и если бы все больные наблюдались в течение полных Т лет. Практически так никогда не бывает, и доля выживших в году может привести к ошибочным выводам. Чтобы убедиться в неточности такого утверждения, заметим только, что измеренная интенсивность (доля) будет больше, так как следует измерить также долю тех, кто выбыл из поля зрения или умер по другим причинам, т. е. относительно большее число людей осталось бы в живых до предельного срока, если бы им суждено было умереть только от заболевания раком. Таким образом, наблюдаемые значения интенсивностей перехода зависят не только от опасности умереть от рака, но и от других причин, не имеющих отношения к заболеванию раком. Если сопоставлять по грубым интенсивностям переходов группу тех, кто прошел курс лечения, и контрольную группу, то сравнение не имело бы смысла, если бы эти две группы подвергались различным опасностям по различным причинам. Чтобы преодолеть эти естественные трудности, обычно вычисляют чистые интенсивности, которые учитывают

такие различия. Цель приведенного примера — показать, что стохастическая модель дает лучшую основу для оценки чистых интенсивностей, чем метод, используемый в страховом деле.

Интенсивности переходов между состояниями в модели Фикс и Неймана полагали постоянными величинами. Однако хорошо известно, что естественная смертность людей — непостоянная величина, и после периода младенчества она увеличивается с возрастом. В средний период жизни она не очень быстро увеличивается, и если период времени Т достаточно короткий, то предположение о постоянстве будет вполне адекватно действительности. Во всяком случае, мы покажем, что можно собирать данные таким образом, чтобы можно было проверять эти предположения. Интенсивность смерти после лечения рака разных видов широко изучается. Время жизни после лечения, как было выяснено, имеет асимметричный характер, Боаг (1949), например, сделал предположение, что оно часто может быть адекватно описано с помощью асимметричного логнормального распределения. В этом случае логнормальное распределение нелегко отличить от экспоненциального, которое появляется при постоянной интенсивности смерти. Таким образом, предположение, что интенсивность смерти от рака является постоянной величиной, вероятно, достаточно реалистично. Непосредственно проанализировать факторы, влияющие на интенсивность переходов из состояния в (выздоровление) и из состояния не представляется возможным, но кажется правдоподобным предположение о постоянстве интенсивностей потерь по разным причинам, по крайней мере для интенсивностей выпадения пациентов из поля зрения.

В нашей модели мы предполагаем, что в нулевой момент времени в состоянии находится N людей, в других состояниях людей нет. Численности людей в четырех группах в последующие моменты времени Т будут случайными величинами, которые мы обозначим через — математическое ожидание случайной величины . Наблюдая эти случайные величины в один или несколько моментов времени, можно оценить интенсивности переходов. Затем, используя оценки, можно предсказать численности различных состояний в будущем. Наиболее важна возможность оценить эти численности, если смерть от заболевания раком будет единственной причиной.

Применение теории

Расширенная матрица в описываемом случае имеет вид

где Уравнение для нахождения собственных чисел матрицы есть или

Очевидно, что это уравнение имеет два нулевых корня; два оставшихся корня, которые мы обозначим следующие:

причем для расчета возьмем положительный знак, а для — отрицательный. Тогда, используя (4.24), получим

Следующий шаг — записать и решить однородные уравнения для коэффициентов. Для начала положим будет принимать значения 2, 3 и 4. Таким образом,

Приведем три группы уравнений для и 4:

Из уравнений немедленно следует, что и, следовательно, первые уравнения в каждой группе можно опустить. Начальные условия состоят в том, что в нулевой момент времени все индивидуумы системы находятся в состоянии Предположим далее, что Если то соответствующие значения могут быть найдены просто умножением на N результата, полученного при предположении, что . Тогда в добавление к записанным выше уравнениям имеем

Для решения этих уравнений проделаем следующие преобразования. Сложим правые и левые части уравнений (5.22) и, используя начальные условия, получим

Сделав аналогичные преобразования для (5.23), будем иметь

но это уравнение может быть получено через и си из уравнения (5.23), что дает

Затем можно совместно решить однородные уравнения (5.27) и (5.28), что позволяет записать:

и, следовательно,

Сделав подобные преобразования для (5.24) и (5.25), получаем

Остается определить две константы: Используя начальные условия, находим

    (5.30)

Сейчас рассмотрим, как использовать эти результаты, чтобы сравнить интенсивности выживания. Когда величина может быть интерпретирована как вероятность находиться в состоянии - в момент времени Т. Таким образом, представляют собой соответственно грубые интенсивности смерти вследствие заболевания раком и по естественным причинам. Однако зависит также от интенсивности естественной смерти и, как мы указывали выше, это уменьшает ее величину как меру риска. На самом деле нам нужна чистая мера риска (чистая интенсивность смерти), из которой устранено влияние естественной смертности. Согласно подходу к задаче, используемому в страховом деле, чистая интенсивность смерти от рака определяется по формуле

Величина (5.32) должна давать среднее число смертей от заболевания раком на интервале (0, Т), если бы смертности по естественным причинам не было. Смысл уравнения (5.32) станет яснее, если его переписать:

Второе слагаемое в правой части уравнения (5.33) — оценка численности людей, которые умерли бы от рака в течение рассматриваемого периода, если не умерли бы по другим естественным причинам. Оно получено в предположении, что смерть от рака, вероятность которой равна одной второй, предшествует естественной смерти по другим причинам. Предлагаемая модель предоставляет другой метод для оценки чистых интенсивностей смерти от рака. Мы можем исключить влияние естественной смертности, положив Тогда чистая интенсивность записывается как

где нулевые индексы в означают, что положена равной нулю.

Применение этих результатов может быть проиллюстрировано численными примерами. Возьмем следующие значения интенсивностей переходов:

Подставляя эти величины в (5.20), для примера 1 находим:

а для примера 2:

Можно выявить одну особенность, показывающую несостоятельность метода определения интенсивности смерти, принятого в страховом деле, если рассмотреть предельное поведение (5.32) при Вместо того, чтобы стремиться к единице, как следовало бы ожидать от достаточно обоснованной меры, она стремится к значению, меньшему единицы в обоих примерах. Анализ (5.32) показывает, что этот результат всегда имеет место. Очевидно также, что в общем случае при достаточно большом Т. Некоторые численные значения содержатся в табл. 5.1.

Приведенный пример — хорошая иллюстрация использования стохастической модели для измерения социального явления. Он показывает также, что коррекция измерений с позиций «здравого смысла» может существенно обесценить проведенные измерения. Высказанные доводы предполагают, что модель адекватна описываемому явлению. Если в действительности интенсивности переходов не постоянны, то более простая статистическая оценка иногда предпочтительнее, потому

Таблица 5.1. Сравнение чистых интенсивностей смерти от рака, вычисленных с помощью метода, используемого в страховом деле, и с помощью стохастической модели

что она не зависит от распределения. Как будет показано, именно грубые методы эффективны при проверке адекватности модели.

При обсуждении модели предполагалось, что интенсивности переходов известны. На практике они не бывают известными, и их необходимо оценить по имеющимся данным. Общие методы оценивания упоминались в гл. 4, но для решения нашей задачи достаточно более простого метода Фикс и Неймана. В момент времени Т мы можем зафиксировать численности пациентов в начальный момент в каждом из четырех состояний. Эти численности могут рассматриваться как оценки для , которые в свою очередь получаются при неизвестных параметрах. В обсуждаемой модели метод позволяет получить четыре уравнения для оценки неизвестных параметров. К сожалению, эти уравнения не являются линейно независимыми, так как

где N — наблюдаемое число индивидуумов. Ситуация была бы еще хуже, если бы в матрице R были другие ненулевые интенсивности. Такие трудности можно преодолеть, исследуя состояния системы в нескольких точках оси времени. Другой метод — рассматривать некоторые другие характеристики системы, например, по предложению Фикс и Неймана, подсчитывать число пациентов, оставшихся в состоянии на интервале времени . Если материал наблюдений достаточно обширен, то можно не только оценить все параметры, но и проверить качество модели. Предельная структура может быть получена непосредственно, без проведения всех описанных вычислений, так как из (5.21) результат следует немедленно.

Из уравнений (5.30) и (5.31) получаем

Остальные предельные значения равны нулю. Таким образом, имеется простая зависимость от интенсивностей переходов. Вид этой зависимости может быть легко выявлен, если записать отношение этих величин в следующей форме:

где — отношение интенсивностей переходов из состояния «определен диагноз — заболевание раком», и — отношение интенсивностей переходов из состояния «здоров». Большая интенсивность потока выздоравливающих способствует увеличению доли тех пациентов, кто умирает по другим естественным причинам, но этому в некоторой степени будет противодействовать возможность и большей интенсивности потока рецидивов

Мы уже указывали, что модель первоначально была разработана для измерения эффективности лечения. Один из способов — рассчитать — чистую долю тех, кто умер бы от рака, при исключении влияния других причин. Фикс и Нейман приводят доводы в пользу того, что не единственная, но, видимо, наиболее подходящая мера для оценки выживания. Обсуждение этого вопроса выходит за рамки данной книги, но мы коснулись его потому, что величины будут полезны для построения других мер при дальнейших исследованиях. Например, Фикс и Нейман предполагают полезным рассчитывать среднюю длительность «нормальной» жизни в период так, как если бы рак был единственной причиной смерти. Поскольку — функция распределения длительности «нормальной» жизни при отсутствии других причин смерти, математическое ожидание может быть записано так:

или

Иерархическая кадровая система

Модели с непрерывным временем, описывающие иерархические системы, впервые были предложены Силом (1945) и Вайдой (1948). Хотя их модели немарковские, оба автора обсуждали некоторые особые случаи, которые совпадают с теми, что следуют из нашей общей теории. Рассмотрим систему, которая представлена диаграммой на рис. 5.2. Эта система имеет одно поглощающее состояние, обозначенное Продвижение возможно только на ближайшую градацию,

что изображена на схеме, а все вновь поступающие зачисляются на первую. Расширенная матрица интенсивностей переходов для описанной системы имеет вид

где

Простая треугольная структура позволяет нам получить точную формулу для собственных значений и коэффициентов которые есть в выражениях для определения переходных вероятностей

Рис. 5.2.

Отсюда мы тотчас же находим, что

Уравнения для определения коэффициентов с, полученные из (4.19), имеют вид

Начальные условия, представленные последними двумя уравнениями, следуют из того, что все вновь прибывшие начинают свою карьеру с градации 1 — низшей ступени служебной лестницы. Решение системы уравнений (5.40) дает

Представляют интерес только значения если в этом случае из (5.3) находим

Коэффициенты, полученные из (5.40), дают

и выражения для них можно подставить в (5.42). Подобные выражения могут быть найдены при соответствующих начальных условиях, но они же легко могут быть выведены из выражений для когда имеется простая иерархическая система Вновь поступивший, который начинает свою карьеру с ступени -уровневой системы, находится в том же состоянии, что и тот, который поступил на низшую (первую) ступень -уровневой системы. Заменяя на и переобозначая интенсивности переходов, найдем необходимые выражения. Ниже мы приведем пример. Очевидно, что верхний предел суммы в последнем члене выражения

Модель, которую мы описали, несколько более общего вида, чем марковская версия модели Вайды (1948). В последней предполагалось, что интенсивности поступлений и уходов постоянны, таким образом, результаты Вайды могут быть получены из наших, если положить скажем, для Мы имеем также ожидаемые численности ступеней для любого 7, а Вайда обсуждал только предельный случай.

Как мы указывали, по нескольким причинам требуется, чтобы все величины гц ) были различны. В случае, который мы сейчас обсудим, для поэтому равные Гц встречаются при равенстве интенсивностей уходов с различных ступеней. Случай, представляющий особый интерес, появляется тогда, когда для Это соответствует ситуации, в которой интенсивности продвижения и интенсивности уходов одни и те же для всех ступеней, кроме последней. Соответствующее изменение общей теории может быть получено при стремлении друг к другу собственных значений в выражении (5.43). Окончательное выражение для будет таким:

Если то выражение имеет чуть более сложный вид, но несколько ниже мы увидим, что в нем нет необходимости. Применяя тот же метод анализа, что и ранее, находим выражение для

Подставляя в (5.42) выражения (5.44) и (5.45), можно определить для , а затем из выражения

Общая численность системы в момент времени Т получается при суммировании обеих частей (5.42) по и на основании того факта, что

В результате получаем

где

Проиллюстрируем применение полученных результатов на примере системы, в которой имеются три ступени,

Для этих данных

Допустим, что поступление — экспоненциальная функция времени и что Мы оставим а как параметр для того, чтобы посмотреть его влияние на решение.

Из уравнения (5.42) получаем

Вероятность находят при подстановке в

Из этих формул очевиден решающий характер зависимости от а. Если т. е. поступление увеличивается по экспоненте, то ожидаемые размеры ступеней иерархии также растут. Если то ожидаемые размеры ступеней стремятся к нулю с течением времени. Читатель может сравнить эти результаты с теми, которые получены в

гл. 3 для модели с дискретным временем и поступлениями, растущими по закону геометрической прогрессии. В случае поступления постоянны и численности стремятся к определенным пределам при Эти пределы равны:

а средний размер равен 50. Последний результат может быть получен на основании того, что среднее время пребывания в системе и что поступление составляет 100 человек в единицу времени. Окончательный размер, конечно, не зависит от начального размера, а значения параметров, которые мы выбираем, приводят к уменьшению средних размеров с 170 до 50. Изучение (5.49) показывает, что для низших ступеней системы предельные значения достигаются быстрее, чем для средних и высших. Мы наблюдали то же явление и в модели с дискретным временем.

Интересно заметить, что зависимость относительных размеров от а для больших Т имеет очень простую форму. Если то

Влияние увеличения интенсивности поступлений заключается в увеличении размеров двух низших ступеней относительно высших. И напротив, уменьшение интенсивности поступлений ведет к накоплению на высшей ступени иерархии. Если бы мы повторили эти вычисления для больших значений k, то нашли бы, что при больших Т численности ступеней относились бы друг к другу как члены геометрической прогрессии, кроме численности ступени. В особенности этот результат имеет место для случая когда поступления постоянны. Тогда имеем

где R — интенсивность поступлений в систему. Таким образом, делаем вывод, что иерархическая система с постоянными интенсивностями продвижения, с постоянными интенсивностями уходов и поступлений стремится к геометрической структуре ступеней. Исключение из этого общего правила заключается в том, что численность ступени будет больше, чем если бы она вычислялась как член геометрической прогрессии

при Система указанного типа стремится к структуре типа перевернутой пирамиды. Если имеет форму экспоненты, то полученный результат характерен также для ожидаемых относительных численностей ступеней. Позднее в этой главе мы увидим, что такой общий вывод верен и при невыполнении некоторых специфических допущений данной модели.

<< Предыдущий параграф Следующий параграф >>
Оглавление