Главная > Разное > Стохастические модели социальных процессов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

7.2. МОДЕЛИ ВРЕМЕНИ ПРЕБЫВАНИЯ В СОСТОЯНИИ

Время пребывания в состоянии изучалось не только в общественных науках. Наиболее известные и развитые приложения — теория надежности и технические испытания. Существует много общего между работами в этих областях и тем, о чем пойдет речь в настоящей главе. Однако различие между социальными и техническими приложениями весьма существенно. При технических испытаниях центральную роль играет экспоненциальное распределение, так как вероятность отказа многих типов оборудования почти не зависит от срока службы. Там, где не подходит экспоненциальное распределение, часто используются распределение Вейбулла и гамма-распределение. Ни одно из этих распределений не играет существенной роли в приложениях, с которыми мы будем иметь дело, хотя в следующем разделе мы обсудим экспоненциальное распределение. Другими словами, типы моделей, удовлетворительные при описании времени жизни технических

элементов, редко подходят для описания времени пребывания в состояниях социальных систем. Мы начнем с моделирования продолжительности занятости человека (полного срока службы, ПСС), но осветим и другие приложения.

Нам потребуются следующие термины и обозначения. Пусть Т — продолжительность пребывания в интересующем нас состоянии; мы не различаем при обозначении, является эта величина случайной или ее реализацией; Т — непрерывная величина. Функция распределения Т — главный объект изучения. Сформируем три эквивалентные формы ее представления.

а) Функция дожития. Это вероятность того, что индивидуум пробудет в данном состоянии интервал времени Т. Обозначим ее G (Т). Функция дожития в сумме с функцией распределения F (Т) дает 1, но G (Т) более подходит для практических целей.

б) Плотность функции полного срока службы (ПСС). Плотность функции F (Т) связана с функцией дожития следующим соотношением:

в) Интенсивность (или скорость) уходов (или потерь). Она обозначается X (Т) и определяется следующим образом:

уход на интервале в момент времени Т находился в системе .

Эта функция в различных приложениях называется по-разному. В теории надежности и технических испытаниях она известна как опасность отказов, функция риска, повозрастная интенсивность выхода из строя или, более просто, интенсивность выхода элементов из строя. При страховании ее называют силой или коэффициентом смертности, а в кадровых приложениях образно определяют как силу или стремление к отделению или склонность к уходу из системы. В гл. 4 и 5 она определена как интенсивность уходов, и здесь мы будем употреблять ту же терминологию. Соотношения между X (Т), G (Т) и легко выводятся:

Следовательно,

и, наоборот,

В приложениях к описаниям увольнений или потерь рабочей силы функция X (Т) четко отражает процесс уходов, позволяя по конкретным срокам работы определить моменты, когда интенсивности уходов особенно велики или малы.

На практике иногда проще получить оценку либо для одной, либо для другой функции, но мы можем легко перейти от одного вида к другому с помощью приведенных выше соотношений. В большинстве случаев при построении моделей основное внимание уделяют функциям , но интерпретировать модель лучше, используя X (Т). Данные для оценки этих функций редко представлены в виде простой случайной выборки. Чаще всего они состоят из цензурированных нижней границей сроков работы когорты или результатов переписи, полученных за короткие интервалы времени, относительно численностей групп и потоков между ними.

Экспоненциальное и смешанное экспоненциальное распределения

Рис и его соавторы (1950) в своей работе привели несколько эмпирических распределений ПСС, полученных при исследовании Гласиерской металлургической компании. Они заметили, что некоторые из распределений можно представить в виде -образных кривых гиперболической формы, но они не предложили какой-либо теоретической модели для объяснения этого явления. Силкок (1954) пересмотрел литературу, в которой были данные о текучести, и предложил две модели, соответствующие распределениям ПСС. Его первая модель была основана на замечании Риса и его соавторов (1950) о том, что они обнаружили регулярность в текучести, которая является характерной особенностью фирмы и не зависит от экономических и социальных факторов, действующих вне фирмы. Силкок свел это к тому, что принял для простоты постоянными интенсивности уходов, и показал, что это в свою очередь ведет к экспоненциальному распределению ПСС. Весьма сомнительно, что интерпретация Силкока оправдана, так как интенсивность уходов зависит от действующих внутри фирмы факторов, включая стаж работы индивидуума. Тем не менее экспоненциальный случай позволяет получить пробный вариант описания процесса уходов и прокладывает дорогу более точным моделям. Экспоненциальное распределение Силкок применил для описания нескольких распределений ПСС и каждый раз согласие было слабым. В табл. 7.1 приведены два примера, из которых видно, что распределение наблюдаемых значений всегда более асимметрично, чем соответствующее экспоненциальное распределение. По наблюдениям в течение 21 месяца невозможно узнать, какой вид будет у оставшейся части последовательности, но из приведенных данных ясно, что гипотеза об экспоненциальности несправедлива. Опыт Силкока подтверждается почти всеми последующими исследованиями.

Вторая модель, предложенная Силкоком (1954), обобщает первую. В ней также остается упрощающее предположение о постоянстве интенсивности уходов индивидуумов, но предполагается, что она своя для каждого индивидуума в популяции, из которой осуществляются

Таблица 7.1. Наблюдаемые и аппроксимированные распределения полного срока службы для двух фирм (см. скан)

уходы. Это очень плодотворная гипотеза. Люди отличаются друг от друга во всех аспектах поведения, и было бы удивительным, если бы их склонность к уходу с работы была исключением. Обозначим постоянную интенсивность уходов через X, тогда для любого индивидуума плотность распределения будет следующей:

Предположим теперь, что X — случайная величина с функцией распределения Тогда распределение ПСС для выборки из всех занятых будет иметь плотность

Это распределение всегда более скошенное, чем экспоненциальное с постоянным средним значением, и, следовательно, оно обладает той же особенностью, что и исходные данные. Частичное объяснение этого можно найти, если рассмотреть отношение

где

Для малых Т

так как арифметическое среднее всегда, по крайней мере, меньше, чем геометрическое среднее. Равенство имеет место только в вырожденном случае, когда функция, сосредоточенная в одной точке. Для больших Т запишем:

При значение интеграла стремится к нулю, при оно стремится к бесконечности. Как только распределение таково, что оно дает отличное от 0 или 1 значение вероятностей тех X, которые больше то Получена другая граница рассматриваемого случая, если только не вырождается в точку.

Для того чтобы (7.3) согласовать с данными, нужно взять конкретное . Силкок (1954) выбирает для нее гамма-распределение с плотностью

и показывает, что

Соответствующие выражения для функции дожития и интенсивности потерь имеют вид

Это -образное распределение из семейства Пирсона, которое классифицируется как тип XI. Функция интенсивности потерь имеет очень простой вид, она показывает монотонное уменьшение склонности к уходу в зависимости от увеличения времени пребывания в состоянии. С первого взгляда может показаться парадоксальным, что уменьшение X (Т) получилось при принятии постоянной интенсивности уходов для индивидуумов. Однако в группе индивидуумов, которую мы рассматриваем, не все имеют одну и ту же интенсивность ухода. Чем дольше индивидуумы группы работали в организации, тем более вероятно, что у них будет меньшее значение X. Таким образом, получаем соответствующее уменьшение X с течением времени. Когда Силкок (1954) описал имеющиеся данные этим распределением, он получил гораздо лучшее совпадение. Некоторые результаты вычислений Силкока приведены в табл. 7.1 (модель типа XI).

Гамма-распределение X, использованное выше, достаточно гибко, так как оно зависит от двух параметров. Его главное преимущество при применении заключается в возможности проводить анализ с помощью

математических методов. Однако частный вид функции, который рассматривался здесь, не является определяющим. Точное выражение для можно получить еще, используя сопряженное гамма-распределение. Представляет интерес случай

когда сама становится -образным гамма-распределением. Для некоторых случаев удобнее положить, что X принимает только два значения, скажем, Если соответствующие вероятности равны , то распределение ПСС будет иметь вид

Эта двучленная смесь экспоненциальных распределений рассмотрена в гл. 4. Она была применена Бартоломью (1959) для исходных данных Силкока и позволила получить результаты, приведенные в табл. 7.1. Разницу между смесью экспоненциальных распределений и распределением типа XI в этих двух примерах трудно обнаружить, несмотря на радикальное отличие вида функции Н (X) в этих двух случаях.

Дальнейшие исследования не позволяют заключить, что «смешанные» модели, предложенные Силкоком (1954), дают верное описание процесса уходов. Существуют другие модели, которые дают лучшее согласование с исходными данными, и, по крайней мере, одна из них позволяет получить тот же вид функции ). Если модель отражает хоть в какой-то степени истинное положение вещей, то ее уже можно применять для управления персоналом. Так, согласно модели существует естественная разница между индивидуумами, и способ управления процессом увольнений заключается в том, что все работники классифицируются по группам. Если мы могли определить людей с меньшими или большими значениями X, то заработную плату можно было бы уменьшить или увеличить в соответствии с этой классификацией. В модели предполагается, что у нас нет эффективных методов классификации людей по их склонности к уходу из системы. Это задача психологов, но успех их методов должен быть, конечно, проверен статистически.

Ясно, что двучленная смесь экспоненциальных распределений может быть заменена распределением с тремя и более членами, но число параметров при этом увеличивается очень быстро, что затрудняет применение, так как для определения параметров требуется большое число данных. В следующем разделе и в гл. 8 мы встретимся с распределением вида

Если неотрицательны, то оно принадлежит к классу распределений (7.3), но это не обязательно. Когда модели разного рода приводят к одному и тому же распределению ПСС с положительными то не существует статистических методов их различия, использующих исходные данные только о сроках службы.

Сетевые модели

Интересный класс моделей процесса уходов из системы может быть получен при использовании марковского процесса, описывающего переходы индивидуумов из одного внутреннего (гипотетического) состояния в другое перед тем, как покинуть систему. Хербст (1963) первым предложил этот подход с применением так называемой модели процесса принятия решения. Аналогичные модели, хотя и с различными интерпретациями, были рассмотрены Хоемом (1971) для непрерывного времени, а Янгом (1971) и Файхтингером (1971) для дискретного времени. Весьма схожая модель в приложении к описанию процесса выживания после лечения заболевания раком обсуждалась в гл. 5, но там не изучалось время жизни. Особенность модели Хербста состоит в том, что в ней промежуточные состояния скрыты, т. е. непосредственно их наблюдать нельзя.

Рис. 7.1. Возможные состояния марковского процесса для модели, описывающей процесс уходов

Хербст убедительно показывает, почему состояния, которые им определены в модели, соответствуют тому, что происходит в действительности, но об их существовании можно судить только косвенно по форме наблюдаемого распределения ПСС.

Модель легко объяснить, если обратиться к рис. 7.1. Каждый индивидуум по предположению поступает в систему в непредрешенное состояние, а затем проходит путь по сети до одного из поглощающих состояний 54 и Все, что мы можем наблюдать на практике, это время, затраченное на достижение состояния , обо всех остальных качествах системы можно судить только по виду распределения ПСС. Движение по сети характеризуется множеством интенсивностей переходов, обозначенных на рисунке через . Таким образом, модель

системы — это марковский процесс с непрерывным Временем (см. гл. 4) с матрицей интенсивностей переходов.

где как матрица треугольного вида, ее собственные значения равны ее диагональным элементам из (4.16) можно интерпретировать как вероятности пребывания в состоянии в момент времени Т, если в начальный момент времени один индивидуум находится в первом состоянии. Тогда функция дожития определяется выражением

Хербст поставил вопрос, дает ли предлагаемая модель адекватное описание переходам в организационной системе. Далее он сравнил (7.11) сданными Хедберга (1961) о распределении времени пребывания по двум фирмам. В фирме А уходов в единицу времени больше, чем в фирме В. Необходимо оценить семь параметров, и это очень много, если исходные данные не представляют собой большую совокупность. К счастью, Хербст располагал очень большой выборкой, и по точкам были получены оценки для параметров. Оцененные функции имели вид:

Фирма А:

    (7.12)

Фирма В:

    (7.13)

Для фирмы практически равен бесконечности. Наблюдаемые и полученные по модели значения G (Т) приведены в табл. 7.2. Сходство для такой большой выборки замечательное, и отсюда следует, что теория Хербста достаточно удачна. Распределения могут быть получены и как смесь экспоненциальных распределений. (Правда, в этом случае имеется отрицательный коэффициент при описании функции дожития для фирмы А, но его влияние незначительно.) Заметим, что первое слагаемое в одном и другом выражениях не зависит от Т, поэтому можно считать, что функция дожития порождается экспоненциальным распределением с бесконечным средним значением. Оно отражает долю людей, которые в конечном счете достигают категории окончательного постоянства.

Очевидно, что задача статистической оценки параметров требует дальнейших исследований. Свердруп (1965) и Хоем (1971) рассмотрели случай, когда исходные данные представляют собой значения переходов индивидуумов. Если применить эти результаты к приведенному

Таблица 7.2. Наблюдаемые значения и оценки по выражению (данные Хедберга) (см. скан)

примеру, то мы увидим, что совпадение настолько хорошее, что более эффективные процедуры были бы излишни.

Описанный выше метод получения распределения ПСС весьма общий. Он применим, когда Р — матрица любой размерности.

До сих пор наше внимание было сосредоточено на моделях, которые описывают системы с единственным выходом. Имеется много приложений, когда выходов несколько, например, когда увольняющиеся классифицируются по причинам увольнения. В терминах страхового дела в проблему вписываются убыли (смерть) по разным причинам. Если нас интересует общее время пребывания в системе независимо от причин ухода, то требуется только определить все поглощающие, или конечные, состояния, не различая их. С другой стороны, если можно классифицировать увольняющихся по причинам увольнения, то мы получим распределения длительности пребывания в системе по соответствующим группам.

Чтобы проиллюстрировать предлагаемый метод, предположим, что состояние 4 в модели Хербста называется «объявленные лишними из-за сокращения штатов» вместо «принятые на постоянную работу».

Тогда мы могли бы рассмотреть два условных распределения времени пребывания в системе для тех, кого увольняют по сокращению штатов, и тех, кто уходит по собственному желанию. Для тех, кто уходит по собственному желанию, существует простое выражение условной вероятности, позволяющее получить следующую функцию дожития:

где — вероятность уходов в состояние 5.

Модели случайного блуждания

Если рассматривать время как случайные шаги в направлении достижения поглощающего экрана, то мы получим другой тип модели. Идея модели была впервые высказана Ланкастером (1972), который предложил базовую модель для описания продолжительности забастовки. Мы возьмем за основу это приложение, ссылаясь, если потребуется, на другие.

Забастовки начинаются как последнее средство, когда конфликтующие стороны не могут прийти к соглашению. Вначале допустим, что возможности проведения забастовки ограничены некоторой «величиной d». Можно считать, что эта величина — сумма денег, которая должна быть выплачена, когда конфликт прекращается. Однако предмет конфликта может быть и более сложным. По мере того, как забастовка развивается, расхождение между позициями сторон меняется, так как начинают влиять новые факторы; затруднения и потери, обусловленные забастовкой, приводят к ее концу. Модель Ланкастера — описание пути к прекращению конфликта, использующее понятия теории вероятностей.

Прогресс в переговорах может быть представлен графически, как это показано на рис. 7.2. Точки на графике — это промежуточные шаги в переговорах. Когда путь достигает горизонтальной линии, конфликт прекращается, и тогда продолжительность забастовки выражается расстоянием от начальной точки оси времени до проекции точки пересечения. Ланкастер предложил считать путь переговоров винеровским процессом. Это означает, что при переходе от точки Т к приращение по оси ординат — случайная величина, распределенная по нормальному закону со средним и дисперсией независимо от предыдущих приращений. Свойства этого процесса хорошо известны (см., например, работу Кокса и Миллера (1965)). Время до поглощения конечно (с вероятностью 1) только тогда, когда т. е. тогда, когда процесс имеет неотрицательный «снос», и плотность функции распределения времени до поглощения представляет собой выражение

Это распределение известно как сопряженное к гауссовскому, его свойства описаны, например, в книге Чхикара и Фольке (1978). Если то время до поглощения не обязательно конечно, т. е. вероятность того, что Т — бесконечность, неотрицательна и равна Распределение описывается тогда как усеченное. Хотя в (7.15) появляются три параметра, распределение, сопряженное к гауссовскому, — распределение с двумя параметрами, так как его функция плотности может быть выражена через Ланкастер (1972 применил его для описания длительности забастовок в Англии и как показано в табл. 7.3, добился значительного успеха.

Рис. 7.2. Длительность случайного блуждания до поглощения на границе

Итон и Уайтмор (1977) предложили ту же модель для описания времени пребывания больных шизофренией в психиатрической больнице, хотя Ван Корфф (1979) показал, что двучленная смесь экспоненциальных распределений лучше согласуется с исходными данными. В этом приложении d — число «выздоровевших», т. е. пациентов, которых можно выписывать. Согласно модели процесс лечения идет к окончанию как случайный процесс, т. е. представляет собой винеровский процесс. Отрицательный снос объясняется тем, что болезни не всегда поддаются лечению, и может произойти смерть пациента или принято решение о постоянной госпитализации. Модель применима также для описания процесса увольнений. В этом случае можно представить, что недовольство накапливается и достигает критического уровня, когда работник заявляет о своем уходе. Уайтмор (1979) говорил о приводящей к такого же рода финалу эррозии «преданности» организации. Он применил свою модель для описания данных Силкока (1954), включая данные Бибби, представленные в табл. 7.1.

Таблица 7.3. Согласие распределения, сопряженного к гауссовскому, с продолжительностью забастовок, начавшихся в 1965 г. в британской промышленности (Ланкастер, 1972)

Согласование было блестящим, даже лучше, чем при различных смесях экспоненциальных моделей.

Винеровский процесс — один из многих процессов случайного блуждания, которые могут быть использованы при непрерывном и дискретном времени. Как показано в работе Уайтмора (1979), можно обобщать метод смеси распределений, полагая, что параметры — случайные величины.

<< Предыдущий параграф Следующий параграф >>
Оглавление