Главная > Разное > Наука об управлении байесовский подход
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Глава 3. ОПЫТ УПРАВЛЕНИЯ И ОБУЧЕНИЕ

Шкалирование суждений

Следующая проблема, с которой мы сталкиваемся на первом этапе выполнения очерченной программы, состоит в выявлении и использовании прошлого опыта человека, принимающего решение. В настоящей главе мы рассмотрим в простейшей форме основную идею логической схемы адаптивного обучения — пересмотр сложившихся мнений в свете новой информации. В следующей главе мы займемся сходной проблемой — определением шкалы предпочтений принимающего решение лица. Это приведет нас в итоге к теории принятия решений, которая объединит основанные на прошлом опыте суждения, их пересмотр в свете новой информации и имеющейся у руководителя системы предпочтений в единую логически согласованную схему выбора.

При рассмотрении суждений следует помнить, что разные люди отличаются друг от друга не только имеющимся у них опытом, но и способностью к извлечению из памяти и обобщению накопленного опыта. Поэтому их суждения о будущем тоже будут различны. В силу этих причин мы называем такие суждения субъективными. Но требуется большая осторожность, когда мы беремся за программу, целью которой является исключение «субъективных суждений» и нахождение способа их «объективизации». Ведь именно суждение, основанное на личном опыте, является одним из наиболее ценных качеств любого администратора. Возможно даже, что оно является самым существенным компонентом наиболее интересных решений в области управления. Поэтому любая программа, рассчитанная на оказание помощи руководителю при принятии решений, но не учитывающая этого обстоятельства, рискует оказаться нереалистичной и будет отвергнута руководителями как «сугубо теоретическая». Конечно, никому не нужны

случайные, плохо продуманные мнения, почти или вовсе не опирающиеся на опыт, даже если их и назвать субъективными. Речь идет об обоснованных мнениях умных и рассудительных руководителей, опирающихся, как правило, на богатый опыт.

Итак, первая стоящая перед нами задача — выявить и сформулировать суждения ответственного за решение лица относительно тех или иных событий, т. е. образовать «шкалу» этих суждений. Прежде чем выбрать какой-либо метод шкалирования, прибегают к особому методу, позволяющему посредством достаточно простых расчетов проверить, согласуются ли суждения друг с другом. Логическая согласованность, или непротиворечивость (consistency), суждений здесь определяется в соответствии с некоторыми обычными правилами разумного поведения, но мы на время отложим обсуждение точного смысла этого понятия.

Вообще говоря, от человека, принимающего решение, не требуется понимания теории, используемой для выражения его суждений. Он вовсе не обязан знать точный смысл таких понятий, как «вероятность» или «полезность». От него требуется лишь желание и способность принимать решения в некоторых простых ситуациях. Так как руководитель, как правило, - лицо, в основном занимающееся принятием решений, это требование вполне резонно. У нас есть значительная свобода выбора пробных задач на принятие решения, предъявляемых руководителю. Мы можем ставить задачи, представляющие особый интерес или имеющие особое значение для руководителя, или же такие задачи, которые приводят к тщательно продуманным ответам или к решениям, логические следствия которых он особенно охотно склонен будет принять. Здесь снова следует подчеркнуть, что рассматриваемые задачи на принятие решений, хотя и являются простыми, могут поначалу показаться непривычными и трудными. Руководителю, безусловно, потребуется некоторая тренировка и дисциплина, чтобы дать содержательные ответы на поставленные вопросы.

Базисный эксперимент

В основе шкалирования лежит эксперимент, имеющий несколько возможных исходов и предназначенный для выявления присущего руководителю поведения в специально

подобранной ситуации принятия решения. Предлагаемый эксперимент имеет N возможных исходов, пронумерованных числами и характеризующихся тем, что если руководителю предлагается выбор между двумя альтернативами:

значительный выигрыш при исходе i и ничего в остальных случаях;

тот же выигрыш при исходе и ничего в остальных случаях,

то испытуемому безразлично, какую из альтернатив выбрать, независимо от того, какой из исходов, i или наступит. Безразличие (indifference) означает, что если выбор будет произведен за него кем-либо другим и будет выбрана альтернатива то руководитель не склонен будет прилагать усилия, чтобы выбор изменился в пользу альтернативы Мы можем, например, выбрать в качестве основного, или базисного, эксперимента (basic reference experiment) лотерею, имеющую N билетов, из которых должен быть извлечен один, рассматриваемый нами как потенциально выигрышный. Если нашему испытуемому безразлично, какой именно билет выбрать, хотя бы первый попавшийся, то эксперимент с лотереей удовлетворяет необходимым требованиям базисного эксперимента.

Предположим, что поведение человека, принимающего решение, удовлетворяет еще одному довольно естественному условию. Пусть нужно сделать выбор между

большая премия (выигрыш), если будет иметь место любой из исходов, и ничего в остальных случаях; та же премия, если будет иметь место любой из у исходов, и ничего в остальных случаях.

Тогда (в этом и заключается наше условие) выбирающий отдает предпочтение по сравнению с в том и только в том случае, если больше у.

Относительно базисного эксперимента очень важно запомнить следующее. Единственное требование состоит в том, чтобы руководитель проявил в процессе эксперимента определенный тип поведения. При этом не требуется, чтобы он считал все исходы равновозможными или имеющими «равную вероятность», хотя он может думать и так, если захочет. Не предполагается также, что исходы эксперимента

имеют практически равные относительные частоты при большом числе повторений эксперимента.

С другой стороны, мы, как ученые, вправе выбрать любой язык и любую структуру, полезные для «объяснения» поведения при принятии решения. Разумеется, мы стремимся к созданию теории, позволяющей предсказывать, каким образом, действуя в соответствии с ней, руководитель будет в будущем осуществлять выбор в задачах принятия решения. Следовательно, такую теорию можно будет использовать как. руководство при выборе альтернативы в ситуациях принятия решения.

Что касается суждений руководителя об исходах базисного эксперимента, то здесь естественно говорить, что он считает их «равновероятными»; мы так и будем делать. Это, однако, не необходимо, так как мы могли бы просто прошкалировать его суждения, присваивая каждому экспериментальному исходу определенное число, или «вес». Иными словами, мы могли бы отразить его безразличие к выбору, связывая с каждым экспериментальным исходом произвольно выбранное число k. Для дальнейшего полезно будет выбрать k равным хотя пока это число может показаться столь же хорошим или плохим, как и любое другое.

Для определенности допустим, что мы действительно нашли лотерею с N билетами, по отношению к которым человек, принимающий решения, обнаруживает безразличие в указанном выше смысле. Используя базисный эксперимент с лотереей в качестве инструмента шкалирования, мы можем теперь сделать эксплицитными (т. е. выразить в явной форме) суждения человека о событиях, ожидаемых в сфере его деловой активности. Рассмотрим какое-либо реальное событие Руководителя спрашивают, каков будет его выбор, если ему приходится выбирать между контрактом, сулящим большой доход в случае, если произойдет событие и не приносящим никакого дохода при отсутствии события и некоторым числом билетов нашей эталонной лотереи, выигрышный билет которой принесет такой же доход. Мы хотим найти число билетов которое он сочтет столь же желательным, что и контракт, подразумевающий событие Можно испытать несколько значений подбирая их до тех пор, пока не будет найдено то значение,

при котором руководитель безразличен к выбору, или же можно сразу спросить, каково должно быть значение чтобы его отношение к выбору характеризовалось безразличием. Вопрос о том, как наиболее быстро найти правильную величину связан с некоторой трудностью психологического порядка, но в настоящий момент мы просто предположим, что это можно сделать.

Рассмотрим этот конкретный пример принятия решения с более общей точки зрения. Свяжем с число называемое «весом», и обозначим его Вполне разумным кажется следующее предположение: если человек рассматривает событие как невозможное, он будет безразличен к выбору при если он рассматривает как достоверное событие, безразличие к выбору может иметь для него место только в случае, если он может приобрести все билеты, т. е. при Если он не уверен, что наверняка произойдет или что вообще не может произойти, то безразличие наступит при некотором значении лежащем между 0 и N. Таким образом, вес будет числом в интервале от 0 до 1 включительно, где 0 означает невозможность наступления что наступление следует считать достоверным событием.

Рассмотрим два взаимно исключающие друг друга события и предположим, что руководителю предлагается контракт (называемый контрактом А) с большой прибылью, если наступает либо либо Как и раньше, предположим, что имеется некоторое число лотерейных билетов, которые он был бы как раз согласен обменять на контракт. Обозначим это число Второй контракт В предлагает ту же прибыль, если наступит третий контракт С предлагает ту же прибыль, если наступает Предположим, что руководителю безразличен выбор между В и билетами и между С к билетами. Тогда можно составить еще один контракт D, объединяющий контракты В и С. Так как условия контрактов А и D тождественны, можно предположить, что руководителю безразлично, какой из них выбрать. Принцип логически обоснованного поведения, который будет в явном виде сформулирован позднее, заключается в следующем: если руководителю безразлично, выбрать ли В или билетов лотереи, то можно образовать контракт D, состоящий из билетов и контракта С, и

тогда ему будет безразлично, выбрать ли D или D. Далее, D можно видоизменить подстановкой билетов лотереи вместо контракта С, что приведет к контракту который состоит просто из билетов. В силу того же принципа можно ожидать, что ему будет безразличен выбор между D" и D, D" и D и далее D" и А. Безразличие к выбору можно выразить следующим образом:

или через веса

Это означает, что, если два взаимно исключающих события сгруппированы в одно составное событие, вес этого события будет равен сумме весов исходных событий. Все это нужно нам для того, чтобы показать, что, если указанные выше предположения выполняются, свойства весов в точности эквивалентны основным аксиомам математической теории вероятности, которые можно сформулировать в следующем виде:

а) вероятность есть число, лежащее в области от О до 1 включительно;

б) вероятность множества событий, которые в сумме образуют достоверное событие, равна 1;

в) вероятность любого из двух взаимно исключающих событий есть сумма их вероятностей.

Тем самым становится оправданным использование математического аппарата теории вероятностей при вычислении приписываемых событиям весов. По этой причине указанные веса обычно называются «вероятностями».

Согласованность

Возможность привлечения хорошо развитого аппарата теории вероятностей для вычисления весов является настолько полезной и важной, что мы примем перечисленные выше аксиомы как условия, в соответствии с которыми происходит назначение весов. Далее, если ответам опрашиваемого лица не хватает требуемой непротиворечивости и последовательности, можно указать ему на это в надежде, что он захочет пересмотреть свои решения, касающиеся шкалирования. Мы вовсе не предполагаем, что логика поведения

людей согласуется с теорией вероятностей, но надеемся, что преимущества такого поведения побудят их добиваться этого. Вместе с тем мы считаем, что большинство принимающих решения разделяют широко распространенное мнение, что действовать эффективно и в согласии с собственным опытом — значит следовать разумным принципам. Поступать иначе означало бы подвергать себя опасности принимать решения, которые не удовлетворяют нас при тщательном рассмотрении логических связей между мнениями, предпочтениями и действиями. Другими словами, предполагается, что руководители предпочитают принимать сложные решения так, чтобы при этом понимать, что именно они делают.

Человек, убежденный, что вероятность выпадения «герба» при бросании монеты равна но после того как он десять раз подряд наблюдал выпадение «решетки», начавший верить, что вероятность выпадения герба в следующем, одиннадцатом бросании будет отлична от на наш взгляд, является непоследовательным в своих мнениях. Такого человека легко можно вовлечь в азартные игры, в которых он с тем большей вероятностью будет проигрывать, чем чаще будет в них участвовать. Человека, считающего, что при двукратном бросании монеты имеются три равновероятных исхода (две «решетки», два «герба», одна «решетка» и один «герб»), можно втянуть в ряд азартных игр, которые принесут ему проигрыш. Предположим, что он согласен принимать участие в таких играх, если его средний выигрыш (например, в долларах) является положительным. В таком случае возможно, что его удастся вовлечь в игру, определяемую одним из четырех перечисленных ниже правил при начальной ставке в 0,8 долл.:

1) выигрыш 3 долл., если оба раза выпадает «герб»;

2) выигрыш 3 долл., если оба раза выпадает «решетка»;

3) выигрыш 3 долл., если первый раз выпадает «герб», а второй раз — «решетка»;

4) выигрыш 3 долл., если первый раз выпадает «решетка», а второй раз — «герб».

Если он считает, что каждый исход имеет вероятность, равную , то каждая из четырех возможностей будет иметь для него положительный ожидаемый выигрыш и он может принять все четыре. Ясно, что он заплатит 3,2 долл.

а выиграет только 3 долл. В этом простом примере непоследовательность его мышления очевидна и требует исправления; но в более сложных задачах последствия принятия решения могут оказаться просто зловещими. Тем не менее нетрудно найти людей, убежденных, что при двукратном бросании монеты имеется три равновероятных исхода.

Мы, разумеется, будем заниматься случаями, в которых логическая несогласованность менее очевидна. Например, если человек хотел бы вложить свои деньги в акции с тем, чтобы максимизировать ожидаемый денежный выигрыш, то для него неразумно дробить свой вклад между несколькими выпусками акций. Ему следует вкладывать деньги в один выпуск, если он действительно хочет максимизировать ожидаемый денежный выигрыш. Это менее очевидный вывод, имеющий, однако, потенциально большое значение.

Содержательный смысл вводимых весов

Предположим, что человеку предлагают угадать, является ли верхняя карта в хорошо перетасованной колоде тузом или какой-то трефовой картой, и вознаграждают его за правильный ответ. Он называет трефовую карту, и мы считаем его догадку «разумной», «интуитивно удовлетворительной», «логичной» или описываем ее в каких-то других терминах. Мы находим естественным прибегать к догадкам в таких ситуациях. В этом смысле наша программа приписывания весов просто пытается ,уловить то, что разумные люди делают так или иначе. Хотя большинство ситуаций в реальном мире не столь просты, как пример с колодой карт, аналогичный способ рассуждений можно найти и там. Люди покупают акции именно потому, что считают «более вероятным» повышение их стоимости на 10 пунктов в течение полугода, нежели понижение на 10 пунктов за тот же период. Тем не менее если их попросят ответить, насколько же более вероятным они считают повышение, т. е. попросят дать количественную оценку своего убеждения, то они обычно оказываются в затруднении. При принятии решений в области управления естествен неформальный и качественный образ мышления, который вполне оправдывает себя в простых случаях. В сложных ситуациях

он уже не пригоден. Наука управления указывает, что справиться со сложностью можно лишь тогда, когда мы переходим от «естественных», неформальных, качественных процессов мышления к формализованным, количественным, хотя, к сожалению, несколько неестественным, способам представления решений. Можно спросить, однако, когда предпочтительнее для человека, принимающего решение, полагаться на интуицию — в случае простых или в случае сложных решений? Нам кажется, что его опыт должен ему подсказать, что предпочтительнее иметь дело на интуитивном уровне с простыми, а не со сложными решениями.

Итак, мы предполагаем, что можно найти эксперимент, содержащий какую-то мысленную или реальную модель ситуации со случайными исходами (chance device), по отношению к которой лицо, принимающее решение, обнаруживает определенный способ поведения. Его поведение при принятии решения будет таким, как будто исходы эксперимента являются равновероятными. Далее мы полагаем, что его суждения относительно какого-либо события, представляющего для него актуальный интерес, могут быть прошкалированы с помощью его ответов на вопрос, как бы он вел себя в некоторых простых ситуациях принятия решения. Событием может быть заключение выгодного контракта, достижение -ного увеличения сбыта продукции в следующем году, выполнение производственного графика и т. д. Руководитель должен уметь указать свои предпочтения по отношению, скажем, к таким альтернативам: большой доход, если фирме удастся получить некоторый контракт; билетов лотереи, содержащей N билетов, в которой «выигрышный» билет дает тот же доход, что и заключенный в первом случае контракт. Следует обратить внимание на следующие стороны данного метода шкалирования суждений:

1. Мы предполагаем, что информация о том, как человек принимает решения в простых модельных ситуациях, носит объективный характер в том смысле, что этот человек впоследствии будет вести себя аналогичным образом и в реальных ситуациях, требующих принятия решения. Иногда возражают, что разница между тем, что люди, по их собственным словам, хотят делать и их фактическими поступками сводит

на нет всякое изучение поведения такими методами. Иначе говоря, истинное представление о суждениях принимающего решения можно получить только путем изучения его поведения в ряде реальных решений в деловой сфере. Об этом всегда нужно помнить, так же как и о самой трудной задаче — выведении суждений из сложного и отчасти неявно выраженного процесса принятия деловых решений. Мы должны попытаться помочь руководителю осмыслить сложившуюся у него систему предпочтений и выразить ее так, чтобы в выводимые нами суждения не вкралось недопонимание и смешение понятий. Мы должны также стараться побудить человека, принимающего решение, тщательно обдумывать свои ответы и точно сообщать их. У него не должно быть повода пытаться вводить нас в заблуждение. Он должен понимать, что вся программа зависит от такого шкалирования его суждений, при котором он охотно готов будет принять их логические следствия.

2. Не следует думать, что все это удастся выполнить при первой же встрече с руководителем. Ввиду специфического характера рассматриваемых решений для этого потребуется много времени, работы и сил. Мы должны вызвать у руководителя желание сотрудничать, указывая ему на возможные последствия его решений.

3. Частью необходимой практической работы является мысленная проверка готовности человека принять следствия его собственных шкалированных суждений. Столкнувшись со следствиями, которые кажутся ему неприемлемыми, он может пожелать пересмотреть свои ответы на те задачи принятия решения, из которых мы исходили при шкалировании суждений. В этом смысле процесс является экспериментальным: мы непрерывно проверяем готовность испытуемого принять логические следствия его поведения.

4. Мы не предполагаем, что руководитель действительно захочет прекратить свою деловую активность и вместо этого купить лотерейные билеты. Мы только выдвигаем предположение, что базисный эксперимент с лотереей будет полезной логической схемой для представления его суждений о реальных будущих событиях, с которыми ему придется сталкиваться.

5. Мы попытались предложить «простейший» класс вопросов, на которые принимающий решение должен суметь

ответить, чтобы можно было назначить соответствующие веса или вероятности. Ему самому не обязательно участвовать ни в назначении вероятностей, ни в интерпретации весов в терминах теории вероятностей. От него требуется лишь принятие некоторых решений. Имеются, конечно, другие пути получения того же результата. Приобретя некоторый опыт, человек, принимающий решение, сможет приписывать вероятности сам, высказываясь, например, так: «Я считаю, что этот контракт имеет 30%-ные шансы на успех». Он сможет даже непосредственно связывать сбыт товаров в следующем месяце с нормально распределенной случайной переменной, имеющей некоторое определенное среднее и определенную величину стандартного отклонения. В ходе дальнейшего изложения мы приведем примеры различных других способов шкалирования суждений. Суть дела в том, чтобы найти самый легкий, самый естественный метод, дающий к тому же следствия, которые принимающий решение готов был бы принять.

6. Может случиться, что если мы начнем с лотереи или эксперимента, имеющих, скажем, 10 возможных исходов, то принимающий решение предпочтет одну альтернативу в случае, когда имеется билетов, и изменит свое предпочтение в пользу другой альтернативы при наличии билетов. Его точка безразличия лежит где-то между Мы можем ввести новый эксперимент, содержащий 100, 1000 или столько исходов, сколько требуется для установления его точки безразличия. При этом мы пока предполагаем, что всегда может быть найдена единственная точка безразличия. Впоследствии мы изучим случай, когда принимающий решение испытывает безразличие в некоторой конечной области значений что усложняет программу исследований.

7. Наконец, должно быть ясно, что наша методика никоим образом не заменяет суждений руководителя. Напротив, она направлена на их лучшее использование, снижение их возможной внутренней непоследовательности, обобщение к перенесение их на более сложные ситуации, не поддающиеся непосредственно интуитивному решению.

Связь с относительными частотами

В сознании многих людей представление о теории вероятностей ассоциируется с ее интерпретацией в терминах относительных частот исходов повторяющихся испытаний или наблюдений. Говоря о вероятностях, они подразумевают всегда лишь относительные частоты, поэтому необходимо сделать некоторые разъяснения относительно того, в каком смысле мы ниже используем термин «вероятность». Для этого рассмотрим фиг. 3. 1.

Фиг. 3.1.

Мы должны подходить к математической теории вероятностей так же, как и к любой другой ветви математики, рассматривая ее как абстрактную, непротиворечивую систему выводов, вытекающих из небольшого числа аксиом. Поэтому взятая сама по себе теория вероятностей никак не связана с наблюдаемыми событиями и математик вовсе не обязан интерпретировать вероятность в терминах событий.

Однако, когда требуется «применить» теорию вероятностей к реальной действительности в смысле выдвижения определенных гипотез о возможных событиях, необходимо соответствующим образом интерпретировать понятие вероятности. Иными словами, при этом требуется система правил, позволяющих связать понятия теории с тем, что можно

наблюдать в изучаемых явлениях. Одна из таких интерпретаций вероятности связана с понятием относительной частоты. В этом случае вероятность может быть интерпретирована как предел относительной частоты исхода при неограниченном повторении эксперимента. При этом обнаруживается, что теория вероятностей может быть использована для выведения одних относительных частот из других. В типичном примере мы можем с помощью этой теории установить соотношение между относительной частотой выпадения «герба» при двукратном бросании монеты и относительной частотой выпадения трех «гербов» при десятикратном бросании монеты, если эксперимент повторяется неограниченное число раз.

Очевидно, здесь предложен совершенно другой способ интерпретации математической теории вероятностей. В нашей интерпретации понятие вероятности ассоциируется не с относительными частотами появления события, а с определенным наблюдаемым поведением человека при принятии решений. Мы используем это понятие не для вычисления других относительных частот, а для предсказания других способов поведения при принятии решений. Мы утверждаем, что, интерпретировав теорию для одних ситуаций принятия решений, мы можем предсказать, как принимающий решения будет действовать в других ситуациях. Если он действует в согласии с теорией вероятностей, наши предсказания окажутся правильными.

Таким образом, хотя имеются две существенно различные интерпретации математической теории вероятностей, тем не менее веса, или степени уверенности, высказываемые разумными людьми, будут, по-видимому, близки к относительным частотам. Если разумного человека определить как человека, чьи веса, или степени уверенности, согласуются с теорией вероятностей, можно прийти к следующему заключению:

«Каково бы ни было его первоначальное мнение, разумный человек после ознакомления с относительными частотами изменит это мнение таким образом, что его веса, или степени уверенности, приблизятся к относительным частотам».

Пусть какой-то человек на собственном (или чужом) опыте убедился в том, что относительная частота выпадения

«герба» при повторных бросаниях монеты лишь очень редко намного отличается от V2 при длинной серии бросаний монеты. Тогда люди будут считать его поведение разумным, если при однократном бросании монеты и вознаграждении за правильное угадывание он наугад назовет любую сторону монеты. Следовательно, мы склонны предполагать, что

а) разумные люди, имевшие сходный опыт, должны придерживаться и сходных мнений;

б) до тех пор пока имеется возможность получения достаточного количества данных или приобретения достаточного опыта, первоначальное мнение или распределение весов может быть несущественным, так как роль первоначального мнения станет пренебрежимо малой при постепенном изменении мнения под влиянием дополнительных данных;

в) когда разумные люди расходятся во мнениях, это свидетельствует о том, что их опыт и доступная им информация были в существенных чертах различны.

Эти утверждения играют чрезвычайно важную роль в науке управления и будут ниже изучены более подробно.

Нужно ясно сознавать, что, хотя значение относительной частоты и не может быть получено без реального выполнения соответствующей серии наблюдений, веса, или степени уверенности, могут быть приписаны и без наличия такого общедоступного или явно выраженного опыта. Предположим, что лицо, принимающее решение в только что рассмотренной задаче с бросанием монеты, узнает из заслуживающего доверия источника, что монета имеет с обеих сторон «герб» или с обеих сторон «решетку». Тогда ему по-прежнему будет безразлично, назвать ли «герб» или «решетку». Следовательно, мы можем в этом случае назначить веса без явного проведения эксперимента по определению относительных частот в обычном смысле слова. Именно в этом и сказывается полезность этих идей. Мы уже не вынуждены более ограничиваться ситуациями, предполагающими проведение повторных экспериментов, подсчет относительных частот и многократное принятие решений. Мы можем иметь дело с однократными решениями, опираясь на весь накопленный опыт, хранящийся в памяти руководителя. Это дает нам возможность рассматривать гораздо более широкую совокупность задач управления, чем это доступно теоретику, который интерпретирует вероятности лишь как относительные

частоты. Читатель должен уяснить себе, что, применяя в этой книге термин вероятность, мы всегда подразумеваем веса, выражающие мнения принимающих решения людей. Когда же мы специально касаемся относительных частот, мы так их и будем называть.

Согласованное обучение

Прошкалировав суждения принимающего решения лица в таком виде, чтобы можно было использовать аппарат теории вероятностей, посмотрим теперь, какие указания дает нам этот аппарат для корректировки суждений по мере приобретения нового опыта. Нам нужно иметь логически непротиворечивую схему для пересмотра суждений в свете новых данных, или «теорию согласованного обучения». Мы начнем с основной теоремы теории вероятностей, которая связывает вероятность совместного наступления событий Л и В с их условными вероятностями:

То есть вероятность совместного наступления событий А и В равна условной вероятности события А, если известно, что В наступило, умноженной на безусловную вероятность наступления события В, и т. д. Как непосредственное логическое следствие этой теоремы имеем

Мы получили теорему Байеса, которая играет центральную роль в нашей теории обучения. Остановимся поэтому подробнее на ее интерпретации.

В следующем ниже примере предлагается интерпретация теоремы Байеса в терминах относительных частот. Пусть мы имеем дело с производством автомобилей определенной марки. Нам известно, что образцы автомобилей этой марки могут различаться между собой типом кузова (два варианта кузова) и типом двигателя (тоже два варианта). В нижеследующей табличке приведены количества выпущенных

автомобилей каждого образца в партии из N машин:

Тип двигателя у

Тип кузова

Итак, было произведено машин с кузовом типа А и двигателем типа В и т. д., где Интерпретируя теорему Байеса в терминах относительных частот, получаем

что, очевидно, сводится к тождеству.

В терминах весов мы можем представить себе, что имеется выбор между двумя лотереями, предложение участвовать в которых поступает только в том случае, если нет достоверных мнений о наступлении события В:

значительный выигрыш, если А и В происходят одновременно, и ничего в противном случае; если имеет место то лицо, принимающее решение, получает билетов в базисной лотерее, где призом является тот же значительный выигрыш, и ничего не получает, если событие В не происходит.

Если лицу, принимающему решение, было безразлично, выбрать ли образ действий или то мы должны написать

Если он вводит также безусловную вероятность В и использует наряду с ней вероятность совместного наступления А и В, то для согласованности результатов необходимо, чтобы эти величины были связаны соотношением, выражаемым теоремой Байеса.

Чтобы показать, как эта теорема обеспечивает логическую основу для пересмотра мнения, рассмотрим очень простой эксперимент. Возьмем обычную монету и специально изготовленную игральную кость, четыре стороны которой помечены словом «герб», а остальные две — словом «решетка»

Наблюдать бросание монеты и кости вам не разрешается, причем один из этих предметов накрывается чашкой. Предлагается какая-нибудь значимая для вас награда, если вы правильно угадаете, который из предметов не накрыт. Пусть означает утверждение «не накрыта монета», a - «не накрыта кость». Используя предложенные выше методы, можно оценить вероятность, которая должна быть приписана каждому из этих утверждений, и интерпретировать ее, если вы пожелаете, как выражение степени уверенности в их истинности. Многие участники такого опыта проявляют безразличие к тому, выбрать ли «монету» или «кость», и такое поведение можно отразить следующей оценкой вероятностей:

Мы предполагаем, что ваше мнение также может быть выражено этим частным распределением вероятностей.

Затем экспериментатор смотрит на ненакрытый предмет (который все еще скрыт от ваших глаз) и сообщает, является ли верхняя сторона предмета «гербом» или «решеткой». Вопрос заключается в том, насколько такое сообщение повлияет на ваше мнение, или что вы почерпнете из этого сообщения. Очевидно, сообщение о «гербе» или «решетке» на верхней стороне не устранит всю неопределенность вашего суждения о том, какой же объект не накрыт. Это не будет полностью исчерпывающей информацией, так как она не устраняет всех сомнений. Однако такое сообщение окажется полезным в том смысле, что оно в какой-то степени уменьшит неопределенность нашего знания о ситуации. Вопрос в том, в какой же степени? Если экспериментатор сообщает, что выпал «герб», то интуитивно ясно, что мнение изменится в пользу кости, но степень или величину этого изменения редко удается оценить интуитивно.

Чтобы выявить логический принцип для установления нового веса утверждения Ни используем теорему Байеса следующим образом. Пусть h означает сообщение «выпал — сообщение «выпала решетка». Если предположить на мгновение, что на самом деле не накрыта монета, то условная вероятность события h для большинства

людей будет равна т. е.

и аналогично

Безусловную вероятность сообщения h можно вычислить, исходя из соотношения

Теорема Байеса предполагает, что ваше пересмотренное мнение, т. е. вероятность при условии, что экспериментатор сделал сообщение А, должно быть таким:

Следовательно, если экспериментатор делает сообщение о том, что показывается «герб» и если вы хотите быть последовательным в своих суждениях (в смысле теории вероятностей), ваша вероятность для должна увеличиться с до То, что вероятность должна как-то увеличиться, ясно интуитивно. Но для ответа на вопрос, на сколько именно она возрастет, наша интуиция уже нуждается в помощи теории вероятностей.

Точно так же можно прийти к заключению, что сообщение t уменьшило бы вероятность Заметим, что еще до того, как услышать сообщение экспериментатора, можно вычислить, какое влияние различные сообщения окажут на ваше мнение. Если экспериментатор решит назначить цену за услугу, состоящую в сообщении результата, он захочет, чтобы ему платили до того, как он сделает свое сообщение. Тогда такие заблаговременные вычисления могут оказаться полезными при решении вопроса о том, стоит ли платить ту цену, которую он запрашивает.

Рассмотрим содержание теоремы Байеса с несколько иной точки зрения. Для этого выпишем все возможные исходы нашего эксперимента. Лусть символы означают исход «монета не накрыта и ее верхняя сторона — Если вы оцениваете априорную вероятность осуществления

как , то вероятность указанного исхода будет Ниже мы приводим список всех исходов и их априорные вероятности:

В списке указаны два варианта выпадения монеты и шесть вариантов выпадения кости. Сумма их вероятностей равна, разумеется, единице. Если вам теперь сообщили, что виден «герб», вы можете сразу сказать, что нужно использовать левый столбец. Вероятность того, что это будет «герб» монеты, равна вероятности исхода , деленной на сумму вероятностей исходов в левом столбце. Таким образом,

Это и есть не что иное, как применение теоремы Байеса.

Пример из области управления

Чтобы продемонстрировать применение формул такого типа и легкость в обращении с ними, рассмотрим простой пример делового решения, в котором первостепенное значение имеет надежность некоторой ракетной системы. В наиболее интересных ситуациях принятия решений присутствующая там неопределенность частично определяется опытом принимающего решение, частично же данными и доказательствами, которые он может получить. Если опыт его достаточно велик, он может решить не собирать никаких данных: такая неопределенность не раз встречалась ему и составляет часть его опыта. Если же у руководителя мало опыта, он вынужден будет придавать большой вес данным, собранным его сотрудниками. Но в большинстве случаев при выработке решения используется некоторое сочетание явно выраженных данных с неявным опытом. Одним из наиболее трудных аспектов выработки решения как раз и является вопрос, какой вес должен быть придан опыту,

а какой — фактическим данным. Руководители редко полагаются на что-либо одно. И здесь снова аппарат теории вероятностей может оказать определенную помощь. Если принимающий решение может выразить имеющуюся у него неопределенность относительно некоторых простых событий и захочет, чтобы его суждения были логически последовательны с точки зрения теории вероятностей, он может воспользоваться этой теорией как путеводной нитью для получения логически согласованных выводов в сложных ситуациях.

Предположим, что фирма — производитель ракет заявляет, что надежность ракет равна 98%. Пусть надежность ракеты была оценена также независимым агентством, занимающимся испытанием ракет, которое пришло к выводу, что ее надежность составляет лишь 90%.

Заказчик, принимающий решение о покупке ракеты, собирается сам провести ее испытания, фактически осуществляя запуски. Предположим, что заказчик на основе своего опыта сомневается как в заявлениях фирмы, так и в утверждениях агентства. (Если бы он был уверен, что кто-то из них прав, ему не нужны были бы и дальнейшие испытания.) Он может выразить свою основанную на опыте неуверенность следующим утверждением: «Вероятность того, что заявление изготовителя верно, равна 0,4; вероятность того, что верно заявление испытательного агентства, равна 0,6». (Они могут и оба ошибаться, но для простоты мы не будем рассматривать этот случай.) Предположим далее, что принимающий решение действительно осуществляет испытательные запуски двух ракет. Как он должен сочетать данные о результатах запусков со своим опытом? Какой вес должен быть придан тому и другому? Если оба запуска оказались неудачными, каково будет тогда мнение принимающего решение?

Теорема Байеса дает метод вычисления вероятности того, что право агентство, в случае, когда оба испытания оказались неудачными. Теорема утверждает, что эта вероятность равна

Величины, стоящие в правой части, можно получить следующим образом:

(Две неудачи при условии

— первоначальное мнение руководителя, основанное на его опыте. Шансы на то, что право агентство, равны 0,6;

Р (Две неудачи) получается, как и раньше, т. е. Р (Две неудачи) неудачи при условии неудачи при условии

Используя эти значения, имеем: вероятность того, что верно заявление независимого агентства при условии, что оба испытания были неудачны, равна 0,97. Таким образом, теорема Байеса подсказывает, что принимающий решение, который вначале на основании опыта предполагал, что агентство право с вероятностью 0,6, теперь может на основании как своего опыта, так и имеющихся данных считать, что эта вероятность повысилась до 0,97. В самом деле, если бы он захотел рациональным образом модифицировать свои суждения, он должен был бы принять это указание для уменьшения неопределенности. В табл. 3.1 показаны результаты модификации мнения при различных возможных исходах двух испытаний ракеты.

Таблица 3.1

Терминология

Ниже приводятся общепринятые названия величин, связанных с теоремой Байеса.

Вероятности, характеризующие суждения принимающего решения человека о состояниях внешнего

мира и о будущих событиях, или его гипотезы до получения им дополнительной информации, называются априорными (prior) вероятностями.

Пересмотренные значения этих вероятностей после получения дополнительной информации называются апостериорными (posterior) вероятностями. Априорность и апостериорность определяются по отношению к конкретной порции информации или к выборочному результату. Таким образом, вероятности, априорные по отношению к одному наблюдению, могут быть апостериорными по отношению к предшествующему наблюдению.

Вероятность данного выборочного результата, наблюдения или информационного сообщения в предположении, что верна какая-то одна гипотеза или одно состояние среды, называется правдоподобностью (likelihood).

Так, в примере с монетой и игральной костью — априорная вероятность, — апостериорная вероятность, — правдоподобность.

Интуиция и логика обучения

Схема рассуждений, предлагаемая теорией вероятностей в качестве руководства к обучению, т. е. к пересмотру мнения, разными путями подтверждается интуицией. Можно исследовать некоторые из этих путей, рассмотрев обобщенную ситуацию, в которой имеются две гипотезы или два возможных будущих состояния: Предположим, что обозначает любую информацию, которая, как считает принимающий решение, влияет на его мнение. Апостериорная вероятность истинности гипотезы может быть записана в виде

где L — отношение правдоподобия:

Если теперь априорная вероятность может быть взята равной либо 1, либо 0, говорят, что принимающий решение

безусловно уверен в том, что истинно или соответственно ложно. Состояние уверенности означает полное отсутствие стремления к обучению и неподверженность влиянию какой бы то ни было информации. Выражение для апостериорной вероятности подтверждает это, указывая, что если априорная вероятность равна 1 или 0, то апостериорная вероятность будет также равна 1 или 0, независимо от того, какая информация дойдет до сведения принимающего решения лица. Следовательно, полезно иметь в виду, что, если имеется какая-либо возможность изменения взглядов, лучше избегать априорных вероятностей 0 и 1. В этом смысле есть существенная разница между выражениями «быть почти уверенным» и «быть абсолютно уверенным».

Отношение правдоподобия дает некоторые указания на то, насколько убедительным и решающим может быть тот или иной выборочный результат. Если отношение правдоподобия равно единице, апостериорная вероятность будет просто равна априорной. Получаемая информация не будет приводить к изменению нашего мнения, если она столь же вероятна при предположении об истинности одной гипотезы, как и при предположении об истинности другой гипотезы. Чем больше отношение правдоподобия отличается от единицы, тем больше разница между априорной и апостериорной вероятностью.

Последовательные выборки и независимость

Предположим, что информация, которую принимающий решение считает важной, фактически состоит из двух сообщений или наблюдений, х и у. Возьмем случай, когда сначала ему становится известным а затем у. Если знание реализовавшегося не влияет на его мнение о правдоподобии у, говорят, что х и у независимы. Выражения

являются условиями независимости х и у. Конечно, если изменить порядок поступления информации на обратный (сначала у, затем ), то в этих формулах надо х и у поменять местами.

Прежде всего заметим, что, как и следовало ожидать, безразлично, пересматривает ли принимающий решение свои мнения после того, как он узнает и еще раз после ознакомления с у, или же он делает это лишь после ознакомления с х и у. Его окончательное мнение будет в обоих случаях одинаковым. Теорему Байеса можно записать следующим образом:

Деля числитель и знаменатель на и вспоминая выражение для апостериорных вероятностей при заданном можно переписать это выражение в виде

Таким образом, мы, очевидно, получим одинаковый результат, если апостериорную относительно вероятность рассчитаем любым из двух методов:

1) вычислим за один шаг;

2) вычислим за два шага — сначала найдем , а затем, использовав этот результат как априорную вероятность, вторично применим теорему Байеса.

Следовательно, как и подсказывает нам интуиция, мы приходим к одинаковому мнению независимо от того, рассматриваем ли мы информацию «за один присест» или же по частям.

Предположим, что, используя второй метод, мы вычислили вероятности, апостериорные относительно наблюдения Влияние у на наше мнение будет зависеть от отношения правдоподобия

Как было отмечено выше, чем больше отношение правдоподобия отличается от единицы, тем большие изменения претерпевает наше мнение. Предположим, что между у их имеется строгая зависимость, так что после того, как наблюдается можно с уверенностью сказать, что за ним последует у. Тогда

и отношение правдоподобия равно 1. Следовательно, в этом случае знание у не несет «никакой новой информации» и не оказывает влияния на наше мнение. В общем случае эффект зависимости у от должен сказаться в том, что отношение правдоподобия будет ближе к 1, чем в случае независимости этих величин. Можно высказать общее утверждение: зависимые выборки оказывают меньшее влияние на мнения, содержат меньше информации и менее существенны для принятия решения, чем независимые наблюдения. Это опять вполне согласуется с нашей интуицией.

Переход к относительным частотам

Пусть вы в сильной степени уверены в том, что относительная частота выпадения «герба» деформированной монеты в длинном ряде бросаний равна но допускаете также некоторую возможность того, что она будет равна 72- Для простоты предположим, что, по вашему мнению, никаких других значений этой относительной частоты быть не может. Допустим также, что ваша интуиция подсказывает вам, что

где означает утверждение, что относительная частота выпадения «герба» в длинном ряду бросаний равна утверждение, что она равна 1/2.

Теперь вы начинаете бросать указанную монету и записывать наблюдаемые относительные частоты. Если на самом деле относительная частота равна то по мере роста числа наблюдений будет становиться все определеннее близость наблюдаемой относительной частоты к Иначе говоря, по мере увеличения объема выборки будет становиться все менее вероятно, что относительная частота «гербов» в выборке отклонится от истинной частоты больше, чем на произвольно выбранную величину . Следовательно, будет все определеннее приближаться к 0, а — к 1, где — наблюдаемая относительная частота выпадения «герба» при растущем числе бросаний. Из теоремы Байеса следует, что для крупных выборок с большой

вероятностью близко к 1. Если вы обучаетесь на опыте в согласии с логикой теории вероятностей, то это означает, что вы тем самым познаете истину. Иными словами, каково бы ни было ваше первоначальное мнение (исключая, конечно, полную уверенность), по мере накопления опыта вы все более будете склоняться к мнениям, согласующимся с относительными частотами. Следовательно, мы находим разумным основывать наши мнения на относительных частотах и, как предполагалось ранее, ожидаем, что разумные люди, имеющие сходный опыт, будут иметь и сходные мнения. По мере накопления информации разумные люди стремятся приписывать все меньший и меньший вес своим первоначальным мнениям и все больший поступающим фактическим данным. Именно это и составляет суть научного подхода. Когда имеется достаточно данных, относительно которых разумные и информированные люди находятся в согласии друг с другом, мы уже больше не называем их мнения субъективными, а можем считать их объективными.

Быстрота сходимости этого процесса интуитивно не столь ясна. Выберем для иллюстрации довольно крайний случай. Рассмотрим две гипотезы относительно монеты:

относительная частота выпадения «гербов» в длинной последовательности бросаний равна

Н. относительная частота выпадения «гербов» в длинной последовательности бросаний равна Предположим, что Вообразим себе двух человек, по-разному относящихся к этим двум гипотезам. Мнения одного можно выразить весовым коэффициентом мнения другого — весовым коэффициентом Предположим, что оба начинают наблюдать бросание монеты. Если бы монета упала «гербом» вверх семь раз подряд, то оба согласились бы, что разумно приписать вес, меньший чем 0,07. Конечно, менее убедительная выборка не дала бы столь быстрой сходимости.

В дальнейшем изложении этот очень важный результат будет проиллюстрирован на ряде примеров.

Упражнения

3.1. Сформулируйте ваше априорное распределение вероятностей в нескольких интересных для вас ситуациях принятия решения. Выберите те из них, в которых вы имели большой опыт, и те, в которых ваш опыт был невелик.

3.2. В одной или нескольких ситуациях, рассмотренных в упражнении 3.1, сформулируйте ваше апостериорное распределение в свете некоторых новых конкретных данных. Сравните ваше апостериорное распределение с тем, которое получилось бы на основании модели, рассмотренной в настоящей главе.

3.3. Придумайте и выполните эксперимент для получения явных априорных и апостериорных распределений в некоторой ситуации принятия решения, используя в качестве испытуемого человека, не знакомого с теорией вероятностей.

3.4. Обсудите трудности, с которыми вы, по вашему мнению, столкнетесь при попытке выяснить априорное распределение вероятностей руководителя в некоторой реальной ситуации. Какие предложения для преодоления этих трудностей вы могли бы внести?

3.5. Среди широко используемых обычных статистических методов есть метод проверки гипотез и метод оценки доверительных интервалов. Какие модификации этих методов вы могли бы предложить в свете идей, обсуждаемых в этой главе?

3.6. Обрисуйте некоторые методы принятия решения в условиях неопределенности, которые не требуют использования априорных и апостериорных вероятностей.

3.7. Относительные частоты иногда называют объективными вероятностями. В каком смысле они на самом деле субъективны?

3.8. В настоящей главе описана некоторая теория обучения. Какие альтернативные теории обучения вы можете предложить?

3.9. Часто против понятия субъективной вероятности выдвигают возражение, что люди просто не привыкли мыслить в достаточно точных понятиях, которые позволили бы приписывать их мнениям точные числа. Что вы думаете по этому поводу?

3.10. Один из способов получения априорного распределения заключается в том, что испытуемого просят принять несколько простых решений после того, как он получает различные выборочные результаты. На основе этих решений должны быть выведены апостериорные распределения, а из них в свою очередь можно вывести априорные распределения. Покажите на конкретном примере, как это можно сделать.

3.11. Многие фирмы хранят многочисленные исторические данные о результатах прошлых решений, но очень мало данных о самих решениях. Какова, по вашему мнению, причина этого и какие выгоды сулило бы изменение такого положения?

<< Предыдущий параграф Следующий параграф >>
Оглавление