Главная > Разное > Наука об управлении байесовский подход
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Глава 5. ПРИНЯТИЕ ЛОГИЧЕСКИ СОГЛАСОВАННЫХ РЕШЕНИЙ В УПРАВЛЕНИИ

Ценность информации

В соответствии со сказанным мы впредь будем предполагать, что мнения о возможных событиях выявлены методами, аналогичными изложенным в гл. 3, и что человек, принимающий решения, проявляет готовность действовать в согласии с логикой теории вероятностей. Далее мы предполагаем, что в соответствии с рекомендациями гл. 4 составлена шкала предпочтений, и принимающий решение стремится сделать выбор таким образом, чтобы максимизировать ожидаемую им полезность. Для того чтобы сконцентрировать внимание на наиболее важных проблемах, мы в дальнейшем изложении чаще всего будем предполагать, что функция полезности в денежном выражении линейна, и пытаться максимизировать ожидаемый доход. Рассмотрим теперь выводы теории принятия согласованных решений применительно к задачам руководителя.

Наиболее важной проблемой, с которой нам приходится сталкиваться, является вопрос о том, какова могла бы быть разумная плата со стороны руководителя за информацию, которую он считает важной для принятия решения. Для иллюстрации нашего подхода к этому вопросу возьмем наипростейшую из возможных задач. Обратимся к принятию решения в задаче с бросанием монеты и кости, описанной в гл. 3. Основные элементы этой задачи таковы:

Введем теперь в эту задачу еще одно условие: если принимающий решение угадает правильно, какой именно предмет

не накрыт, он получит приз в 1 долл., если не угадает — не получит ничего. Если мы предположим, что его априорные вероятности (которые мы можем теперь представлять себе несколько более осмысленно) таковы:

то при отсутствии дальнейшей информации ему было бы безразлично, какой именно объект назвать, и его априорный ожидаемый выигрыш составил бы 0,5 долл.

Вообразим теперь, что экспериментатор предлагает принимающему решение совершенно надежную (или «полную») информацию о том, какой именно предмет не накрыт. Принимающий решение должен, однако, заплатить за услугу сообщения такой совершенно надежной информации, прежде чем он получит эту информацию. Какова была бы ценность такой информации? Он - может заглянуть вперед и спросить себя, что он будет делать в ответ на каждое из двух возможных сообщений, которые может обеспечить данная услуга, и вычислить свой доход, исходя из полученных ответов. Взвешивание этого дохода с помощью априорных вероятностей возможных сообщений позволило бы ему оценить сумму его ожидаемого дохода, если он уплатит некоторую сумму за совершенно надежную информацию до ее фактического получения. Так как этот ожидаемый доход был бы больше 0,5 долл., т. е. того, что он ожидает на основании одной лишь априорной информации, то прирост дохода и явился бы той максимальной суммой, которую ему имело бы смысл уплатить за информационную услугу.

Если сообщение будет «не накрыта монета», его апостериорная вероятность для увеличится до 1. Хотя этот факт и сам по себе очевиден, он подтверждается также теоремой Байеса, ибо если наш испытуемый считает, что это сообщение является совершенно надежным, то условная вероятность указанного сообщения для данного равна 1. Наилучшим решением, следовательно, будет назвать монету и получить 1 долл. Если сообщение будет «не накрыта кость», он назовет кость и снова выиграет 1 долл. Основываясь на своих априорных мнениях, он приписал бы утверждению «совершенно надежное сообщение укажет, что не накрыта

монета» вероятность и такую же вероятность утверждению, что не накрыта кость. Таким образом, прежде чем получить какое-либо сообщение, он будет знать, что его ожидаемый доход, если он примет услугу сообщения информации, будет равен

Символ означает ожидаемый доход (Expected Profit) при наличии полной информации (Perfect Information). Увеличение дохода руководителя по сравнению с доходом, который он получил бы на основе априорной информации, мы назовем ожидаемой ценностью полной информации EVPI (Expected Value of Perfect Information):

Следовательно, максимальная сумма, которую для него было бы разумно заплатить за эту полную (совершенно надежную) информацию, есть 0,5 долл. Большая часть информации в реальных задачах управления будет «неполной», ненадежной, т. е. она не исключает всей неопределенности. Следовательно, EVPI указывает верхнюю грань для суммы, которую разумно было бы затратить на любую программу сбора информации. Так как EVPI представляет собой прирост дохода от полного исключения неопределенности, эту величину иногда называют также стоимостью неопределенности.

Заметим, что мы можем вычислить EVPI еще двумя интересными способами. Допустим, что априорный выбор сделан на основе бросания монеты. Пусть результатом этого бросания явилось предположение: «монета». Если «служба сообщения информации» указала «монету», наше поведение не изменилось бы. Так как наши априорные и апостериорные выборы в этом случае одинаковы, мы утверждаем, что информация имеет нулевую ценность. Если бы сообщение гласило «кость», мы изменили бы наше предположение, увеличив наш апостериорный выигрыш с нуля (каковым он был бы, если бы мы настаивали на априорной догадке) до 1 долл. (при изменении мнения). Поэтому в данном случае информация принесла бы выигрыш в 1 долл. Умножая эти

выигрыши на вероятности сообщений и складывая их (т. е. производя взвешивание выигрышей), получаем опять EVPI.

Другой путь рассмотрения ценности полной информации состоит в следующем. Предположим снова, что наш априорный выбор был «монета». Если догадка оказалась правильной, у нас нет повода для сожалений. Если же выбор оказался ошибочным, мы не получим ничего, в то время как, назвав «кость», мы получили бы 1 долл. Мы можем рассматривать этот 1 долл. как меру нашего «сожаления» или потери благоприятной возможности. Вычисление «ожидаемого» сожаления или ожидаемой потери возможности для наилучшего априорного действия также дает нам ожидаемую ценность полной информации.

Ценность неполной информации

Те же принципы позволяют нам определить ценность неполной или выборочной информации. Предположим, что человеку, принимающему решение, предлагаются услуги в виде выдачи сообщений о том, будет ли верхняя поверхность ненакрытого предмета «гербом» или «решеткой». Если он желает воспользоваться этими услугами, он должен заплатить за них авансом, и нас интересует, какова та разумная цена, которую он может уплатить за такую неполную информацию. Как и раньше, принимающий решение может «вычислить» свой ответ на различные сообщения, которые могут быть получены, доход, который ему принесет наилучшее действие при каждом возможном сообщении, и вероятности различных сообщений. Мы знаем из предыдущих расчетов, что если сообщение — «герб», то апостериорное распределение таково:

наилучшей догадкой является «кость», а ожидаемый доход равен 4/7. Если сообщение — «решетка», то апостериорное распределение

наилучшая догадка — «монета», а ожидаемый доход равен 3/5- Вероятности сообщений h и t равны соответственно Ожидаемый доход при данной выборочной информации равен

Ожидаемая цена выборочной информации (Expected Value of Sample Information)

Как и следовало ожидать, ценность выборочной информации меньше ценности полной информации.

Полезно ознакомиться и с другим методом получения EVSI. Если мы априорно выбираем «монету», сообщение «решетка» не меняет нашего выбора, и, следовательно, содержащаяся в нем информация не имеет ценности в смысле влияния на наше поведение. Однако, если сообщение гласит «герб», мы переключим наш выбор на «кость». Если истинна гипотеза то указанное изменение в нашем поведении приведет к уменьшению выигрыша на 1 долл. по сравнению с тем, который мы имели бы, продолжая настаивать на выборе «монеты». Если же истинна Ни то изменение поведения в пользу , увеличит выигрыш с 0 (если мы выбрали «монету») до 1 долл. Таким образом, при получении сообщения t наш выигрыш не изменится, в то время как сообщение h приводит с вероятностью к уменьшению дохода на 1 долл. и с вероятностью 4/7 к увеличению дохода на 1 долл. Напомним, что это апостериорные вероятности при условии получения сообщения h. Взвешивая изменения выигрышей по вероятностям этих двух сообщений, получаем

Ценность информации как функция неопределенности

Если или 1, то любая информация не будет представлять ценности, так как здесь уже невозможно изменить ни мнение принимающего решение, ни выбранный

им образ действий. Предположим, однако, что и что априорный выбор человека, принимающего решение, есть «монета». Тогда

Таким образом, EVPI будет максимально при и можно считать, что это частное априорное распределение вероятностей отражает максимальную величину неопределенности.

Дополнительная выборочная информация

Предположим далее, что принимающему решение предлагается более содержательное, но все еще не обеспечивающее полной информации сообщение. Бросание «ненакры-того» предмета повторяется раз, и каждый раз выдается сообщение о том, какой стороной он выпал. Для объема выборки 2 имеются 4 возможных сообщения:

Используя биномиальное распределение, можно вычислить условную вероятность каждого сообщения в предположении истинности той или иной гипотезы. В дальнейшем мы будем называть такую условную вероятность функцией правдоподобия (Likelihood) и обозначать символом Используя априорные вероятности и функции правдоподобия, мы можем вычислить безусловную вероятность любого результата выборки

Применяя теорему Байеса, мы можем тогда вычислить апостериорные вероятности, наилучшие способы действия и результирующий ожидаемый доход. Результаты этих вычислений приведены в табл. 5.1.

Таблица 5.1

Ожидаемая ценность выборочной информации равна

Таким образом, ожидаемая ценность выборочной информации для больше, чем та же величина для равная Заметим, что удвоение объема выборки не приводит к удвоению EVSI.

Рассматривая EVSI как функцию , мы можем ожидать, что она будет возрастать с уменьшающейся скоростью, приближаясь к EVPI как к пределу, Если стоимость получения наблюдений просто пропорциональна , скажем равна то можно определить ожидаемый чистый выигрыш от выборочной информации (Expected Net Gain from Sample Information) как

Итак, в нашем примере будет существовать некоторое значение которое максимизирует ожидаемый чистый выигрыш от выборочной информации. Таким значением может оказаться и тогда мы решили бы, что выборочная информация слишком дорога. В этом случае наилучшим поведением будет основывать свое решение на одной лишь априорной информации. С другой стороны, значение , максимизирующее величину ENGSI, может оказаться больше нуля (оно никогда не будет равно бесконечности, если тогда это служит прямым указанием на целесообразность организации программы сбора данных и создания информационной системы для нужд управления.

Принцип правдоподобия

Отметим здесь одно обстоятельство, более подробным рассмотрением которого мы займемся позднее. Пусть даны два сообщения: , причем оба привели к одному и тому же апостериорному распределению и тому же апостериорному ожидаемому доходу. Это значит, что при их сообщении принимающему решение нет необходимости делать между ними различие. В самом деле, можно рассмотреть три возможных сообщения:

сообщение 1: первое наблюдение было «герб», второе наблюдение — «решетка»;

сообщение 2: оба наблюдения были «герб»;

сообщение 3: серия наблюдений продолжалась до тех пор, пока не показалась первая «решетка»; это произошло при втором наблюдении. В нашем примере мы видели, что первые два сообщения приведут к тому же апостериорному распределению вероятностей; но можно ли то же самое сказать и о сообщении 3?

Для сообщения 3 правдоподобия таковы:

На основании теоремы Байеса получаем

Следовательно, сообщение 3 дает то же апостериорное распределение, что и сообщения 1 и 2. Это несколько неожиданный результат, ибо оказывается, что с точки зрения человека, принимающего решение, нет разницы, решили ли мы бросать монету дважды и наблюдали при этом один раз «герб» или решили бросать монету до первого выпадения «решетки», что произошло при втором бросании. Но с точки зрения информационной системы между тремя сообщениями имеется различие, и мы должны выбрать то из них, которое обеспечивает наиболее экономное использование

ресурсов системы. Ясно, что при большом числе наблюдений может появиться существенная разница в стоимости передачи и регистрации, скажем, сообщений 1 и 2.

Мы можем обобщить эту идею, считая, что два сообщения эквивалентны, если они приводят к одному и тому же апостериорному распределению. Это влечет за собой равенство

которое можно привести к виду

Последнее равенство должно выполняться для всех Поэтому мы можем сказать, что два сообщения эквивалентны, если для них отношение правдоподобия К одно и то же для всех возможных будущих событий или для всех гипотез. Высказанное предположение называется принципом правдоподобия.

Отсюда можно сделать первый вывод для информационной системы, что из эквивалентных сообщений следует выбирать те, обработка которых в нашей системе может быть выполнена наиболее легким и экономным способом. Второй вывод для планирования программ сбора данных также имеет важное значение. Наш пример показывает, что при заданном выборочном результате безразлично, решаем ли мы заранее бросать монету дважды или же бросать ее до первого появления «решетки». Поэтому безразлично, какое из этих двух правил, или стратегий, использовано для выполнения нашей программы сбора данных. В более общем случае мы можем собирать данные до тех пор, пока не будут исчерпаны наши лимиты времени или денег или же пока не будет достигнута определенная степень уверенности.

Реакция на неопределенность

Стремление к определенности в задачах принятия решения — одно из неотъемлемых свойств человека. Мы всегда хотим иметь как можно больше информации, чтобы уменьшить неопределенность, и интенсивность этого желания может иногда изрядно помешать нам действовать разумно при принятии решений, включающих приобретение дорогостоящей информации. Рассмотренная выше задача с бросанием монеты и кости и несколькими различными схемами выигрышей была предложена экспериментально группе студентов до их ознакомления с нашей теорией логически согласованных, или «рациональных», решений. Хотя такие эксперименты допускают самое различное толкование, их результаты подтверждаются данными других исследователей, имевших дело с аналогичными экспериментальными задачами.

Даже в таких простых задачах принятия решений, как с монетой и костью, трудно прийти к рациональному решению, касающемуся покупки информации, без выполнения определенных вычислений. Но самый интересный вывод, пожалуй, состоит в том, что при этом наблюдается тенденция и к росту необоснованности решений. Огромное большинство испытуемых, как оказывается, готово платить за информацию больше того, что она стоит согласно выводам нашей теории. Иными словами, людям в большинстве случаев не удается извлечь из данных всю полезную информацию или уменьшить неоопределенность в той степени, в какой это возможно при логической согласованности решений.

Если такие результаты широко подтвердятся практикой управления, наша программа принятия согласованных решений должна представить значительный интерес.

Пример с возможным простоем в сталелитейной промышленности

Рассмотрим следующую задачу. Потребитель стали (т. е. руководитель фирмы, потребляющей сталь) хочет знать, какой запас стали ему нужно хранить на случай вынужденного простоя в сталелитейной промышленности. Предположим для простоты, что, по мнению потребителя,

простой может продлиться 0, 30, 45 или 90 дней. Весь прошлый опыт потребителя и его способность оценивать текущую ситуацию не позволяют ему с уверенностью определить продолжительность простоя. Для конкретности предположим, что он считает возможным любой из этих четырех сроков, приписывая им одинаковую вероятность. Его решения представлены в табл. 5. 2.

Таблица 5.2

Денежные оценки, указанные в таблице, являются чисто иллюстративными и не основаны на анализе какой-либо реальной ситуации. Если, например, не будет сделано дополнительных запасов и возникнет 30-дневный простой, дополнительные затраты выразятся в сумме 200 000 долл. Если будет сделан 30-дневный запас стали и никакого простоя не произойдет, дополнительные затраты составят 50 000 долл. Для простоты анализа мы ограничимся весьма отвлеченной формулировкой реальной задачи принятия решения. Если потребитель делает свой выбор с таким расчетом, чтобы минимизировать ожидаемые затраты, он создаст 90-дневный запас стали.

Данный потребитель испытывает сильную неуверенность в отношении того, какую продолжительность простоя следовало бы считать более вероятной, чем другую, т. е. он находится в состоянии неопределенности и будет, по-видимому, испытывать сильное желание получить добавочную информацию. Пусть он считает, что его конкуренты обладают большим, чем он, опытом, и соответственно полагает, что полезно было бы узнать их поведение. Конкуренты, однако, не хотят раскрывать своих намерений. Путем тщательного и дорогостоящего анализа руководитель силами подчиненных

ему сотрудников может выяснить характер стратегии конкурентов. Если он дает своему штату такое указание, он явным или неявным образом исходит из некоторых важных предположений:

а) знание стратегии конкурента небесполезно: вероятность того, что конкурент будет прав, превышает 0,25;

б) не нужно, однако, слепо следовать этой информации: вероятность того, что конкурент окажется прав, не равна 1;

в) стоимость получения каких-либо данных такого рода меньше выгоды, которую они сулят;

г) окончательное решение должно быть принято на основе как накопленного опыта, так и имеющихся данных.

Предположим, например, что потребитель хочет знать, сколько усилий или денег было бы разумно потратить, чтобы узнать действия конкурента, если есть уверенность в том, что конкурент с вероятностью 0,4 действует правильно. Иначе говоря, мы предполагаем, что руководитель, принимающий решение, уверен в том, что, если простоя на самом деле не будет, вероятность того, что конкурент и не готовится к простою, равна 0,4; вероятности того, что конкурент готовится к 30-, 45- и 90-дневному простою, равны соответственно 0,2 каждая. В указанной ситуации эти вероятности (в нашей терминологии «правдоподобности»), по-видимому, вполне адекватно представляют мнения руководителя, принимающего решение.

Если будет обнаружено, что такой конкурент вовсе не готовится к простою, апостериорная вероятность, приписываемая нашим руководителем простою продолжительностью 0 дней, может быть получена непосредственным применением теоремы Байеса:

Тем самым подтверждается вывод, что если человек, принимающий решение, считает, что конкурент с вероятностью 0,4 действует правильно, и если конкурент исходит из отсутствия простоя, то апостериорная вероятность, приписываемая лицом, принимающим решение, простою продолжительностью 0 дней, становится равной 0,4. Это следствие принятого им равномерного априорного распределения вероятностей.

Вероятность такого наблюдения, представляющая собой знаменатель в формуле Байеса, равна 0,25. Остальные вычисления приведены в табл. 5.3. Используя вероятности

Таблица 5.3

результатов выборки и ожидаемые издержки при использовании наилучших апостериорных действий, мы можем вычислить ожидаемые издержки при данной выборочной информации. Заметим, что они выражаются суммой 75000 долл., равной ожидаемым издержкам для наилучшего априорного действия (создание -дневного запаса). Таким образом, EVSI в этом случае оказывается равным 0. Другими словами, никакая информация о конкуренте, который с вероятностью 0,4 будет действовать правильно, не дала бы человеку, принимающему решение, основания для изменения своего априорного решения; такая информация не будет иметь для него никакой ценности в этой задаче.

Пусть теперь принимающий решение имеет возможность выяснить, что предпринимает другой конкурент, причем принимается, что этот конкурент с вероятностью 0,6 действует правильно. Как и раньше, мы предположим, что если конкурент здесь ошибается, то он с той же вероятностью будет ошибаться и избрав любой из трех возможных вариантов. Расчеты для этого случая приведены в табл. 5.4.

В указанном случае каждый из трех выборочных результатов, 0, 30, 45, привел бы человека, принимающего решение, к изменению его априорного выбора; таким образом, информация имела бы для него некоторую ценность. Вычисляя EVSI обычным способом, получаем 12 600 долл.

Рассмотрим, наконец, вопрос о ценности информации относительно двух конкурентов, каждый из которых имеет

Таблица 5.4

вероятность 0,4 оказаться правым. Предположим, что поведение конкурентов независимо в том смысле, что вероятность того, что оба они действуют правильно, есть произведение вероятностей правильных действий для каждого из них порознь. Апостериорная вероятность того, что простоя не будет, при условии что оба конкурента рассчитывают на отсутствие простоя, равна

Хотя нам нет необходимости вникать в детали стандартных расчетов, стоит отметить, что уже для четырех возможных будущих ситуаций и выборки объемом в 2 наблюдения вычисления становятся утомительными. По всей видимости, если бы мы не абстрагировали задачу путем резкого сокращения числа возможных продолжительностей простоев и если бы мы рассматривали выборки большего объема, то вычисление EVSI скоро стало бы невозможным в реальных условиях. Поэтому в следующей главе мы рассмотрим некоторые способы сокращения того огромного объема вычислений, который требуется при рассмотрении хоть сколько-нибудь близких к реальности задач.

Результаты этих вычислений представлены в табл. 5.5. Из этой таблицы нетрудно вычислить ожидаемую ценность выборочной информации, которая оказывается приблизительно равной 6000 долл.

Таким образом, эти вычисления показывают, что знание об одном конкуренте, вероятность правильности действий

Таблица 5.5

которого равна 0,6, более ценно, чем знание о двух независимо действующих конкурентах, каждый из которых имеет вероятность оказаться правым, равную 0,4. Можно ожидать, что если два конкурента не действуют независимо, то знание их планов будет иметь еще меньшую ценность для принимающего решение.

Следует подчеркнуть, что фигурирующие в этом примере правдоподобности могут выражать мнение нашего руководителя, вовсе не разделяемое другими руководителями. В случае с бросанием монеты правдоподобности приближаются к их «общепринятым» значениям в том смысле, что общий опыт разумно мыслящих людей подкрепляет их убеждение в том, что вероятность выпадения «герба» равна и что бросания монеты независимы друг от друга. В этом вопросе почти отсутствуют разногласия, поэтому мы и называем этот опыт «объективным». Убеждение в том, что конкуренты в течение какого-то времени поступают правильно и действуют независимо, основывается на менее явном доказательстве и, по-видимому, не является единодушным мнением какой-либо значительной группы разумных людей.

Основные выводы

На основе нашего весьма упрощенного примера попытаемся еще раз кратко сформулировать важнейшие положения, касающиеся роли науки управления в принятии деловых решений.

а) Если принимающему решения удается выразить в явном виде неопределенности, относящиеся к простым ситуациям, теория вероятностей поможет ему совершить логический переход к более сложным случаям.

б) Действительная проблема при выработке многих деловых решений состоит в том, как сочетать богатый личный опыт руководителя с фактическими данными, собранными его штатом. Наука управления предлагает некоторый логический аппарат, помогающий работе интуиции на этом трудном этапе.

в) Задача теории отнюдь не в том, чтобы подменить или поставить под сомнение ценный опыт руководителя. Наоборот, все усилия направлены на то, чтобы максимально использовать этот наиболее существенный фактор в принятии решений.

г) Функция теории вероятностей состоит в том, чтобы помочь принимающему решение выразить в количественном виде имеющуюся неопределенность и более плодотворно использовать его интуицию при оценке неопределенности в более сложных задачах принятия решения.

Упражнения

5.1. Четыре человека осматривают шахту и изучают целесообразность ее приобретения. Они исходят из того, что шахта либо доходна, либо не доходна. Их степени уверенности в том, что шахта окажется рентабельной, равны соответственно 0,01; 0,2; 0,8; 0,99. Они рассматривают три метода оценки доходности шахты, причем метод 1 справедлив в 50% случаев, метод 2 — в 90% случаев, а метод 3 — во всех случаях. Покажите, как мнение каждого человека изменится для каждого метода оценки при последовательном (логически согласованном) пересмотре мнений.

5.2. Ремонтная бригада ежемесячно совершает облет на вертолете ряда удаленных автоматических станций релейной связи. Маршрут облета включает N станций. Наиболее ответственный элемент каждой станции называется блоком «альфа», и бригаде его иногда приходится заменять. Необходимость замены блока «альфа» можно определить лишь при визуальном его осмотре на месте. Брать эти блоки с собой — слишком

трудно и дорого, но если потребуется новый такой блок и его не окажется на месте, придется совершить дополнительный дорогостоящий рейс. Руководитель бригады хочет знать, сколько блоков «альфа» он должен брать с собой.

Стоимость перевозки каждого блока (независимо от того, используется он или нет) равна 1000 долл. Если «альфа» требуется, но ее нет, потери составляют 10 000 долл.

Изготовитель блоков «альфа» указывает, что вероятность отказа блока в течение месяца равна 0,02. Независимые испытания показали, что эта вероятность равна 0,1. Руководитель бригады считает, что любое из этих утверждений с одинаковой вероятностью может оказаться правильным.

Пусть руководитель хочет минимизировать ожидаемые издержки при облете двух станций.

а) Показать, что наивыгоднейшее число блоков «альфа», которые нужно взять с собой в первый полет, равно 1.

б) Пусть в первом полете обнаруживается необходимость замены блока «альфа» на обеих станциях. Показать, что наивыгоднейшее число блоков «альфа», которое нужно взять во второй полет, все еще равно 1.

в) Перед первым полетом была разработана телеметрическая система, позволяющая сообщать руководителю бригады еще до вылета, сколько в точности блоков нуждается в замене. Показать, что такая система оправдывает затраты на нее в размере 930 долл. в месяц.

5.3. Фирма должна закупить большое количество товара либо сегодня, либо завтра. Сегодня цена товара 14,5 долл. за единицу. По мнению фирмы, завтра его цена будет либо 10, либо 20 долл. с равной вероятностью. Пусть обозначает завтрашнюю цену; тогда априорные вероятности равны

Эксперт по товарному рынку предлагает дать фирме свой прогноз завтрашней цены на данный товар. Иными словами, он скажет фирме: «По моему мнению, завтрашняя цена будет где или 20 долл. Фирма знает, что эксперт рынка бывает прав в 60% случаев. За свой прогноз он требует комиссионные в размере 0,15 долл. за единицу купленного товара.

Показать, что фирме будет выгодно пригласить такого эксперта.

5.4. Спрос на некоторый товар есть дискретная случайная переменная с равномерным распределением в интервале Убытки от наличия остатков товара на складах к концу периода хранения равны 1000 долл. на единицу товара; убытки от невозможности удовлетворить спрос составляют 2000 долл. на единицу товара.

а) Какие запасы товара нужно иметь на складе, чтобы свести к минимуму ожидаемые издержки? (Ответ: 4 или 5 единиц.)

б) Если для данного руководителя известна функция полезности записать выражение для полезности уровня запасов I.

в) Какую максимальную цену стоило бы заплатить, чтобы точно узнать наперед спрос на этот товар? (Ответ: 2000 долл.)

г) Если изучение рынка уменьшило бы интервал распределения спроса с 6 до 3, сколько стоило бы заплатить за такое изучение? (Ответ: 1000 долл.)

5.5. Показать (возможно, на конкретном примере), что априорная ожидаемая величина среднего значения для апостериорного распределения равна среднему значению для априорного распределения.

5.6. Рассмотреть на основании выборочных наблюдений «классическую» процедуру проверки гипотезы об отличии от нуля среднего значения случайной переменной. Как эту проблему следовало бы трактовать с точки зрения, изложенной в настоящей главе?

5.7. Фирма покупает важное комплектующее изделие для своего продукта у поставщика, у которого иногда бывают перебои в процессе производства. Эти изделия отгружаются партиями по 50 штук. Предполагается, что такая партия изготовлена посредством технологического процесса, дающего 3 или 8% брака. Вначале эти две возможности считаются равновероятными. Для целей анализа предположим, что стоимость проверки изделия составляет 1000 долл., стоимость ошибочного принятия бракованного изделия равна 15 000 долл., а стоимость ошибочного отклонения годного изделия равна 1000 долл.

Предложен план, предусматривающий проверку двух изделий из каждой партии с последующим принятием или отклонением всей партии в зависимости от результатов этих двух проверок. Показать, что этот план хуже простой приемки партии без каких-либо испытаний.

5.8. Придумайте пример, который иллюстрировал бы следующий эффект: если априорное распределение сильно благоприятствует одному из двух возможных состояний, то очень мало вероятно, чтобы выборки небольшого объема могли оказать существенное влияниена решение. Поэтому ожидаемая чистая прибыль от выборочной информации может быть сначала отрицательной, а затем по мере увеличения объема выборки стать положительной.

5.9. Ниже описывается эксперимент, основанный на задаче с монетой и игральной костью, рассмотренной в настоящей главе. Испытуемым показываются монета и кость, а также чашка, которой накрывают один из этих предметов. В первой части эксперимента экспериментатор просто покрывает один из предметов, в последующих частях эксперимента он выполняет такие процедуры, как бросание монеты и т. п. Испытуемых просят отвечать на различные вопросы типа описанных в этой главе. Полезно тщательно спланировать и выполнить эксперимент с использованием группы испытуемых, которые не прошли специальной тренировки по таким методам принятия решений.

Планируя эксперимент, можно поставить себе целью выяснить, не в состоянии ли он пролить свет на следующие вопросы:

Как можно было бы охарактеризовать поведение различных групп испытуемых при принятии решения?

До какой степени испытуемые последовательны в своем поведении в смысле его согласования с байесовской логикой?

Можно ли считать функции полезности для рассматриваемых денежных сумм линейными?

Какие решения являются наиболее трудными? Какие особенности процесса принятия решения приводят к «трудностям»?

Как качество решения связано с временем, отпущенным для принятия решения?

Склонны ли испытуемые в общем недооценивать или переоценивать информацию?

Какие характеристики испытуемых влияют на качество решения? Эксперимент по принятию решения в задаче с монетой и костью В этом эксперименте выясняются ваши реакции на три решения: А, В и С.

Решение А:

Решение В:

Решение С:

Часть 1.

Если у вас нет дополнительной информации, какое действие вы выберете

в решении

в решении

в решении

Часть 2.

Если то, какой предмет показывается, определяется бросанием монеты, какое действие вы выбрали бы

в решении

в решении

в решении

При этом условии сколько вы согласны были бы заплатить за абсолютно надежную информацию о том, какой предмет показывается,

в решении

в решении

в решении

Часть 3.

Предположим, что по таблице случайных чисел определяется, какой предмет должен быть накрыт. При этом вероятность того, что это будет монета, равна 0,7 и, следовательно, вероятность того, что это будет кость, равна 0,3.

При этом условии сколько вы согласны были бы заплатить за абсолютно надежную информацию о том, какой предмет показывается,

в решении

в решении

в решении

Часть 4.

Пусть, как и в части 2, то, какой предмет показывается, определяется бросанием монеты.

Я буду смотреть на показываемый предмет и сообщать вам, что я вижу: «герб» или «решетку». Предположим, что я делаю это и сообщаю: «герб». Какое действие вы выбрали бы

в решении

в решении

в решении

Если я предложил вам эту услугу, сколько вы готовы были бы заплатить мне за нее авансом, прежде чем выслушать мое сообщение,

в решении

в решении

в решении

Часть 5.

Пусть, как и в части 3, вероятность того, что показывается монета, равна 0,7, а вероятность того, что показывается кость, равна 0,3.

Я могу смотреть на показываемый предмет и сообщать вам, вижу ли я «герб» или «решетку». Сколько вы согласились бы заплатить за эту услугу авансом, прежде чем выслушать мое сообщение,

в решении

в решении

в решении

<< Предыдущий параграф Следующий параграф >>
Оглавление