• Название:

    Вагнер Основы ИСО т 3

  • Размер: 10.19 Мб
  • Формат: PDF
  • или

    Г. ВАГНЕР

    ОСНОВЫ
    ИССЛЕДОВАНИЯ
    ОПЕРАЦИЙ

    Harvey M. Wagner
    Department of Administrative Science Yale University;
    Consultant to McKinsey and Company, Inc.

    Principles
    of
    Operations
    Research
    With Applications to Managerial Decisions

    Prentice-Hall, Inc., Englewood Cliffs,
    New Jersey 1969

    Г. ВАГНЕР
    ОСНОВЫ
    ИССЛЕДОВАНИЯ
    ОПЕРАЦИЙ

    Том 3

    Перевод
    с английского
    Б. Т. Вавилова

    Издательство «Мир»
    Москва 1973

    УДК.35.073.5

    В томе 3 отражены современные достижения в области стохастического моделирования и рассмотрены многочисленные
    проблемы оптимизации управляющих решений применительно
    к процессам, явлениям и состояниям, характеризуемым параметрами, подчиняющимися законам теории вероятностей. Как
    и в первых двух томах, приведен ряд поучительных примеров,
    иллюстрирующих возможности излагаемых методов (модели очередей, вероятностные модели управления запасами, модель управляемой экономики и др.).
    Автор знакомит читателя также с проблемой построения
    имитационных моделей систем управления и возможностями реализации такого рода моделей на ЭВМ.
    Заключительная глава данного тома посвящена вопросам
    организации работ на всех этапах операционного исследования
    и практического использования получаемых при этом результатов.

    Редакция литературы

    по вопросам новой техники

    Перевод на русский язык, «Мир», 1973

    3314-336
    041(01)-73

    ГЛАВА 16

    Введение в теорию стохастических
    оптимизационных моделей
    16.1. УПРАВЛЯЮЩИЕ РЕШЕНИЯ
    В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

    В предшествующих томах рассматривались оптимизационные
    модели, для практической реализации которых необходимо полностью детерминированное представление всех исходных данных.
    Именно так обстоит дело с линейными моделями *), при построении
    которых постулировалось, что удельная прибыль, потребительский
    спрос, уровни запасов и т. д. являются величинами, определяемыми
    совершенно однозначно. При рассмотрении задач управления запасами, календарного планирования производства и замены оборудования 2) также предполагалось, что задание числовых значений
    параметров, фигурирующих в соответствующих моделях, не сопряжено с какой бы то ни было неопределенностью. Но, поскольку
    в реальных условиях по крайней мере некоторые из упомянутых
    выше показателей известны лишь приближенно, у многих может
    возникнуть сомнение относительно практической ценности методов
    оптимизации, рассмотренных в первых двух томах. Поспешим,
    однако, еще раз заверить читателя в том, что детерминистические
    модели находят широкое практическое применение. Вопрос заключается лишь в том, когда применимы такого рода модели для решения
    реальных задач организационного управления. Исключительно важно
    (и далеко не всегда просто) найти правильный ответ именно на этот
    вопрос. Ниже приводятся некоторые соображения, которые при
    анализе данной проблемы могут быть весьма полезными.
    Чтобы этот анализ был всесторонним, необходимо 1) в каждом
    конкретном случае добиться понимания внутренней природы имею,
    щейся неопределенности и увидеть ее истоки; 2) представить себекаким образом учитывается эта неопределенность выбранной математической моделью; 3) разобраться в существе метода, с помощью
    которого находится численное решение для данной модели при
    наличии надлежащих исходных данных. Таким образом, приступай
    к исследованию с целью решения той или иной практической задачя
    организационного управления, операционист должен прежде всего
    выяснить
    I) с какими видами неопределенности ему придется столкнуться
    и каким образом это может отразиться на выборе оптимального решения;
    II) можно ли в рамках принятой модели адекватным образом
    учесть недетерминистский характер исследуемой ситуации.
    1
    2

    ) См. т. 1 (в частности, гл. 2).
    ) См. гл. 8—11 в т. 2.

    ГЛАВА 16

    Выбор наиболее эффективного метода получения численного решения для той или иной оптимизационной модели — важный момент
    любого прикладного операционного исследования. Задача эта,
    однако, является сугубо математической (или, можно сказать, технической). В последующих главах читателю будут представлены широкие возможности познакомиться с различными формальными методами
    решения оптимизационных задач. Однако в процессе изучения материала не следует слишком углубляться в математические дебри,
    так как при этом можно упустить из поля зрения требования, изложенные в пп. I) и II), и, следовательно, не увидеть самого главного.
    Ниже ,рассмотрены две явно упрощенные постановки задачи,
    помогающие усвоить основные моменты анализа операционно-исследовательской ситуации и служащие ориентиром при поисках ответов
    на вопросы, содержащиеся в пп. I) и II).
    Пример 1. Фирма «Бонбон», занимающаяся производством продуктов питания, стоит перед дилеммой: увеличивать ли ей производственные мощности уже действующего завода или строить новое
    предприятие такого же профиля. По мнению президента фирмы,
    решение этой дилеммы существенно зависит от того, какая доля
    рынков сбыта будет принадлежать фирме в течение ближайших
    десяти лет. Допустим, что плановый отдел фирмы «Бонбон» располагает всеми прочими данными, которые следует принять во внимание при выработке окончательного решения, и считает, что организационно-технологическая структура производства и процессы сбыта
    готовой продукции могут быть математически представлены в виде
    линейной модели, аналогичной моделям, приведенным в гл. 2. Президенту фирмы необходимо убедиться, что экономический анализ
    проблемы в явной форме учитывает неопределенность той части
    общего объема сбыта рассматриваемых изделий, которая в перспективе будет приходиться на долю фирмы.
    Следует постоянно помнить, что главное в постановке задачи— это
    решение, где целесообразнее разместить дополнительные производственные мощности. Значения других управляемых переменных,
    учитываемых моделью (как, например, объемы сбыта каждого вида
    продукции, средний и пиковый уровни запасов или требуемые
    объемы сырьевых поставок), в соответствии с предположением представляют меньший интерес, хотя и используются при обосновании
    основного решения. Следовательно, экономический анализ задачи
    целесообразно проводить следующим образом.
    Вначале с помощью детерминированной линейной модели нужно
    найти наилучший вариант расширения производства для ряда предположительных и вероятных значений такого параметра, как часть
    общего объема сбыта рассматриваемых изделий, приходящаяся
    на долю фирмы. Если в результате выяснится, что оптимальное
    решение нечувствительно к этому параметру, то можно утверждать,
    что используемая линейная модель адекватно учитывает упомянутый
    выше элемент неопределенности. Если же обнаруживается, что реше-

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    7

    ние обладает сильной чувствительностью к вариациям указанного
    параметра, то необходим дополнительный анализ задачи. В частности, для каждого значения доли рынка, контролируемой фирмой,
    следует найти численное значение суммарной прибыли (получаемой,
    скажем, за год). При этом может быть установлено, что, несмотря
    на чувствительность основного решения к доле рынка, контролируемой фирмой, суммарная прибыль оказывается практически нечувствительной к этому параметру. Если прибыль также сильно зависит
    от доли рынка, контролируемой данной фирмой, то для содержательного анализа задачи необходимо каким-то образом получить
    оценку правдоподобия каждого выбранного значения доли рынка,
    контролируемой фирмой. Фирма может пойти на дополнительное
    исследование рынка с тем, чтобы получить информацию, позволяющую уменьшить диапазон неопределенности и подготовить более
    веские основания для принятия окончательного решения относительно расширения производства.
    Таким образом, в ходе анализа проблемы расширения производства фирмы «Бонбон» исследуется природа неопределенности рыночной конъюнктуры и влияние этой неопределенности на формирование
    управляющего решения. За основу при этом принимается некоторая
    линейная оптимизационная модель, а влияние неопределенности
    устанавливается с помощью анализа на чувствительность (гл. 5).
    Если такого рода анализ показывает, что прибыль существенно
    зависит от доли рынка, контролируемой фирмой, то президент фирмы
    «Бонбон» может определить «риск» для каждого варианта решения
    путем оценки правдоподобия различных значений рассматриваемого
    параметра. Более того, фирма может оценить экономический эффект,
    достигаемый за счет получения дополнительной информации о рынках сбыта на этапе выработки окончательного решения. Что же
    касается численных значений ряда фигурирующих в этой сложной
    задаче управляемых переменных (объемов поставок, уровней запасов
    и др.), то для их определения планирующий орган фирмы, безусловно,
    должен прибегнуть к помощи стандартных процедур линейного
    программирования и воспользоваться вычислительными возможностями большой современной ЭВМ.
    Пример 2. Обратимся теперь к другому примеру, который на первый взгляд обнаруживает сходство с только что рассмотренным.
    Представим себе, что у фирмы «Цветметалл», являющейся одним
    из крупнейших поставщиков слитков цветных металлов, имеется
    несколько десятков заводов, расположенных в различных географических районах США. Центральные службы фирмы располагают
    четырьмя относительно небольшими ЭВМ, 70% машинного времени
    которых используется для подготовки стандартных сводных бухгалтерских отчетов, а остальное время отводится для выполнения
    вычислительных работ, связанных со специальными исследованиями,
    проводимыми научно-поисковыми группами и отделом исследования
    операций. Несмотря на то что средняя доля машинного времени,

    8

    ГЛАВА 16

    расходуемого на эти специальные исследования в течение года,
    приблизительно известна, потребности научно-поисковых групп
    в «услугах» ЭВМ в сильной степени варьируются во времени, и нередко заказы на проведение специальных вычислительных работ с помощью ЭВМ поступают «целыми пачками». У фирмы имеется также
    несколько малых ЭВМ, которые находятся непосредственно при заводах; 50% машинного времени этих ЭВМ расходуется на составление
    бухгалтерских отчетов предприятий, а остальное время уходит
    на удовлетворение потребностей местных «технических» групп, таких,
    как отдел главного конструктора или отдел главного технолога.
    Начальником производственного отдела, отвечающим за эксплуатацию электронно-вычислительного комплекса фирмы, установлено,
    что в течение 4—5 (а иногда и 10) дней как ЭВМ центральных служб,
    так и ЭВМ на предприятиях оказываются перегруженными. Будучи
    уверенным в том, что нехватка машинного времени в эти периоды
    приводит к дорогостоящим и вызывающим естественное раздражение
    задержкам в производстве, он планирует установить в центральных
    службах фирмы либо одну ЭВМ средней мощности взамен имеющихся
    там четырех ЭВМ, либо одну большую ЭВМ, заменив ею парк ЭВМ
    центральных служб и некоторые из малых ЭВМ, размещенных
    на предприятиях.
    Начальник производственного отдела четко представляет себе,
    что при принятии организационного решения необходимо учесть ряд
    трудноформализуемых факторов, в частности относительные преимущества децентрализованного использования ЭВМ. Однако ему хотелось бы сопоставить эти соображения с возможностями более мощной
    и экономически более эффективной ЭВМ. Кроме того, с помощью
    нового вычислительного комплекса он намерен устранить или по
    крайней мере существенно снизить наблюдающиеся перегрузки ЭВМ
    и обусловленные ими задержки и перерывы в производстве.
    То, что в какой-то момент возникнет необходимость реконструировать электронно-вычислительный комплекс фирмы, начальник
    производственного отдела понял уже несколько лет назад. Именно
    тогда им были начаты работы по сбору и систематизации данных, •
    относящихся ко всем режимам функционирования принадлежащих
    фирме ЭВМ. Поэтому начальнику производственного отдела фирмы
    было известно, например, количество часов, расходуемое каждой
    ЭВМ на составление платежных ведомостей, на учет складских
    запасов, на проверку правильности оформления счетов и т. д. Фирмы,,
    занимающиеся производством ЭВМ, снабдили его временными показателями выполнения тех же самых видов работ с помощью больших
    ЭВМ и ЭВМ среднего размера.
    Начальник производственного отдела фирмы обратился в отдел
    исследования операций с просьбой помочь ему проанализировать
    возникшую проблему. Фактически начальник производственного
    отдела уже располагал (в первом приближении) данными для построения линейной модели. По его мнению, управляемыми переменными

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    9

    Xjj должны явиться частоты поступления заказов на выполнение
    работы i-ro вида на ЭВМ /-го типа 1); коэффициент при управляемой
    переменной хц должен выражать скорость выполнения машиной
    /-го типа работы i-ro вида; ограничения должны отражать то обстоятельство, что суммарное число «заказов» на выполнение каждого,
    вида работ, а также машинное время каждой ЭВМ лимитированы;
    целевая функция должна выражаться через величины Cjj, представляющие собой стоимость выполнения работы i-ro вида на ЭВМ
    ;-го типа.
    Можно ли задачу фирмы «Цветметалл» анализировать таким же
    образом, как и задачу фирмы «Бонбон»? Одинакова ли в этих задачах роль неопределенности? Что думает по этому поводу читатель?
    Как на первый, так и на второй вопрос следует дать отрицательный ответ. Попытаемся это аргументировать.
    В примере с фирмой «Бонбон» получаемая прибыль однозначно
    выражается через среднегодовые показатели, так как доля рынка,
    контролируемого этой фирмой, является той основой, которая
    определяет производственную деятельность фирмы в течение года.
    В случае фирмы «Цветметалл» метод усреднения (на некотором
    большом интервале времени, например равном одному году) исказил бы саму суть проблемы «перегрузок», так как последние обусловлены неравномерностью (во времени) поступления заявок на различные виды вычислительных работ или, другими словами, неравномерным временным распределением потребностей в машинном времени. Совершенно очевидно, что и при существующей структуре
    электронно-вычислительного комплекса все виды работ в конечном
    итоге оказываются выполненными — дополнительные вычислительные мощности требуются для того, чтобы сократить задержки в выполнении «заказов», обусловленные неравномерностью их поступления.
    Таким образом, математическая модель будет в данной ситуации
    полезной лишь в том случае, если в ней будет отражено влияние
    случайных событий в самом процессе функционирования исследуемой
    системы. Другими словами, метод анализа рассматриваемой проблемы
    должен учитывать текущие события с тем, чтобы обеспечить оценку
    среднего числа заказов, выполняемых в течение года с существенными задержками.
    Читателю, видимо, интересно было бы знать, можно ли для
    задачи фирмы «Цветметалл» построить такую модель, в которой
    использовались бы усредненные (за год) данные и одновременно
    учитывалось бы влияние «текущей» неопределенности. Не исключено,
    что это возможно. Однако модель такого типа, по-видимому, была бы
    неудобной для практического использования. Перегрузки ЭВМ
    можно было бы учесть с помощью «специального» приема путем
    введения фиктивного дополнительного времени на выполнение работы
    й
    ) То есть величины, показывающие, сколько раз за единицу времени;
    (например, в течение года) работу г-го типа выполняли на ЭВМ /-го типа.—
    Прим. перев.

    10

    ГЛАВА 16

    i-ro вида на ЭВМ ;'-го типа. Такой прием в сочетании с анализом
    модели на чувствительность мог бы быть достаточно эффективным,
    если бы в задаче фигурировало лишь весьма небольшое число видов
    работ и типов ЭВМ. Однако, знакомясь с последующими главами, ,
    читатель убедится, что существуют другого класса модели, именуемые стохастическими (или вероятностными), которые в значительно
    большей степени приспособлены для анализа задач, связанных
    с оптимизацией так называемой пропускной способности. В этих
    моделях используются данные предыдущих наблюдений (или измерений), позволяющие описать вероятностный характер поступления
    «заявок» на обслуживание и, следовательно, заострить внимание
    на элементах неопределенности, свойственных задачам такого типа.
    Что касается методов нахождения (численных) решений для стохастических моделей, то их детальное обсуждение было бы пока
    преждевременным и практически невозможным. Они составят предмет
    особого рассмотрения в последующих разделах книги. Пока же
    достаточно отметить, что в зависимости от математической структуры
    модели для получения численных решений задач стохастического
    характера могут использоваться алгоритмы линейного или нелинейного программирования, методы динамического программирования, а в тех случаях, когда ни один из перечисленных способов
    не приводит к успеху, возможно применение так называемого имитационного моделирования (гл. 21). Таким образом, по мере ознакомления с материалом, содержащимся в данном томе, читатель сможет
    убедиться в том, что вычислительные методы, развитые в предыдущих томах, оказываются также эффективными и при решении многих
    стохастических задач. Кроме того, ниже будет изложен ряд специальных методов и приемов решения задач, содержащих элементы
    неопределенности.
    Предварительные замечания относительно вероятностных моделей. В рассмотренных выше примерах обсуждались два различных
    способа учета неопределенности при решении задач организационного управления: 1) с помощью анализа на чувствительность решения,
    полученного для детерминированной модели, и 2) путем построения
    модели, содержащей фактор неопределенности в явном виде. Основным предметом обсуждения в данном томе является методология
    учета и анализа вероятностных характеристик в оптимизационных
    моделях. При этом любая неопределенность будет рассматриваться
    нами как совокупность неполных предсказаний, характеризуемая
    некоторым распределением вероятностей различных возможных
    событий (или исходов). Во многих случаях построенные таким образом модели будут представлять собой лишь в определенной степени
    усложненные варианты детерминистических моделей, решения для
    которых могут быть найдены уже известными нам методами. Однако
    это имеет место далеко не всегда. В ряде случаев для получения
    решения достаточно лишь подставить математическое ожидание той
    или иной величины в детерминистическую модель; однако гораздо

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    Ц

    чаще для получения численных решений нам придется (если это
    не будет сопряжено со слишком большими трудностями) искать
    соответствующую оптимальную стратегию. Если же нахождение
    оптимальной стратегии окажется слишком затруднительным, мы
    будем вынуждены использовать в процессе вычислений произвольные
    (принятые на основании здравого смысла) предположения относительно характера и «поведения» неопределенности.
    В любом случае по сравнению с детерминистическими моделями
    использовать вероятностные модели значительно сложнее. Во-первых,
    возникают трудности концептуального характера (например, связанные с интерпретацией самого понятия «вероятность» и с определением
    критерия оптимальности; см. разд. 16.2). Во-вторых, появляются
    дополнительные трудности технического порядка, обусловленные
    особенностями математического аппарата, используемого при решении стохастических задач оптимизации. Так, например, даже в том
    случае, когда стохастическая модель является простым обобщением
    ее детерминистического аналога, объем вычислительных процедур
    возрастает, поскольку приходится рассматривать каждое возможное
    событие вместо одной-единственной оценки. Кроме того, в стохастических моделях критериальные функции г), как правило, являются
    нелинейными, и, следовательно, задача оптимизации носит более
    сложный характер. В-третьих, для нахождения распределения
    вероятностей требуется большое число исходных данных. Например,
    руководитель фирмы может заметить флуктуации цен на продукцию
    конкурирующей фирмы, однако далеко не всегда ему удается сформулировать соответствующий закон распределения вероятностей.
    Таким образом, абстрагируясь от мотивов чисто познавательного
    плана, можно утверждать, что интерес к стохастическим явлениям
    был бы весьма ограниченным, если бы его не стимулировала практическая необходимость решения конкретных задач организационного
    управления.
    Еще раз об искусстве выбора модели. Мы снова возвращаемся
    к вопросу: каким образом при решении конкретной практической
    задачи организационного управления производится выбор подходящей для этого случая математической модели? К сожалению, нет
    такого учебника, который содержал бы непогрешимые рецепты,
    позволяющие сделать этот выбор совершенно безошибочным. Операционист вынужден полагаться на опыт, здравый смысл и непрерывный анализ реальных ситуаций.
    Выполняя конкретное исследование, операционист (так же как
    и руководитель) обычно имеет возможность получить квалифицированную консультацию или мудрый совет со стороны. В этом можно
    видеть некоторое утешение. Однако если принимать управляющее
    решение предстоит вам, то и ответственность за это решение (каковы бы ни были его последствия) придется нести именно вам, а не вашим
    To есть критерии эффективности, или целевые функции.— Прим. перев.

    12

    ГЛАВА 16

    советчикам. Следовательно, работая над освоением излагаемых здесь
    методов эффективного использования математического аппарата при
    решении задач организационного управления, читатель не должен
    забывать о том, что это не избавляет его от необходимости развивать
    в себе творческие способности и профессиональную интуицию.
    Чтобы помочь читателю справиться с этой задачей, мы подобрали
    для данного тома значительное число примеров, представляющих
    собой стохастические аналоги моделей, рассмотренных в предыдущих
    томах. Необходимо развить в себе умение видеть влияние неопределенности на постановку организационно-управленческой задачи
    через призму модели. Тогда, столкнувшись с практической задачей
    принятия управляющего решения в условиях неопределенности,,
    читатель сможет более уверенно определить те существенные моменты,
    которые необходимо отразить в математической модели, и, следовательно, найти ключ к решению проблемы.
    Некоторые методические указания. В оставшейся части этой
    главы, а также в двух последующих главах показано, каким образом
    можно обобщить многие из задач, рассмотренные в предыдущих
    томах, с тем чтобы учесть в них элементы случайности. Одновременно сформулирован ряд общих положений (теорем) об оптимальных решениях для стохастических моделей. Наконец, продемонстрирована применимость уже известных читателю методов (в частности,
    линейного и динамического программирования) для нахождения
    в случае такого рода моделей соответствующих численных решений.
    Таким образом, три первых главы этого тома свяжут весь последующий материал с содержанием двух предыдущих томов. Важно
    вместе с тем иметь в виду, что многие из моделей, рассмотренные
    в первых трех главах настоящего тома, носят слишком общий характер. В них явно недостаточно представлена «тонкая» структура
    и нечетко определена форма представления оптимального решения.
    Поэтому глубинное содержание понятия «оптимальное решение»
    здесь раскрывается далеко не в полной мере, а модели трудно поддаются количественному анализу. Однако в последующих главах
    читатель найдет хорошо структурированные модели, позволяющие
    разобраться в подробностях метода стохастического программирования.
    Один исключительно важный класс вероятностных моделей связан
    с задачей управления запасами в условиях, когда спрос на продукцию заранее не известен. Несколько моделей этого класса, а также
    ряд наиболее эффективных методов их анализа рассмотрены в гл. 19
    и приложении II. Другой, имеющий широкое применение класс
    стохастических моделей ориентирован на решение так называемых
    задач массового обслуживания. Именно к такой категории можно
    отнести рассмотренную выше задачу обновления электронно-вычислительного комплекса фирмы «Цветметалл». Если условия образования и обслуживания очереди не слишком сложны, рабочие характеристики системы (такие, как средняя длина очереди, среднее

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    13

    время ожидания и вероятность наступления событий, когда очередь
    полностью отсутствует) могут быть найдены с помощью аналитических методов, изложение которых содержится в гл. 20 и приложении III. Результаты, обсуждению которых посвящены указанные
    разделы тома, позволяют, кроме того, оценить в целом возможности
    стохастического программирования при решении задач минимизации
    задержек, связанных с ожиданием обслуживания. Процессы образования очередей в условиях вероятностного характера потока
    заявок бывают иногда настолько сложными, что их анализ стандартными математическими методами оказывается затруднительным; для
    исследования такого рода процессов нередко приходится применять
    имитационное моделирование с помощью ЭВМ. Основы имитационного моделирования на ЭВМ, а также ряд конкретных приемов
    построения имитационных моделей излагаются в гл. 21.
    При изучении каждой из приведенных ниже стохастических моделей полезно заострить внимание на следующих вопросах:
    1. Какова оптимальная стратегия детерминистического аналога
    рассматриваемой модели?
    2. Какой объем информации о распределении вероятностей необходим для определения оптимального решения?
    Рассмотрение первого вопроса позволяет лучше понять роль
    неопределенности в каждом конкретном случае. В некоторых примерах детерминистические варианты моделей имеют тривиальные
    решения и, следовательно, читателю удастся прочувствовать, в какой
    степени наличие элемента неопределенности усложняет задачу принятия управляющих решений. Нахождение оптимального решения
    детерминистического варианта задачи проще по сравнению со случаем ее стохастического аналога, а также тогда, когда детерминированная модель нетривиальна, и, таким образом, читатель сможет
    оценить ту дополнительную сложность, которая возникает при учете
    фактора неопределенности. Важность второго вопроса станет совершенно очевидной, когда читатель приступит к изучению так называемого метода вероятностных ограничений (см., например, разд.
    16.5), в котором для нахождения оптимальной стратегии требуются
    лишь квантили распределений вероятностей. Добросовестно пытаясь
    ответить на поставленные выше вопросы при рассмотрении каждой
    из сформулированных ниже задач, читатель сможет более детально
    разобраться в основах стохастического моделирования.
    16.2.

    НА ПУТИ К ОПТИМАЛЬНОМУ РЕШЕНИЮ

    Прежде чем приступать к подробному обсуждению конкретных
    моделей и примеров, следует сказать несколько слов о характере
    той дополнительной сложности, которая возникает всякий раз,
    когда пытаются найти оптимальное решение в условиях неопределенности. Мы будем исходить из предположения, что читатель полностью овладел приемами построения детерминистических моделей,

    14

    ГЛАВА 16

    а также соответствующими методами оптимизации. В частности,
    читателю должно быть ясно, что в случае задач линейного и динамического программирования, рассмотрению которых посвящены
    два предыдущих тома, как само решение, так и последствия принятия
    этого решения определяются совершенно однозначно. Так, например,
    в детерминистической задаче планирования производства заведомоизвестно, какое добавочное количество продукции будет получено,
    если переработать 10 дополнительных единиц сырья. Аналогично
    детерминистическая модель управления запасами содержит очевидное предположение, согласно которому, зная объемы закупок в течение нескольких ближайших отрезков времени, можно точно вычислить уровни запасов на протяжении всего планового периода.
    Но представим себе другую ситуацию: пусть при переработке
    10 дополнительных единиц сырья можно получить различные объемы
    разнотипной продукции или предположим, что в задаче управления
    запасами объемы складируемой продукции зависят от фактического
    уровня сбыта. Другими словами, рассмотрим ситуацию, когда приходится принимать решение или определять стратегию, не имея
    полного представления о том, к каким результатам могут привести
    запланированные действия.
    Всякий раз, когда выбор осуществляется в условиях неопределенности, прежде всего следует уяснить, какой смысл вкладывается
    в понятие оптимальное решение. В настоящем разделе этот вопрос
    обсуждается во всех подробностях.
    В то же время, если требуется принять немедленно лишь некоторые из всей совокупности решений, а другие решения можно отложить до того "момента, когда неопределенность частично исчезнет,
    возникает необходимость проанализировать возможность построения
    условного плана, или стратегии. Обращаясь вновь к задаче управления запасами, можно конкретизировать эту мысль следующим образом: вначале определяется объем закупок на текущий (первый)
    период, а для последующих периодов разрабатывается своего рода
    инструкция, позволяющая определить объемы заказов в зависимости
    от уровней спроса, наблюдаемых в течение предыдущих периодов.
    Таким образом, трудно, а порой даже невозможно утверждать,
    какими должны быть объемы закупок после первого периода, но существуют четкие альтернативы, определяемые в момент принятия
    будущих решений данными ретроспективного анализа. Понятие
    «стратегия принятия управляющих решений» подробнее будет обсуждаться в следующем разделе.
    Математическое ожидание случайных величин. Если бы читателю
    приходилось применять на практике методы моделирования, рассматриваемые в предыдущих томах, он согласился бы с утверждением, что использование единственной целевой функции, подлежащей
    оптимизации, продиктовано лишь удобством выбора в этом случае
    какого-то одного управляющего решения из огромного числа допустимых вариантов. Руководители, имеющие опыт практического

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    15

    применения методов исследования операций, хорошо знают, что
    получаемое с помощью математической модели решение редко является оптимальным «абсолютно со всех точек зрения». Фактически
    почти всегда получаемое решение корректируют «вручную», с тем
    чтобы окончательно согласовать его с действительностью. В ряде же
    случаев производят изменения в структуре модели и ищут новое
    «оптимальное» решение.
    При решении задач оптимизации управляющих решений в условиях неопределенности мы будем поступать аналогичным образом,
    строя модели, содержащие единственную (подлежащую оптимизации)
    целевую функцию. Однако с самого начала следует предупредить
    читателя о том, что при решении практических задач ему необходимо будет исследовать различные рабочие характеристики решения,
    получаемого на основе единственного критерия оптимизации. Это
    решение, если необходимо, корректируется на основе дополнительных соображений, или же модифицируется сама модель, с тем чтобы
    получаемый с ее помощью результат приобрел практическую ценность и был успешно внедрен заинтересованной организацией.
    В большинстве моделей, к рассмотрению которых мы переходим,
    фактор неопределенности сказывается на значениях выбранного
    (или заданного) экономического критерия эффективности. Поэтому
    именно математическое ожидание (которое называется также
    средним или ожидаемым значением) экономического критерия будет
    постоянно использоваться нами в качестве оптимизируемой целевой
    функции. В последнее время специалистами по теории принятия
    решений разработано несколько методов обоснования того, что при
    поиске оптимального варианта действий следует исходить именно
    из среднего значения упомянутого критерия. Доказательства этого
    положения можно найти в современных монографиях, посвященных
    вопросам статистического анализа. Но как бы ни были эти доказательства увлекательными, мы не останавливаемся на них в данной
    книге, поскольку независимо от того, нашел бы их читатель убедительными или нет, при решении задач оптимизации управляющих
    решений мы все равно будем использовать математическое ожидание
    экономического критерия в качестве целевой функции стохастической модели. (Вместе с тем мы частично компенсируем отсутствие
    последовательного теоретического анализа этого вопроса путем
    детального рассмотрения конкретных операционных ситуаций.)
    За редким исключением, нами используются лишь элементарные
    понятия теории вероятностей, такие, как математическое ожидание
    и функция распределения. Нередко мы пользуемся дискретными
    распределениями вероятностей, так что читателю в процессе вычислений не понадобится обращаться к дифференциальному и интегральному исчислению. В ряде случаев приводятся лишь окончательные результаты вычислений, основанные на применении дифференциального и интегрального исчислений; несмотря на то что
    формулы иногда выглядят весьма сложными, при задании численных

    16

    ГЛАВА 16

    значений фигурирующих в модели параметров у читателя в процессе
    вычислений не должно возникать никаких трудностей.
    Следует вместе с тем заметить, что даже те читатели, которые
    прослушали (или изучили самостоятельно) полный курс теории
    вероятностей, могут с некоторыми из математических соотношений
    встретиться впервые и поэтому найдут их несколько необычными.
    Это объясняется тем, что в большинстве учебников по теории вероятностей вопросы оптимизации управляющих решений не рассматриваются. По этой причине средние значения и дисперсия некоторых
    случайных величин могут показаться читателю весьма сложными
    для восприятия.
    Нахождение встречающихся в данном томе математических ожиданий различного рода величин, вообще говоря, ненамного сложнее
    вычисления средних для заданных распределений. Для подтверждения этого замечания дадим краткий обзор основных понятий, которые будут использоваться нами при анализе приводимых ниже
    примеров.
    Пусть X есть случайная величина, которая может принимать
    одно из значений п = О, 1, 2, . . ., N. Обозначим через Р [X = п]
    вероятность того, что X принимает значение п. Тогда математическое
    ожидание случайной величины X определяется следующей формулой:
    N

    Е[Х] = 2 п-Р[Х = п]
    п=0

    (ожидаемое значение X).

    (1)

    Если переменная X может с некоторой положительной вероятностью
    принимать любое неотрицательное целочисленное значение, в выражении (1) вместо N должен фигурировать символ сю; при этом (как
    и в других случаях, когда производится суммирование бесконечной
    последовательности значений) постулируется, что математическое
    ожидание всегда представляет собой конечное число.
    Предположим теперь, что нам требуется вычислить математическое ожидание X2. В этом случае
    2

    Е[Х \^

    N

    S п*-Р(Х-=п}

    п=0

    2

    (ожидаемое значение X ).

    (2)

    Рассмотрим наиболее общий случай. Пусть требуется вычислить
    математическое ожидание некоторой функции случайной переменной
    (обозначим эту функцию через / (X)). Тогда
    ft
    E [ f ( X ) ] = S f ( n ) - P [ X = n] (ожидаемое значение /(X)). (3)
    n=0

    Приведем пример, когда выражение (3) применяется для анализа
    задачи, критериальная (целевая) функция которой имеет экономическое содержание. Рассмотрим простой, но весьма типичный экономический критерий — ожидаемые затраты, связанные с хранением
    складских запасов в течение планового периода единичной протя-

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    17

    ценности. Обозначим через D случайную величину, представляющую собой объем потребительского спроса за единичный период.
    Пусть D может принимать значения d = О, 1, 2, . . ., N; соответствующие вероятности обозначим через Р [D = d]. Предположим,
    что приобретается у единиц продукции, которая складируется
    с целью обеспечения резерва, служащего для удовлетворения потребительского спроса. Пусть стоимость единицы продукции равняется
    с долл. Если часть запасов окажется в конце рассматриваемого
    периода нереализованной, то это вызовет издержки, связанные
    с хранением; затраты на хранение единицы продукции в течение
    одного периода обозначим через h. (Допустим, что нереализованная
    в конце планового периода продукция полностью обесценивается.)
    В случае же, когда спрос D превышает объем заказа у, то за каждую
    недостающую единицу продукции взимается штраф в размере р.
    Таким образом, суммарные затраты в течение одного периода зависят не только от объема заказа, но и от фактического уровня спроса.
    Поскольку объем заказа у должен определяться в условиях, когда
    спрос точно не известен, «потенциальный результат» управляющего
    решения вполне правомерно выразить через математическое ожидание суммарных затрат.
    Обозначим через / (d у) суммарные затраты в случае, когда
    D = d, а объем заказа равен у. Тогда

    f(d\y) =

    cy-\-h-(y — d),

    если d^y

    cy^-p-(d — у),

    если d>y

    (объем заказа превышает
    уровень спроса),

    (уровень спроса превышает объем заказа).
    (4)
    Следовательно, ожидаемые затраты при условии, если объем заказа
    у ограничен некоторым значением N (у ^ N), определяются следующими выражениями:
    N

    E[f(D\y)]=^f(d\y).P[D
    d=0

    E[f(D\y)]

    =

    (5)

    = d],

    f ( d \ y ) . P [ D = d}+ 2

    d=y+l

    f ( d \ y ) . P [ D = d]
    (если y
    (6)

    E[1(D\y)\ =
    N

    d=y+l

    (7)

    Выражение (5) есть не что иное, как определение математического
    ожидания; выражение (6) получается путем разделения исходной
    суммы в (5) на две части (суммирование от 0 до у и затем суммирование от у -\- 1 до N, где у — объем заказа, a d — уровень спроса);

    18

    ГЛАВА 16

    выражение (7) получается из выражения (6) путем подстановки
    в последнюю / (d \ у), определяемую выражением (4).
    Выполним некоторые дополнительные алгебраические преобразования. Заметим, что в (7) произведение су фигурирует как под
    знаком первой, так и под знаком второй суммы. Следовательно,
    величина су умножается на вероятность того, что D принимает
    по крайней мере одно из множества возможных значений; поскольку сумма вероятностей Р [D = d] по всем значениям d равна единице, мы получаем
    E [ f ( D \ y ) ] = cy+j^h-(y-d).P[D
    d=0

    = d] + 2

    d=y+l

    p-(d-y)-P[D = d]

    (ожидаемые затраты при заданном у). (8)
    Выражение (8) имеет следующую непосредственную интерпретацию: если складской запас составляет у единиц продукции, то математическое ожидание суммарных затрат складывается из покупной
    стоимости указанного объема продукции, математического ожидания
    затрат на ее хранение и математического ожидания потерь из-за
    неудовлетворения спроса.
    Выражение (8) было получено нами подстановкой / (d \ у) в (3).
    При построении оптимизационных моделей, аналогичных только что
    рассмотренной, значительно удобнее сразу же начинать с записи
    выражения, аналогичного (8). Поэтому в последующих разделах
    мы будем практиковать построение целевой функции в виде суммы
    ожидаемых затрат (или доходов), опуская промежуточные выкладки.
    В тех случаях, когда у читателя возникает желание проверить
    правильность записи целевой функции, он может провести анализ,
    аналогичный представленному выше. При этом прежде всего следует
    построить экономический критерий в виде функции случайных величин при заданных значениях управляемых переменных. Затем нужно взять математическое ожидание этой функции с учетом всех
    возможных значений случайных переменных и провести необходимые упрощения.
    Рассмотрим теперь конкретный пример оптимизации управляющего решения в условиях неопределенности, выбирая в качестве
    целевой функции математическое ожидание экономического критерия эффективности.
    Оптимальные решения. Обратимся снова к задаче расширения
    производства фирмы «Бонбон» (разд. 16.1). Напомним, что речь
    шла о дилемме: увеличить производственные мощности существующего предприятия или построить новый завод. Прибыль, получаемая
    фирмой в результате принятия того или иного решения, зависит
    от того, какая доля рынков сбыта будет контролироваться фирмой
    в последующие периоды. Предположим, что президент фирмы оценивает вероятность того, что фирма сможет сохранить контроль
    за приходящимися на ее долю 35% рынка сбыта, в V 2 , а вероятность
    того, что эта доля будет равняться 30 и 40%,— в г / 8 и 3/8 соответ-

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    19

    ственно. Годовой доход фирмы в каждом из этих случаев указан
    в таблице на рис. 16.1.
    Каким образом разрешил бы читатель дилемму фирмы «Бонбон»,
    если бы он оказался на месте ее президента? Насколько пагубными
    оказались бы последствия, если бы было принято решение построить
    Доля рынка
    сбыта, контролируемая фирмой, %

    30
    35
    40

    Оценка
    вероятности

    Годовой доход, млн. долл.
    увеличение производстстроительство
    венных мощностей
    нового
    предприядействующего предтия
    приятия

    90
    100
    130

    Vs
    1/2
    3

    /8

    50
    100
    150

    Р и с . 16.1. Задачи фирмы «Бонбон».

    новый завод, а удельный вес фирмы в общем объеме сбыта рассматриваемых изделий снизился бы до 30% и, таким образом, годовой
    доход фирмы составил бы лишь 50 млн. долл. вместо 90 млн. долл.
    в настоящее время? В какой степени пострадала бы фирма, если
    упомянутая выше дилемма была бы решена в пользу увеличения
    производственных мощностей уже действующего предприятия, а доля фирмы в общем объеме сбыта возросла бы до 40% и, таким образом, годовой доход фирмы увеличился бы до 130 млн. долл., тогда
    как при другом варианте решения годовой доход мог достичь
    150 млн. долл.?
    В ситуациях, аналогичных только что описанной, когда число
    альтернатив невелико, можно найти распределение вероятностей
    возможных значений целевой функции и таким путем оценить относительные достоинства каждого варианта действий. Однако в большинстве рассматриваемых здесь случаев мы, по крайней мере на
    первых порах, будем стремиться помочь читателю отыскать тот
    вариант действия, который оптимизирует ожидаемое значение экономического критерия. В случае дилеммы фирмы «Бонбон» с помощью таблицы, приведенной на рис. 16.1, легко показать, что
    г Ожидаемая годовая прибыльв случае увеличения произI Бедственных мощностей дей- = 90-4-+ЮО 4+130-|=
    иствующего предприятия

    (9)
    Ожидаемая годовая прибыль
    в случае строительства нового
    [_предприятия

    '

    ^
    =50«-g-- T -100-y

    150- - =

    20

    ГЛАВА 16

    Сравнивая полученные значения ожидаемой годовой прибыли, мы
    видим, что вариант, предусматривающий строительство нового завода, несколько выгоднее.
    Некоторые из читателей, возможно, будут придерживаться той
    точки зрения, что столь незначительная разница между ожидаемыми значениями годовой прибыли [см. (9)] в действительности не скажется на фактических экономических последствиях выбора варианта
    решения. Если читатель действительно так думает, то пусть рассмотренный пример послужит ему просто иллюстрацией метода.
    Вместе с тем следует подчеркнуть, что всякий раз, когда в зависимости от варианта решения наблюдается хотя бы небольшое
    различие между ожидаемыми значениями целевой функции, для
    окончательной оценки целесообразности того или иного выбора
    необходимо учесть также другие характеристики решения.
    Неопределенность в выборе вариантов действий. Динамические
    детерминированные модели, рассмотренные в гл. 8—12, позволяют
    совершенно однозначно предсказать последовательность решений,
    вытекающих из той или иной заданной стратегии. Так, например,
    в модели календарного планирования производства, когда потребительский спрос известен для всей протяженности планового периода,
    определение уровней производства для каждого отрезка времени
    внутри этого периода не представляет особой трудности. Однако
    если уровни потребительского спроса можно описать лишь с помощью распределения вероятностей, то, как правило, однозначное
    предсказание будущих уровней производства оказывается невозможным.
    Предположим теперь, что в связи с решением задачи календарного планирования производства нам удалось разработать динамическую стратегию, позволяющую определить, каким должен быть
    объем выпускаемой продукции при произвольном значении уровня
    запасов в начале любого отрезка планового периода. Такая стратегия
    фактически привела бы к вероятностному распределению для планируемых на будущее объемов выпуска продукции.
    Чтобы проиллюстрировать это важное положение, рассмотрим
    следующую упрощенную модель. Пусть в начале каждого отрезка
    планового периода уровень запасов может принимать одно из значений i = О, 1, 2, 3. Допустим, что полный (суммарный) период
    планирования имеет неограниченную протяженность, а динамическая стратегия стационарна. Обозначим через х^ (i) решение относительно текущего уровня производства при заданном i, причем

    «ос (0) = Хес (1) = хх (2) = 3, хх (3) = 0,

    (10)

    т. е. в течение каждого отрезка планового периода производится
    3 единицы продукции, за исключением случаев, когда в начале
    отрезка объем запасов составляет 3 единицы. Предположим, что
    на любом отрезке уровень спроса характеризуется следующим рас-

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ

    МОДЕЛЕЙ

    21

    пределением:
    Dt = 2 с вероятностью V 2 ,

    Dt = 3 с вероятностью V 2 .

    (11)

    Когда объем запасов в начале того или иного отрезка планового
    периода равен 2 единицам, то в течение этого отрезка производится
    3 единицы продукции, а в течение последующего отрезка планового
    периода либо продукция не производится (если спрос на предыдущем
    отрезке равняется 2 единицам), либо производится 3 единицы продукции (если спрос на предыдущем отрезке планового периода равнялся 3 единицам 1)).
    Продолжая анализ по аналогии с только что проведенным, убеждаемся, что в течение следующего по порядку отрезка производится
    либо 0 единиц продукции с вероятностью V 4 (если спрос на первом
    и на втором из рассмотренных отрезков планового периода составляет соответственно 3 и 2 единицы), либо 3 единицы продукции
    с вероятностью 3 / 4 (1 — V 4 = 3 /4)Такой метод рассмотрения приводит к важному выводу: даже
    в том случае, когда «составляющие» решения, предусмотренные
    стационарной стратегией (10), являются детерминированными, оптимальные значения управляемых параметров распределяются во времени случайным образом в силу неопределенности, вводимой в саму
    структуру модели, описываемой с помощью (11). В результате
    соответствующие затраты за суммарный плановый период определяются сложным, так называемым совместным, распределением.
    Для большинства динамических задач, содержащих элементы
    вероятностного характера, требуется планировать будущие решения
    с учетом будущей неопределенности. Учитывая это обстоятельство,
    следует в каждом конкретном случае тщательно изучить структуру
    стохастической модели на предмет уточнения информации о предыдущих значениях случайных величин, которая имеется в наличии
    в момент принятия каждого управляющего решения. При построении математической модели легко допустить ошибку, если не провести четкого различия между хаотической временной последовательностью случайных событий и хронологически упорядоченной
    последовательностью управляющих решений, частично базирующихся на фактически зарегистрированных исходах, относящихся к прошлому. Приводимые ниже примеры, а также модели, рассмотренные в гл. 17, помогут читателю разобраться в принципах анализа
    (и решения) такого рода многошаговых задач.
    При рассмотрении индуцированной «стохастики» в развертывающейся последовательности решений возникает еще одно важное
    понятие — стационарное (установившееся) поведение. Поясним это
    понятие, снова обратившись к модели, заданной соотношениями (10)
    и (11). Обозначим через pt ту долю отрезков (по отношению к общему
    1

    1

    ) Согласно (11), вероятность каждого варианта равняется / 2 .— Лпим
    пер ев.
    ^

    22

    ГЛАВА 16

    числу отрезков при неограниченном плановом периоде), в начале
    которых объем запасов равен г. Из характера стратегии (10) с учетом (11) получаем

    1
    Po = -g-,

    1
    р4 = -д

    1
    1
    р2 =Т , Рз =¥ .

    ,.

    (12)оч

    Пусть далее qx означает долю отрезков (по отношению к общему
    числу отрезков при неограниченном плановом периоде), в течение которых производится х единиц продукции. Легко убедиться,
    что из (10) и (12) следует

    Иногда оптимальное решение для стохастической модели требует
    от руководителя сознательного применения стратегии «случайного
    блуждания». Можно, конечно, критиковать отдельные структурные
    элементы моделей, приводящих к решениям такого вида, однако
    вряд ли имеет смысл отрицать сам факт существования рандомизированных стратегий х), поскольку, как мы уже видели, существует
    беспорядочность в выборе вариантов действий, индуцированная фактором неопределенности.
    Ниже приводится гипотетический пример, с помощью которого
    мы убедимся, что рандомизированная стратегия может быть оптимальной. Представим себе, что управляющий пекарней «Пышка»
    обнаружил, что ежедневный спрос на один вид его фирменных
    тортов характеризуется следующим распределением вероятностей:
    Р [нет спроса] = V 6 ,
    Р [покупается 1 торт] = V e ,
    2
    Р [покупаются 2 торта] = /3.
    Допустим, что спрос в любой из дней не зависит от спроса в предыдущие дни. Себестоимость одного торта равна с; торт, не проданный
    в течение дня, выбрасывают. Управляющий не стремится выпекать
    слишком много тортов, так как их себестоимость достаточно велика,
    но вместе с тем ему хочется удовлетворить приемлемый уровень
    спроса. В этой связи он формулирует задачу выбора управляющего
    решения следующим образом: минимизировать расходы на выпечку
    тортов при ограничении, заключающемся в том, что вероятность
    удовлетворения полного ежедневного спроса на торты этого вида
    х
    должна равняться по крайней мере /зМожет показаться, что оптимальное решение должно состоять
    в том, чтобы ограничиться выпечкой одного торта (при затратах,
    равных 1 с), так как в этом случае полный спрос удовлетворяется
    с вероятностью V 3 (V e + V 6 = V 3 ). Допустим, однако, что управх
    ) То есть, иными словами, стратегий случайного выбора, или действий
    наугад.— Прим. перее.

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ^ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    23

    ляюший будет придерживаться следующего рандомизированного
    правила принятия решения: не выпекать ни одного торта в четырех
    случаях из пяти (вероятность 4/5) и выпекать два торта в одном случае из пяти (вероятность 1/5). При этом полный спрос будет по-прежнему удовлетворен с вероятностью V 3 ( V s - V e + 14/5 - l = 1 /з)> а что
    касается ожидаемых затрат, то они составят 0,4 с ( / 5 -0 с + V 5 -2 с •—
    = 0,4 с), т. е. будут меньше затрат (равных 1 с) в случае нерандомизированной (детерминированной) стратегии. Приведенное выше
    рандомизированное правило является оптимальным.
    Предположим теперь, что вместо ограничения на вероятность
    полного удовлетворения спроса в той же самой задаче минимизации
    формулируется другое требование: удовлетворить в среднем по крайней мере 1/3 ожидаемого ежедневного спроса. С помощью (1) легко
    показать, что ожидаемый ежедневный спрос равен 3 / 2 , и, следовательно, согласно введенному ограничению, ежедневно должно быть
    продано в среднем не менее V 2 торта. Если в данном случае воспользоваться детерминистической стратегией и выпекать по одному
    торту в день, то в среднем ежедневно будет продаваться по 5 / 6 торта
    (V 6 -0 -f- V 6 -l +2 / 3 -1 = 5/6), что превышает предельное значение (V 2 ),
    содержащееся в ограничении. Оптимальной же является рандомизированная стратегия, заключающаяся в том, чтобы не выпекать ни
    одного торта в двух случаях из пяти (вероятность 2/5) и выпекать
    один торт в трех случаях из пяти (вероятность 3 / 5 ). В этом случае
    будет продаваться в среднем V 2 торта ( 2 / 5 -0 + 3 / 5 - 5 / 6 = 1 / 2 ), а ожидаемые затраты составят 0,6 с (2/&-0 с -f- %•! с = 0,6 с), т. е. они
    будут меньше, чем в варианте с детерминистической стратегией.
    Вообще справедливо следующее утверждение: всякий раз, когда
    оптимизационная модель содержит ограничения на вероятности
    наступления тех или иных событий или на математические ожидания
    случайных величин, оптимальное решение может быть получено
    путем рандомизации.
    Мультивременная целевая функция. В стохастических динамических моделях, предназначенных для оптимизации некоторой последовательности значений дохода (эффекта) целевая функция представляет собой ожидаемое значение ее детерминистского аналога.
    Проиллюстрируем эту мысль на следующем примере. Пусть Rt —
    доход, получаемый, согласно динамической модели, на отрезке t.
    Как уже отмечалось выше, при наличии элементов неопределенности
    стратегия формирования управляющих решений на протяжении
    полного планового периода порождает совместное распределение
    вероятностей для элементов последовательности (R\, /?2, RZ- • • •)•
    Примем в качестве постулата, что целевой функцией является математическое ожидание суммарного приведенного потока доходов
    Е [Приведенный суммарный доход] =
    = E[Rt + aR2 + а 2 Д 3 + . . . ] ,

    (14)

    24

    ГЛАВА 16

    где а — одноотрезочный коэффициент дисконтирования, удовлетворяющий условию 0 ^ а. < 1. Будем предполагать, что суммарный
    приведенный доход имеет конечное математическое ожидание.
    Математическое ожидание (14) задается совместным распределением вероятностей (R\, R-i, Из • • •)• Соотношение (14) можно упростить, применив фундаментальную теорему о случайных переменных:
    математическое ожидание суммы равняется сумме математических
    ожиданий слагаемых. Таким образом, учитывая, что а есть константа, имеем
    Е [Приведенный суммарный доход] =
    = Е [Ri] + аЕ Ш 2 1 + а?Е [ R 3 ] -f- . . . .

    (15)

    В (15) каждое из математических ожиданий определяется с помощью
    безусловного распределения вероятностей для соответствующей случайной переменной.
    Рассмотрим еще один пример. Обратимся вновь к задаче динамического планирования производства, представленной моделью (10) —
    (11). Предположим, что в этой задаче целевая функция представляет
    собой усредненные за большой интервал времени затраты, приходящиеся на один отрезок. Соотношения (12) показывают, какая доля
    отрезков в случае неограниченного планового периода характеризуется начальным уровнем запасов i. Аналогично соотношениями (13)
    определена доля отрезков, в течение которых объем производимой
    продукции равен х. Обозначим через С (х) и h (i) соответственно
    стационарные значения затрат на производство и хранение в течение одного отрезка. Тогда значение целевой функции при стационарной стратегии (10) определяется формулой
    Ожидаемые затраты за один
    отрезок при неограниченном
    плановом периоде

    -НМ2)]-!•+[* (3)14}Проверка формулы (16) предоставляется читателю.
    Построение распределений вероятностей. Рассматриваемое нами
    стохастическое моделирование предполагает, что руководитель располагает возможностью выбора распределения вероятностей, которое
    позволило бы описать характер неопределенности, содержащейся
    в модели. Грубо говоря, руководитель должен приписать неотрицательные количественные веса каждому возможному событию, соблю-

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    25

    дая при этом следующие условия:
    (1) если событие является достоверным, то соответствующий ему
    вес равен единице;
    (2) если события А и В являются взаимно исключающими, то
    вес события «либо А, либо 5» равен сумме весов этих событий.
    Методы построения распределений вероятностей по указанному
    выше принципу можно найти почти в любом, даже самом элементарном учебном пособии по теории вероятностей. Поэтому мы на их
    рассмотрении подробно здесь не останавливаемся. Более того, для
    наших целей оказывается достаточным знать лишь сформулированные выше общие принципы, поскольку обсуждаемые ниже модели
    строятся именно на основе информации о «весах» случайных событий,
    а типовые вычислительные процедуры выполняются с помощью
    формул, приведенных выше. Однако имеет смысл сказать несколько
    слов по поводу интерпретации упомянутых выше «весов», а также
    пояснить, каким образом руководителю удается определить их
    числовые значения, с тем чтобы читатель достиг большего понимания!
    практической ценности стохастических моделей.
    В ходе развития теории вероятностей математиками было предложено несколько способов интерпретации весов случайных событий. Наиболее распространенной является интерпретация, основанная на использовании понятия относительная частота наступления!
    случайного события. Применительно к оптимизационным моделям,
    однако, лучше воспринимается такое толкование весов, которое
    в большей степени согласуется с характером мышления административного работника. Попытаемся пояснить эту мысль, вновь обратившись к задаче фирмы «Бонбон», вероятностные показатели которой
    приведены в таблице на рис. 16.1. Эти показатели, имеющие смысл
    весовых коэффициентов, фактически являются количественным выражением прогноза относительно будущего и помогают президенту
    фирмы принять «немедленное» решение: строить новый завод или
    увеличивать производственные мощности действующего предприятия. Вспомните теперь о начальнике производственного отдела
    фирмы «Цветметалл», которому нужно обосновать целесообразность
    приобретения новой ЭВМ большой мощности. Данные о задержках
    в обслуживании, собранные начальником производственного отдела
    за определенный период прошлой деятельности фирмы, являются
    основанием для принятия решения только в том случае, если существует уверенность, что эти данные характеризуют ситуации, которые
    могут возникнуть в будущем.
    В последние годы появилось большое количество работ, посвященных методам определения весов случайных параметров, правильно отражающих «личные» прогнозы руководителя. Это направление
    исследований обычно относят к так называемой статистической
    теории принятия решений; иногда такого рода исследования именуют байесовским анализом. Несмотря на то что вопросы выбора

    26

    ГЛАВА 16

    весов случайных событий исключительно важны и имеют прямое
    отношение к исследованию операций, попытка более подробного
    их освещения в этой книге только отвлекла бы от главного — от
    анализа оптимизационных моделей. Можно лишь отметить, что при
    решении практических задач в основном используются следующие
    четыре метода построения распределений вероятностей:
    1. Интроспекция (самоанализ),
    2. Использование ретроспективных данных,
    3. Аппроксимация,
    4. Аксиоматический подход.
    Чаще же всего применяются различные комбинации перечисленных методов.
    Проиллюстрируем это на примере. Представим себе, что фирма
    «Пилюля», занимающаяся оптовой торговлей фармацевтическими
    препаратами, собирается внедрить научно обоснованную систему
    управления запасами (около 1500 видов) с использованием ЭВМ.
    В частности, предполагается, что один раз в неделю ЭВМ должна
    выдавать информацию о состоянии запасов каждого из препаратов
    и что в тех случаях, когда уровень запаса того или иного препарата
    окажется слишком низким, от ЭВМ должен поступать сигнал о необходимости оформления нового заказа, который следует направить
    фирме, выпускающей лекарственный препарат. Поскольку еженедельный потребительский спрос на каждый препарат сильно варьируется, научно обоснованные «правила» пополнения запасов должны
    базироваться на использовании стохастических моделей управления
    запасами, наподобие тех, которые рассматриваются в гл. 19. Эти
    модели требуют знания распределений вероятностей объема спроса
    за неделю для каждого препарата.
    Допустим вначале, что фирма «Пилюля» располагает незначительным количеством данных относительно уровней спроса в прошлом или вообще не имеет таких данных. Такого рода ситуации иногда возникают из-за неудовлетворительного ведения учета, а чаще
    по той причине, что приходится иметь дело с новым препаратом,
    ретроспективные данные о котором отсутствуют. Управляющий
    отделом снабжения фирмы «Пилюля» не располагает другими средствами анализа, кроме метода 1, и вынужден довольствоваться при
    количественном прогнозе уровней спроса лишь своим личным опытом. Спустя некоторое время, когда в процессе функционирования
    системы управления запасами накопится некоторый объем информации о потребительском спросе на новый препарат, для определения
    вероятностных характеристик сбыта управляющий сможет воспользоваться количественными расчетами на основе байесовского метода
    анализа.
    Предположим теперь, что имеет место совершенно иная ситуация:
    фирма располагает информацией о потребительском спросе за прошедший период продолжительностью от 6 до 18 месяцев (в зависимости от оборота) и соответствующие количественные показатели

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    27

    занесены вручную на временные регистрационные карты. В этом
    случае фирма «Пилюля» может комбинировать методы 1 и 2, анализируя вариации недельного спроса по каждому препарату за прошлый период и внося коррективы с учетом прогностических оценок
    будущего спроса. Следует, однако, иметь в виду, что в большинстве
    реальных ситуаций эмпирическое построение распределения вероятностей на базе ретроспективных данных оказывается невозможным:
    как правило, этих данных бывает явно недостаточно, а в тех случаях, когда они есть, слишком большая стоимость вычислительных
    работ, связанных с построением распределений для многочисленных
    индивидуальных уровней спроса оказывается непреодолимым препятствием для их выполнения. Поэтому в качестве модификации
    методов 1 и 2 используют метод 3. Так, например, управляющий
    отделом снабжения может вычислить «эмпирическое» среднее, а возможно, и дисперсию для недельного спроса по каждому из препаратов, внося каждый раз необходимые, с его точки зрения, коррективы. Затем в процессе использования стохастической модели управления запасами он может взять (в качестве приближения) нормальное
    распределение, приводящее к тем же самым значениям для среднего
    и для дисперсии. По мере накопления новых эмпирических данных
    относительно объемов спроса эти значения будут последовательно
    уточняться с помощью ЭВМ.
    Метод 4 представляет собой «утонченный» аналог метода 3. В случае когда применяется именно этот метод, управляющий отделом
    снабжения прежде всего строит модель, описывающую сам процесс
    формирования спроса. Такого рода модель может, например, содержать следующую информацию: суммарное число клиентов фирмы
    «Пилюля», вероятность возникновения в течение недели у каждого
    из клиентов потребности в том или ином препарате, типичные объемы
    заказов клиентов и т. д. Совершенно очевидно, что этот метод
    сложнее метода 3, однако он вполне может оправдать себя в тех
    случаях, когда в результате его применения удается записать .распределение вероятностей для уровней спроса в явном виде (например, показать, что распределение является пуассоновским или
    биномиальным). В этом случае ретроспективные данные и их коррекция на основе экспертных оценок используются для получения
    численных значений ряда параметров, необходимых для параметризации установленного закона распределения. (В примере с фирмой
    «Пилюля», по-видимому, целесообразнее применить метод 3, а не
    метод 4.)
    В заключение отметим, что фактор неопределенности сказывается на структуре стохастических моделей двояко: во-первых, наблюдается прямое проявление вероятностного характера задачи, выражающееся в учете случайных исходов в явном виде; во-вторых, имеет
    место опосредствованное проявление элемента неопределенности,
    вытекающее из самого процесса определения весов случайных величин, описывающих рассматриваемое явление. Весь последующий

    28

    ГЛАВА 16

    материал ориентирован главным образом на изучение непосредственного эффекта, порождаемого фактором неопределенности.
    В области вероятностного моделирования ведутся обширные
    исследования, связанные с анализом чувствительности стохастических решений к вариациям распределения вероятностей. Особый
    интерес представляют следующие вопросы: поиск наилучшего способа оценки параметров распределений, используемых в оптимизационных моделях; эффективные методы аппроксимации; способы
    учета в оптимизационной модели неопределенности, связанной с распределением вероятностей; методы построения «надежных» моделей
    на основе ограниченного объема ретроспективных данных.
    О ближайших перспективах. Изложив основные принципы подхода к анализу вероятностных моделей принятия решений, мы можем
    перейти к более серьезному изучению методов стохастического программирования, а также к вопросам их практического применения.
    В следующем разделе на примере сложного динамического процесса
    принятия решений будет показано, каким образом можно пойти
    по ложному пути и допустить ошибку, если игнорировать вероятностный характер задачи и вместо того, чтобы оперировать самими
    случайными переменными, пытаться использовать их средние значения. (Назовем такого рода ошибку «заблуждением относительно
    средних».) Другими словами, как правило, оказывается недопустимым подставлять вместо случайным образом изменяющихся коэффициентов, фигурирующих в оптимизационной модели (например,
    в модели линейного программирования), их ожидаемые значения.
    Весь последующий материал данной главы посвящен методике анализа линейных моделей, в которых по крайней мере часть показателей носит вероятностный характер.
    В разд. 16.4 обсуждается один из возможных методов анализа
    довольно простой, так называемой двухшаговой, модели линейного
    программирования. На примере этой модели иллюстрируются некоторые из трудностей, которые приходится преодолевать в процессе
    поиска оптимального решения в условиях неопределенности. (Обобщение данного метода на случай многошаговых задач рассмотрено
    в разд. 16.7.)
    В разд. 16.5 рассмотрен другой возможный метод решения задачи, сформулированной в разд. 16.4. Этот метод, называемый программированием с вероятностными ограничениями, представляет
    собой одну из альтернатив двухшаговой модели. На рассмотренном
    примере проводится сравнение упомянутых методов.
    Двухшаговая модель и модель с вероятностными ограничениями
    обсуждаются на более высоком уровне в разд. 16.6. Рассматриваемая при этом задача представляет самостоятельный интерес. Это —
    типичная транспортная задача наподобие той, которая анализировалась в гл. 6. Отличие ее от задачи из гл. 6 заключается лишь в том,

    ТЕОРИЯ СТОХАСТИЧЕСКИХ

    ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    29

    что уровни спроса в ней представляют собой случайные величины.
    В заключительной части главы обсуждается модель, в которой
    вместо случайных переменных допустима подстановка их средних
    значений.
    Любителям детективных историй мы советуем приступить немедленно к изучению следующего раздела: преступник не замедлит
    выдать себя. Если же читатель предпочитает заранее знать, что его
    ждет впереди, то мы должны подготовить его к возможному разочарованию. При решении практических задач лишь в очень редких
    случаях удается учесть вероятностный характер фигурирующих
    в задаче параметров путем незначительных преобразований соответствующей детерминистической модели. Нет оснований отрицать, что
    методы, рассматриваемые в настоящей главе, формально пригодны
    к решению стохастических оптимизационных задач. Однако в реальных ситуациях эти методы, как правило, оказываются неприменимыми. Практические задачи организационного управления весьма
    редко являются лишь двухшаговыми, так что, как правило, для их
    полноценного анализа требуются многошаговые оптимизационные
    модели с варьируемым числом периодов. Однако пока не следует
    предаваться скептицизму — некоторые из практических задач принятия решений с помощью предлагаемых здесь методов все же могут
    быть решены. Эти задачи будут рассмотрены в последующих главах
    после того, как читатель освоит способы преодоления различного
    рода трудностей стохастического моделирования.
    16.3. ЗАБЛУЖДЕНИЕ ОТНОСИТЕЛЬНО СРЕДНИХ

    Рассмотрим упрощенный вариант встречающейся на практике
    задачи принятия решений в условиях неопределенности. При анализе этой задачи будет показано, каким образом возникает опасность
    неправомерного использования средних значений показателей,
    фигурирующих в модели, вполне пригодной для анализа детерминированной ситуации.
    Пусть фирма «Швец и Жнец», занятая производством сельскохозяйственной техники, планирует строительство нового завода, на
    котором предполагается выпускать комбайны одной из новейших
    конструкций. Прежде чем новое предприятие начнет функционировать на полную мощность, фир-ме надлежит решить следующие
    основные задачи:
    A. Построить заводские корпуса.
    B. Завершить разработку проекта новой модели комбайна.
    C. Довести численность рабочих, а также инженерно-технического и административно-управленческого персонала до уровня, соответствующего полной загрузке проектируемых производственных
    мощностей нового предприятия.
    D. Произвести монтаж необходимого оборудования.

    30

    ГЛАВА 16

    Е. Устранить дефекты проекта и произвести окончательную
    отладку модели.
    Обозначим число отрезков времени, требуемых для выполнения
    работ А (В, С, D, Е), через tA (tB, tc, tD, tE). Пусть каждый отрезок
    равен трем месяцам. Предположим, что перечисленные выше работы
    должны выполняться в последовательности, указанной на рис. 16.2,
    В частности, выполнение работ А и В может быть начато немедленно
    и производиться одновременно. К работам С и D можно приступать
    лишь после выполнения работы А. Работу Е можно начать только
    после завершения работ В и D. Завод начнет работать на полную
    мощность лишь после того, как будут выполнены работы С и Е.

    Завершение проекта модели.
    Р и с . 16.2. Сетевой график фирмы «Швец и Жнец».

    (Данный сетевой график идентичен сетевому графику на рис. 6.16Т
    иллюстрирующему метод критического пути. Несмотря на то что
    приведенных здесь пояснений для постановки задачи вполне достаточно, читатель может найти целесообразным еще раз просмотреть
    разд. 6.6.)
    Если бы значения tA, tB, . . ., tE были известны абсолютно
    точно, продолжительность периода от начала работ до пуска нового
    завода на полную мощность можно было бы определить путем вычисления длины наибольшего пути от узла 0 до узла 3, указанных
    на рис. 16.2. Однако значения некоторых показателей tA, tB, . . .
    . . ., tE оказываются неопределенными. Полагаясь частично на имеющийся опыт строительства заводов, президент фирмы «Швец и Жнец»
    оценил вероятность возможных значений tA, tв, . . ., tE; эти оценки
    приведены в таблице на рис. 16.3. Из таблицы следует, что t B с одинаковой вероятностью может равняться 2, 3 или 4 отрезкам (т. е. соответственно 6, 9 или 12 месяцам); аналогичные заключения сделаны
    относительно tc и tK. Значения tA и tD известны точно. Президент,
    кроме того, считает, что указанные в таблице случайные события
    полностью независимы.
    Легко убедиться, что в том случае, когда каждая случайная
    величина принимает наименьшее из приведенных значений, от начала работ до пуска завода на полную мощность требуется 4 отрезка;

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    31

    если же случайные величины принимают наибольшие из предполагаемых значений, от начала работ до пуска нового завода на полную
    За- Оценки для числа
    дача отрезков времени

    Оценка вероятности

    А

    2

    Однозначная

    В

    2, 3, 4

    Каждое значение с
    стью 1 / 3

    С

    2, 3, 4

    D

    1

    Однозначная

    Е

    1, 2, 3

    Каждое значение с
    стью 1 / 3

    вероятно-

    То же

    вероятно-

    Р и с . 16.3. Задача фирмы «Швец и Жнец».
    Возможные варианты временных затрат
    (один отрезок времени равен 3 месяцам).

    мощность потребуется 7 отрезков. Таким образом, продолжительность времени, необходимого фирме для достижения поставленной
    цели, составляет от 12 до 21 месяца. Читатель без труда может
    также убедиться в том, что в
    Полное время
    Дополнительслучае, когда каждая из случай(от начала работ ная
    прибыль,
    ных величин принимает соответдо пуска завода),
    тыс. долл.
    число отрезков
    ствующее среднее значение (t в= 3,
    tc = 3, tE = 2), продолжительность времени с момента начала
    120
    3
    работ до пуска нового предприяНО
    4
    тия на полную мощность будет
    100
    5
    равняться 5 отрезкам, т. е. 15 ме6
    50
    сяцам.
    0
    7
    Президент фирмы «Швец и
    Жнец» убежден в том, что чем быстрее начнет функционировать новый Р и с . 16.4. Дополнительная прибыль
    «Швец и Жнец», получаемая
    завод, тем больше преимуществ фирмы
    за счет строительства нового завода.
    получит фирма по сравнению со
    своими конкурентами и тем выше
    окажется уровень получаемой ею дополнительной прибыли. Прогнозируемая зависимость величины дополнительной прибыли, получаемой за счет сокращения сроков запуска нового завода (по отношению
    к сроку, определяемому протяженностью 7 отрезков), показана
    с помощью таблицы, приведенной на рис. 16.4. Будучи обеспокоенным падением уровня прибыли в случае, если пуск нового завода

    32

    ГЛАВА 16

    затянется и состоится лишь 6—7 отрезков спустя после начала
    планируемых работ, президент фирмы намерен воспользоваться
    услугами опытного администратора, который выполнял бы функции
    специального его помощника по строительству нового завода. Президент фирмы считает, что дополнительное внимание проблеме строительства нового предприятия со стороны такого администратора
    позволит сократить время выполнения всех планируемых работ
    по крайней мере на 1 отрезок. Другими словами, предполагается,
    что если при отсутствии специального помощника пуск нового
    завода состоится через 4 отрезка после начала работ, то при наличии
    помощника весь объем работ займет лишь 3 отрезка и т. д. Общая
    стоимость услуг специального помощника по строительству нового
    завода составляет 20 000 долл. Если бы президент знал наверняка,
    что строительство нового завода продлится не более 4 или 5 отрезков, он был бы против найма ассистента, так как в этом случае
    выигрыш в 10 000 долл. не покрыл бы дополнительных затрат в количестве 20000 долл. Если бы президент наверняка знал, что выполнение всех планируемых работ займет не менее 6 или 7 отрезков,
    он принял бы решение воспользоваться услугами специального
    помощника. Какое решение по вопросу найма помощника принял
    бы в этом случае читатель, если бы он оказался на месте президента
    фирмы «Швец и Жнец» и располагал приведенными выше данными?
    Анализ. Если бы при анализе данной задачи мы исходили
    из того, что продолжительность выполнения всех запланированных
    работ должна составить 5 отрезков (именно к такому результату
    мы пришли бы, используя в процессе вычислений средние значения
    tA, t в, . . ., tE), то наем специального помощника по строительству
    нового завода оказался бы нецелесообразным. Действительно, сокращение сроков строительства на 1 отрезок (4 отрезка вместо 5) привело бы к приращению прибыли на 10000 долл. (110000 долл.—
    100 000 долл.), тогда как стоимость услуг специального помощника
    фирмы составила бы 20 000 долл. Покажем, что такого рода анализ
    полностью ошибочен.
    Рассуждая по приведенной выше схеме, мы допускаем две существенные ошибки: во-первых, мы исходим из неверного предположения, что продолжительность выполнения всех необходимых работ,
    вычисленная с помощью средних значений для продолжительностей
    выполнения отдельных работ, является хорошим приближением
    к ожидаемой продолжительности реализации плана в целом; во-вторых, мы упускаем из виду то обстоятельство, что истинным критерием является ожидаемая дополнительная прибыль, а не приращение
    прибыли по отношению к той, которая соответствует математическому ожиданию продолжительности реализации плана.
    Принимая во внимание все возможные исходы и учитывая вероятности их обнаружения, можно показать, что

    Р[Г = 4] = ^, Р[Г = 5]=4, P[T = G ] = ¥ , P[T = l] = j-r (1)

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    33

    где Т — продолжительность выполнения всех работ, предусмотренных планом фирмы.
    Отсюда следует, что
    г Дополнительная прибыль"]
    Е J B случае отказа от найма > = 110-2/27+100-8/27+
    [специального помощникам +50-14/27 + 0-3/27 = 64,

    ''

    /•Дополнительная прибыль4)
    Е$в случае найма специальЛ= 120-2/27+110-8/27+
    1ного помощника
    J +100-14/27+50-3/27 = 99.

    ^'

    (Во избежание слишком громоздких вычислений каждое слагаемое
    мы округляли до целого значения.) Таким образом, выигрыш (в смысле ожидаемой дополнительной прибыли) за счет услуг специального
    помощника президента фирмы составляет 35 000 долл. (99 000 долл.—
    64 000 долл.), что превышает стоимость этих услуг (20 000 долл.).
    Заметим, что ошибка, допущенная при первоначальном анализе,
    возникла из-за переоценки ожидаемой дополнительной прибыли
    в случае, когда президент фирмы принимает решение обойтись без
    услуг опытного консультанта.
    Обобщив характер ошибок, допущенных при первоначальном
    анализе проблемы, мы можем сделать следующее заключение: для
    любой нелинейной функции / (zj, . . ., хп) случайных переменных
    #1, . . ., хп предположение о том, что
    Е If fo, . . ., «„)] = / (Е [ x j , . . ., Е [хп]),
    как правило, является ошибочным.
    Несмотря на то что в некоторых частных случаях математические ожидания нелинейных функций достаточно хорошо аппроксимируются соответствующими нелинейными функциями средних значений независимых переменных, никогда не следует предполагать
    правомерность такого рода аппроксимаций априорно (т. е. не проведя предварительного исследования свойств рассматриваемой нелинейной функции).
    Неопределенность и информация. Каковы экономические последствия, порождаемые неопределенностью, имевшей место в предыдущей задаче? Чтобы ответить на этот вопрос, используя количественные оценки, необходимо вычислить приращение ожидаемой прибыли, которое имело бы место в том случае, если бы президент фирмы
    «Швец и Жнец» оказался в состоянии дать точный прогноз значений
    случайных величин. Другими словами, экономический вес неопределенности измеряется максимальной суммой денег, которую президент фирмы был бы готов выплатить, если после уплаты этой суммы
    3—0870

    34

    ГЛАВА 16

    он смог бы узнать точные значения случайных величин и, следовательно, безошибочно решить вопрос о целесообразности найма специального помощника по строительству. Вычисление упомянутой
    суммы не представляет особого труда.
    Напомним, что решение нанять помощника по строительству
    нового завода оправдано лишь в том случае, если Т = 6 или Т = 7;
    чистая дополнительная прибыль составляет при этом 80 000 долл.
    (100000 долл.—20000 долл.) и 30000 долл. (50000 долл.—
    20 000 долл.) соответственно. Таким образом, математическое ожидание чистой дополнительной прибыли в случае, когда значения
    случайных величин в момент принятия решения известны, равняется
    /•Чистая дополнительная"!
    Е) прибыль при наличии 1 = 100-2/27 + 100 -8/27 +
    [точной информации
    J+80-14/27 +30-3/27 = 82.

    ^'

    В силу (3) ожидаемая чистая дополнительная прибыль, получаемая при отсутствии точной информации, равняется 79 000 долл.
    (99000 долл.—20 000 долл.). Следовательно, выигрыш за счет получения точной информации составляет 3 000 долл. (82 000 долл.—
    79 000 долл.); при этом учтены также затраты, связанные с наймом
    специального помощника президента. Вычисленная сумма (3000 долл.)
    может интерпретироваться как «цена» существующей неопределенности, поскольку президент фирмы «Швец и Жнец» не стал бы платить более 3000 долл. за возможность получения абсолютно точного
    прогноза.
    16.4. ДВУХШАГОВАЯ ЛИНЕЙНАЯ МОДЕЛЬ

    В данном разделе мы приступаем к изложению методов учета
    вероятностной природы показателей в линейных оптимизационных
    моделях. Как уже неоднократно отмечалось, линейное программирование имеет многочисленные приложения. После ознакомления с гл. 2
    читатель, по-видимому, убедился, что линейные модели пригодны
    «на все случаи жизни». Уже один только этот факт позволяет считать попытку обобщения задач линейного программирования на случай появления в них вероятностных элементов вполне заслуживающей внимания.
    Основная цель, которую мы преследуем в нескольких последующих разделах, заключается в том, чтобы разработать методы построения так называемых стохастических моделей линейного программирования, которые в результате надлежащих преобразований
    трансформируются в обычные линейные оптимизационные модели.
    В силу большого разнообразия приложений линейного программирования успешное решение поставленной задачи при отсутствии
    ряда специальных постулатов относительно самой структуры процедур принятия решений оказывается почти невозможным. В частно-

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    35

    сти, требуется дать формализованное описание цепочки взаимосвязанных решений, указывая при этом «решения, которые должны
    приниматься при наличии информации относительно предыдущих
    решений и ретроспективных данных о случайных переменных».
    Наиболее общее рассмотрение этого вопроса изложено в разд. 16.7.
    Методика, изложенная в этом разделе, позволяет строить оптимизационные модели, содержащие разнесенные во времени и сложным
    образом взаимосвязанные решения, а также учитывающие текущий
    и ретроспективные потоки информации. Однако многие из основополагающих идей становятся ясными после рассмотрения «усеченного» варианта модели, согласно которой число шагов в процедуре
    принятия решений равняется двум. Именно такого рода модель
    и обсуждается в настоящем разделе.
    Анализ двухшаговой модели представляется полезным по крайней мере в двух отношениях. Во-первых, при этом излагается метод
    построения простой стохастической оптимизационной модели, легко
    трансформируемой в обычную модель линейного программирования,
    Во-вторых, с помощью рассматриваемой модели удается показать,
    что учет стохастических элементов задачи приводит к увеличению
    размерности соответствующей модели. При ознакомлении с разд. 16.7
    читатель будет вынужден прийти к заключению, что моделируемая
    в этом разделе более общая ситуация, с точки зрения руководителя,
    стремящегося к практическому использованию линейного программирования, скорее всего окажется за пределами «реальной полезности».
    В разд. 16.5 рассматривается модель с вероятностными ограничениями. Излагаемый здесь метод позволяет обойти некоторые трудности, характерные для задач упомянутого типа. Однако это приводит к некоторым дополнительным ограничениям возможностей
    самого метода оптимизации.
    Простейший случай. Прежде чем приступать к рассмотрению
    конкретного примера двухшаговой модели, познакомим читателя
    с одним исключительно важным частным случаем простого одношагового моделирования. Для простоты изложения допустим, что
    детерминистический аналог задачи можно записать в следующем
    каноническом виде:
    п

    Максимизировать 2 cixj

    (1)

    ;'=!

    при ограничениях
    п

    z = l, 2, ...,

    т,

    (2)

    г,>0, / = 1, 2, ...,

    п.

    (3)

    bi,
    3=1

    Предположим теперь, что коэффициенты в выражении для целевой функции являются случайными величинами, причем значения

    36

    ГЛАВА 16

    всех управляемых переменных х} (/ = 1, 2, . . ., п) требуется определить в условиях отсутствия информации о том, какие значения
    будут в действительности принимать GJ (/ = 1, 2, . . ., п). Такая
    ситуация может возникнуть, например, при решении задачи планирования, когда будущие рыночные цены на производимые
    товары и «будущая» стоимость рабочей силы в момент разработки
    плана точно не известны. Поскольку все коэффициенты a t j , а также
    константы bi определены однозначно, выбор допустимых значений Xj
    не представляет никаких трудностей.
    Будем исходить из предположения, что оптимальное решение
    должно обеспечивать максимум ожидаемого значения целевой функции (1). Тогда имеет место следующая теорема;
    Т е о р е м а о б э к в и в а л е н т н о с т и ф о р м . Допустим,
    что ац (i — 1, 2, . . ., т; / = 1, 2, . . ., п) и bt (i = 1, 2, . . ., т)
    в соотношениях (2) определены однозначно, а с/ (/ = 1, 2, . . ., га)
    представляют собой случайные величины, не зависящие от переменных х} () = 1 , 2 , . . . , п). Если значения х} (; — 1, 2, . . ., п)
    подлежат определению при отсутствии точной информации относительно значений С], то решение задачи
    Максимизировать Е [ ^ CjXj\
    j=i

    (4)

    при ограничениях (2) и (3) задается значениями переменных Xj,
    удовлетворяющих условию
    п

    Максимивировать 2 Е [GJ] Xj

    (5)

    J:= 1

    при ограничениях (2) и (3).
    Итак, если случайными величинами являются лишь коэффициенты в выражении для целевой функции, причем эти коэффициенты
    не зависят от выбора значений управляемых переменных, то оптимальное решение может быть найдено путем решения эквивалентной
    детерминистической задачи линейного программирования, в которой
    в качестве коэффициентов в выражении для целевой функции выбраны ожидаемые значения соответствующих коэффициентов исходной
    задачи. Скоро мы убедимся в том, что задачу стохастического линейного программирования таким простым способом не удается решить
    в случаях, когда модель содержит другие случайные элементы,
    а также когда хотя бы некоторые из xj могут быть определены лишь
    после получения информации, позволяющей точно установить, какие
    значения принимают фигурирующие в модели случайные величины.
    Пример. Обратимся теперь к простому примеру, позволяющему
    продемонстрировать, каким образом в связи с решением задачи организационного управления возникает двухшаговая оптимизационная
    модель. Ознакомление с конкретной задачей поможет читателю разо-

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    37

    браться в рассуждениях общего характера, приведенных в конце
    данного раздела. Пусть фирма, занимающаяся обработкой древесины (назовем ее «Супердранка»), ежемесячно перерабатывает определенное количество имеющегося в наличии леса (Т тонн), производя
    пиломатериалы и фанеру. Для простоты предположим, что данная
    фирма выпускает только первосортную продукцию. В начале месяца фирме надлежит определить значения следующих управляемых
    переменных:
    Xi — количество леса в тоннах, предназначенного
    для получения пиломатериалов;
    xz — количество леса в тоннах, предназначенного
    для изготовления фанеры;
    х3 — количество леса в тоннах, не подлежащего переработке.
    Допустим, что к концу месяца из xl тонн леса будет произведено
    a^Xi кубометров пиломатериалов, а из £2 тонн леса получится а2;г2
    тысяч листов фанеры. Обозначим через DI максимальное количество
    пиломатериалов, а через Z)2 максимальное количество фанеры, которые фирма может продать к концу месяца. Пусть рыночная цена 1 м3
    пиломатериалов (продукта 1) равняется г £ , а рыночная цена тысячи
    листов фанеры (продукта 2) равняется г2; тогда величина г/ (ujXj)
    представляет собой полную выручку, полученную фирмой при реализации продукта / (/ = 1, 2). Допустим далее, что стоимость переработки 1 т леса в продукт / равняется е,-; таким образом, ер, есть
    суммарные затраты, связанные с производством продукта /. Следовательно, если положить с7- = TJUJ — ej, то величина CjXj будет
    представлять собой суммарную прибыль, получаемую за счет продукта / (/ = 1, 2). Кроме того, фирма получает прибыль в размере
    C x
    z 3i реализовав неиспользованный лес на рынке; при этом рыночная цена 1 т леса предполагается не зависимой от х3 (она остается
    на прежнем уровне даже в том случае, когда х3 = Т).
    Если значения а3 (j = 1, 2), Cj (j = 1, 2, 3) и D, известны, задача
    принятия управляющего решения сводится к следующей задаче
    линейного программирования:
    Максимизировать c^i + с2£2 + с3х3
    (6)
    при ограничениях
    #1 + х% + х3 = Т
    (имеющийся в наличии лес),
    (7)
    alxi + Si = DI (спрос на пиломатериалы),
    (8)
    azxz + s2 = Dz (спрос на фанеру),
    (9)
    Xj

    > О,

    S; > 0,

    (10)

    где Si — неудовлетворенный спрос на продукт i. Читателю предлагается проанализировать несложную структуру задачи (6) — (10)
    и объяснить причину тривиальности ее решения при заданных значениях О/, Cj И DJ.

    38

    ГЛАВА 16

    На практике, однако, чаще сталкиваются с ситуациями, когда
    рыночные цены на каждый из выпускаемых видов продукции колеблются во времени (например, меняются через каждую неделю)
    в зависимости от уровней запасов (или поставок) сырья и уровней
    спроса. Следовательно, фирма «Супердранка» будет располагать
    точными данными о ценах rt и г2 (а значит, и о с± и с2) лишь несколько недель спустя после принятия решения относительно значений
    xt, £2 и х3. Кроме того, подвержены случайным колебаниям значения ai и а2, а также потенциальные уровни коммерческого спроса
    DI и DZ- Поэтому $i и sz будут практически определены лишь
    после того, как станут известными uj и Z);. И наконец, если afCj
    превысит максимальный уровень спроса, часть продукции фирмы
    останется нереализованной. Таким образом, совершенно очевидно,
    что в случае, когда величины а, и DI являются случайными,
    структура ограничений модели (7) — (10) оказывается недоопределенной.
    Для полноты представления оптимизационной модели предположим, что фирма должна избавиться от избытка продукции, реализуя
    ее по сниженным ценам. Чтобы отразить это обстоятельство, добавим (—t t ) к левой части соотношения (8), (—Z2) к левой части соотношения (9) и ( — f r f i — / 2 £ 2 ) к выражению для целевой функции (6),
    интерпретируя tt ^ 0 как избыток продукта г, а (—/ г £ г ) как потерю
    прибыли в случае сбыта £, единиц продукции по сниженным ценам.
    Коэффициенты удельных потерь /г также являются случайными
    величинами, и их значения в момент выбора уровней для Xj неизвестны. Фактические значения £ г , как и значения st, подлежат определению после того, как станут известными значения всех фигурирующих в модели случайных величин.
    Подводя итоги проведенного выше анализа, укажем основные
    этапы решения задачи:
    1. Первый шаг. Фирма подбирает значения a;t, £2 и х3, располагая
    точными данными лишь относительно значений eit e2 и с 3 2. Получение данных о случайных исходах. Становятся известными фактические значения случайных величин ct, с2, / 4 , / 2 , ait Di и /)2, и обнаруживается, что эти величины не зависят от а^, ж 2
    и х3.
    3. Второй шаг. Фирма определяет значения s1? ss, t\ и t2.
    При наличии указанной выше информации фирма «Супердранка»
    выбирает значения Xi, x2 и х3, максимизирующие ожидаемую прибыль.
    Без дополнительных упрощений даже эту имеющую небольшую
    размерность задачу решить оказывается не так-то просто. Поэтому
    примем прежде всего предположение о том, что коэффициенты а, и г;0 = 1, 2) являются независимыми случайными величинами. Тогда
    для ожидаемого значения с,- будем иметь
    Е [cj] = Е [rj] -Е [а,] - ej,

    ] = 1, 2.

    (11)

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    39

    Чтобы свести задачу к стандартной задаче линейного программирования, примем еще один постулат относительно характера неопределенности: будем предполагать, что возможно лишь конечное
    число Q состояний, характеризуемых совокупностью показателей
    (/i> /2> a i> аъ-> DI-* DZ). Положим для примера Q = 3, т. е. допустим, что возможны лишь следующие комбинации для элемента
    (/и /2' a i> а 2> -Dn DZ):
    (/н> /12> a ii' a i2' DU, DIZ)
    с вероятностью Pi,
    (/21' /22' а21' Й 22' Dzi, ^22)
    а

    а

    (/аи /32' зи 32> -О si' -О 32)

    c

    ВбрОЯТНОСТЬЮ J>2'

    c

    вероятностью рз,

    причем pi + р а + рз = 1. С помощью (12) легко вычислить
    3

    3=0

    а зная £ [г7-] и 6j, определить из (11) Е [с,-]. Следовательно, исчерпывающая формулировка рассматриваемой двухшаговой модели выглядит следующим образом:
    Максимизировать
    Е [cj Xi + Е [с2] ж 2 + С3х3 — Р! [/ц^ц + /12£12] —
    — ^2 t/21^21 +

    при ограничениях
    х
    =
    \ + ^2+^3
    Т
    ==
    — *и -Оц
    2— *i2=-0i2
    a
    2i ;r i
    +S2i — *2i=-^2i
    ~bssi — *з1=-Оз!

    /22^22^ ~ Р 3 [/31*31 + /32*321

    (13)

    (имеющийся в наличии лес),
    (14)
    (спрос на пиломатериалы при (спрос на фанеру при д=1),
    (16)
    (спрос на пиломатериалы при q =2), (17)
    (спрос на фанеру при д=2),
    (18)
    (спрос на пиломатериалы при д=3), (19)

    а32;с2+5з2— *з2=-0з2 (спрос на фанеру при xj^sO, ] = 1, 2, 3,
    s,«>0, g = 1, 2, 3; i = 1, 2,
    tqi^0, q = 1,2,3; i = 1, 2.

    (20)
    (21)

    Необходимо внимательно проанализировать соотношения (13) —
    (21), с тем чтобы разобраться во всех деталях построения двухшаговой модели процедуры принятия управляющих решений. В частности, отметим следующее:
    1. Детерминированное ограничение на объем имеющегося в наличии леса, учитываемое на первом шаге, представлено соотношением (14).

    40

    ГЛАВА 16

    2. Имеются три группы (Q = 3) ограничений, каждая из которых
    определяет возможный набор значений случайных величин, а именно [(15), (16)], [(17), (18)] и [(19), (20)].
    3. Управляемые переменные первого шага фигурируют в каждой
    из групп ограничений, указанных в п. 2. Коэффициентами при этих
    переменных являются числа, определяемые допустимыми значениями
    соответствующих случайных величин при q = 1, 2, 3.
    4. Имеется набор управляемых переменных второго шага
    (s когда становится известным фактический исход для каждого из случайных событий.
    5. В выражение для целевой функции входят безусловные математические ожидания удельных прибылей, связанных с соответствующими управляемыми переменными первого шага.
    6. Для согласованного введения переменных второго шага коэффициенты прибыли используются с весами, в качестве которых
    в целевой функции служат вероятности pq.
    Нахождение решения для модели (13) — (21) представляет собой
    (по сравнению с моделью (6) — (10)) далеко не тривиальную задачу.
    Для проверки степени усвоения изложенного выше материала читателю рекомендуется произвести упрощение модели (13) — (21) с учетом предположения, что ai, a 2 и Dz являются детерминированными
    величинами, а излишек продукта 2 не допускается.
    Исключительно важно разобраться в самой сущности метода
    решения. Первое, что нужно сделать,— это выбрать значения переменных первого шага; тогда модель (13) — (21) позволит определить
    оптимальный вариант действий. При этом нет никакой необходимости фиксировать значения переменных второго шага до того момента, когда исчезнет неопределенность. Таким образом, то, что определено нами относительно выбора переменных на втором шаге, можно
    назвать оптимальными правилами принятия управляющего решения;
    другими словами, нами найдена стратегия, позволяющая выбирать
    оптимальные значения переменных при любом возможном исходе
    случайных событий при условии, если заданы значения управляемых переменных на первом шаге. Именно необходимость поиска
    правил относительно дальнейших действий отличает стохастическое
    программирование от детерминистического динамического программирования и в значительной степени усложняет вычислительные
    процедуры получения оптимальных решений.
    Заключение. Ниже приводится общее описание так называемой
    двухшаговой линейной модели. Используя обозначения, принятые
    для детерминистского аналога стохастической модели [см. (1) — (3)],
    примем относительно последней следующие предположения:
    1. Значения случайных величин не зависят от xj (j = 1,2, . . .).
    2. Значения xj (/ = 1, 2, . . ., k ^ ri) должны фиксироваться на

    ТЕОРИЯ СТОХАСТИЧЕСКИХ

    ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    41

    первом шаге до того, как станут известными фактические значения,
    принимаемые случайными величинами.
    3. Ограничения i = 1, 2, . . ., g содержат только переменные
    первого шага, причем 'оответствующие значения ац и bt являются
    известными.
    4. Всегда существуют допустимые значения остальных переменных (выбираемые на втором шаге) xj (/ = k -f- 1, . . ., п). Значения
    этих переменных подлежат определению после того, как становятся
    известными фактические значения всех случайных величин.
    5. Существует конечное число Q возможных комбинаций значений с} (J = k + 1, . . ., п), ац (i = g + 1, . . ., m; / = k + 1, . . .
    . . ., n) и bi (i = g + 1, . . ., m); определяемые ими состояния
    принято обозначать через (cqi, aqu, bqi), а вероятности их появления — через pq (q = 1, 2, . . ., Q).
    При такой постановке задачи оптимальные правила принятия
    решения могут быть получены в результате решения следующей
    задачи линейного программирования:
    ft

    Q

    п

    Максимизировать 2 Е [cj] Xj + ^j Pq I 2 cqixqi\
    ;=1
    3=1
    j=ft+l

    (22)

    при ограничениях
    ^dijXj — bi,
    /(

    i = i, 2, ...,

    g

    (первый шаг),

    (23)

    П

    У! a tjXj+
    5! a i;Xq) = bqj (правило для принятия решения
    /=i q
    j=.h+1 q
    на втором шаге),

    (24)

    i — g + 1, . . ., т; q = 1, 2, . . . , < ? ,

    жу >0,

    / = 1, 2, . . ., п,

    хд] > О, у = 1, 2, .... п; ? = 1, 2, . . ., Q.

    (25)

    Если какие-либо из коэффициентов с/, bt (i = g -\- {,..., т),
    bqi (i = g + 1> . . ., m; g = 1, 2, . . . , < ? ) или a^ (i = g + 1, . . .
    . . ., т) оказываются известными, то их следует сразу же подставить в соотношения (22) — (24). Заметим, что система (24) содержит
    (т — g) Q уравнений. При решении практических задач, для которых разность (т — g) достигает величины порядка нескольких
    Десятков, рассмотренный метод в случае больших Q оказывается
    малоэффективным.
    Желающие разобраться в том, как с помощью рассуждений,
    аналогичных только что изложенным, любую многошаговую стохастическую модель линейного программирования можно преобразо-

    42

    ГЛАВА 16

    вать в обычную линейную модель (значительно большей размерности), должны обратиться к разд. 16.7.
    В заключительной части настоящего раздела обсуждается вопрос
    о приближенных методах оценки оптимальных значений целевой
    функции при различных предположениях относительно структуры
    стохастической модели. В следующем разделе рассматривается другая формулировка двухшаговой стохастической задачи линейного
    лрограммирования, допускающая переход к стандартной модели
    линейного программирования с сохранением размерности.
    Сравнение приближенных методов решения. Для нахождения
    численного решения практических задач, имеющих структуру, представленную соотношениями (22) — (24), можно воспользоваться рассмотренным в разд. 15.11 методом декомпозиции (разбиения) для
    двойственной задачи. Ограничения двойственной задачи, связанные
    с переменными Xj (j = 1, 2, . . ., k), определяют основную «программу», а двойственные ограничения, связанные с переменными xq]
    (j = k -\- 1, . . ., п), формируют для каждого значения q свою
    «подпрограмму». Чтобы лучше разобраться, как это происходит,
    читатель может обратиться к задаче (13) — (21) и после перехода
    к соответствующей двойственной задаче выделить основную программу и подпрограммы,
    В модели (22) — (25) предполагается, что к моменту выбора значений управляемых переменных на втором шаге фактические значения всех случайных величин должны быть известными. Обобщение
    модели на тот случай, когда некоторые из коэффициентов при переменных второго шага в выражении для целевой функции становятся
    известными лишь после определения численных значений этих переменных, не сопряжено с серьезными усложнениями модели. В частности, в выражении (22) для / = h -f- 1, . . ., п (k ^ h ^ га) достаточно заменить cqj на Е [GJ \ q ] , где Е[с, \ q] представляет собой
    условно-вероятностное математическое ожидание с,, т. е. ожидаемое
    значение с/ при условии, что случайный исход, связанный с индексом q, известен.
    В разд. 16.1 неоднократно подчеркивалось, что исключительно
    важным является содержательный анализ характера неопределенности в каждом конкретном случае. Излагаемый ниже материал
    позволит (на примере одношаговой модели) глубже разобраться
    в тех последствиях, к которым приводит фактор неопределенности
    при принятии управляющих решений. Приводимые при этом формулы являются также эффективными при оценке девиаций получаемых
    приближенных решений от оптимальных решений.
    Модель, представленную соотношениями (22) — (25), иногда называют моделью упреждающих действий, так как значения некоторых
    из управляемых переменных должны выбираться сразу, еще до
    получения фактических данных относительно случайных исходов.
    Весьма удобным является следующее альтернативное представление

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    43

    задачи (22) — (25):
    k

    Максимизировать ЕА, в, с [ 2 cixl~\~
    ?'=1

    п
    max

    S CjZj] =

    *(ж ..... xn i=h+l

    = E [При упреждении],

    (I)

    где значения xt ^0 для / = 1, 2, . . ., k выбираются на первом
    шаге и должны удовлетворять условию
    ь
    2 a,ijXj = bi, i = i, 2, . . . , g (первый шаг),
    (II)
    3=1

    а затем определяются значения переменных
    = A: -j- 1, . . ., я, удовлетворяющих условию
    n

    Xj ^ 0

    для / =

    ft

    2 aijXj = bi — "% ацХ],

    j=h+l

    i = g + i, ..., т (второй шаг), (III)

    3=1

    причем выбор переменных второго шага производится после того,
    как станут известными все коэффициенты в соотношениях (III).
    В представлении (I) — (III), так же как и в остальных представлениях, рассматриваемых в данном разделе, предположение о том,
    что существует лишь Q возможных комбинаций случайных исходов
    (состояний), можно опустить. Однако при этом предполагается, что
    система уравнений (III) всегда имеет допустимое решение.
    Модель другого типа, именуемая иногда моделью ожидания,
    возникает в том случае, когда к моменту выбора значений xj (] =
    = 1, 2, . . ., п) оказываются известными значения всех случайных
    величин. Запишем такого рода модель в виде
    ЕА.В,С [
    XI,

    max
    . ..,

    ^C]Xj]=E

    [При ожидании],

    (IV)

    Xn j=l

    где значения всех переменных х, ^з 0 определяются одновременно,
    причем таким образом, чтобы удовлетворялись как условия (II),
    так и условия (III). Если число возможных случайных исходов
    равно Q, то Е[При ожидании] вычисляется путем нахождения
    оптимального решения для каждой из Q соответствующих задач
    линейного программирования, после чего определяется средневзвешенное значение целевой функции с учетом вероятности каждого
    исхода pq. В этом случае для каждого значения q мы получаем
    линейную модель той же самой структуры и той же самой размерности, как и в детерминистском варианте (1) — (3). Возможность
    «ожидания» позволяет руководителю получить ценную информацию;
    при этом значение Е[При ожидании] является верхним предельным
    значением Е[При упреждении}.
    Рассмотрим далее оптимальное решение детерминистского аналога модели, в которой каждая случайная величина заменена на

    44

    ГЛАВА 16

    соответствующее математическое ожидание; такую модель назовем
    моделью глобального усреднения. Пусть х, (/ = 1, 2, . . ., п) есть
    решение задачи
    п

    Максимизировать 2 Е lcj] Zj^E
    J

    ==

    [При

    глобальном усреднении]

    l

    (V)

    при ограничениях (II) и
    ,...,m.

    (VI)

    Заметим, что системой соотношений (V), (II) и (VI) представлена
    обычная задача линейного программирования, структура и размерность которой совпадают со структурой и размерностью детерминистского аналога модели (1) — (3). Если, согласно принятому предположению, существует решение системы уравнений (III), то, как
    будет показано ниже, всегда существует допустимое решение системы уравнений (II) и (VI). Нами будет также показано, что Е [При
    глобальном усреднении] является верхним предельным значением
    Е [При ожидании}.
    Предположим, наконец, что в двухшаговой модели производится
    подстановка Xj ->- xj (j = 1, 2, . . ., k), где Xj найдены в результате решения задачи, представленной моделью (V), (II) и (VI); эта
    операция вполне допустима, поскольку полученные значения х}
    удовлетворяют уравнениям (II). Значение остальных переменных
    Xj(j — /е+1, . . ., тг), как и в предыдущем случае, определим из (III).
    Назовем предлагаемый подход к решению стохастической задачи
    оптимизации усреднением на первом шаге. Оптимальное значение
    целевой функции при такой стратегии находится по формуле
    h

    п

    max
    = Е [При усреднении на первом шаге} .
    (VII),
    Если имеется Q возможных случайных исходов (т. е. Q различных,
    возможных комбинаций значений случайных величин), то вместо (VII)
    берется средневзвешенное значение целевой функции на множестве
    ее возможных значений, получаемых в результате решения Q задач
    линейного программирования и характеризующихся вероятностями
    исходов pq (q = 1, 2, . . ., 0. В ряде случаев решение упомянутых
    выше подзадач оказывается тривиальным.
    Можно доказать, что значения целевой функции, получаемые
    рассмотренными выше методами, удовлетворяют следующим неравенствам:
    Е\При усреднении на первом шаге]^.Е [При упреждении],
    Е [При усреднении на первом шаге]^.Е [При ожидании],
    Е [При усреднении на первом шаге] ^ Е [При глобальном усреднении] .
    (VIII)

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ

    МОДЕЛЕЙ

    45

    Справедливость первого неравенства вытекает из того факта, что
    решение, полученное методом усреднения на первом шаге, представляет собой одно из многочисленных допустимых решений рассматриваемой задачи методом упреждения; следовательно, оно не может
    быть лучшим по сравнению с оптимальным решением в случае
    упреждения.
    Второе неравенство отражает то обстоятельство, что ожидаемое
    значение целевой функции может быть улучшено, если значения
    всех случайных величин становятся известными до момента выбора
    значений х,. Разность Д = Е[При ожидании] — Е[При упреждении] можно назвать ценой неопределенности. Эта величина представляет собой максимальную сумму, которую можно заплатить
    за точное предсказание случайных исходов до момента выбора значений всех переменных X].
    Последним неравенством определяется легко вычислимая верхняя граница для трех других ожидаемых значений целевой функции.
    Данное неравенство может быть получено следующим образом.
    Вычислим ожидаемые значения я/ для j = 1, 2, . . ., п в соответствии с оптимальной стратегией, вытекающей из модели упреждения. Эти значения являются также допустимыми и для модели
    глобального усреднения. Учитывая затем (I), убеждаемся, что те же
    самые значения xj обеспечивают оптимальное значение Е При
    упреждении], поскольку имеет место (V) и, следовательно, оптимальное значение Е {При глобальном усреднении] не может быть
    меньше Е [При упреждении].
    В тех случаях, когда легко вычислить Е [При усреднении на
    первом шаге] и когда получаемое при этом значение не слишком
    сильно отличается от Е [При глобальном усреднении] , стратегия,
    предусматривающая подстановку Х)-*-х3 для / = 1, 2, . . ., k
    (т. е. для переменных первого шага), приводит к решению, близкому
    к оптимальному решению для модели упреждения.
    В некоторых случаях для модели упреждения удается найти
    приближенное решение другого типа. Допустим, что значения
    Cj(i = k + 1, . . ., п) и bi (i = g + 1, . . ., т) очень малы (обозначим их через с| и if), а значения atj (i = g -f- 1, . . ., т; j =
    = 1, 2, . . ., п) весьма велики (обозначим их через a*j). Наконец,
    предположим, что существует решение xj > 0 (/ = 1, 2, . . ., ге)
    задачи в так называемой наиболее жесткой постановке, а именно
    задачи
    ft

    п

    Максимизировать 2 cix] + S cjxj =
    ;'=!

    J=h+l

    = С [При наиболее жесткой постановке задачи]
    при ограничениях (II) и при условии, что
    3=1

    , ...,

    т.

    (IX)

    (X)

    46

    ГЛАВА 16

    Заметим, что только что сформулированная задача представляет
    собой задачу линейного программирования, структура и размерность которой совпадают со структурой и размерностью соответствующего детерминистского аналога модели. Далее, легко убедиться, что значения х* для у = 1, 2, . . ., k являются допустимыми решениями задачи с упреждением. Следует, однако, отметить,
    что С [При наиболее жесткой постановке задачи] меньше ожидаемогозначения целевой функции в случае, когда x*j (j = 1, 2, . . ., /с)
    используются в рамках модели упреждения, поскольку в (IX)
    не учтена процедура оптимального выбора х} (j = k + 1, • • •> п)
    после того, как станут известными значения фигурирующих в модели случайных величин. Таким образом, можно доказать, что
    С [При наиболее жесткой постановке задачи] ^
    ^ Е [При упреждении],
    (XI)
    и, следовательно, если С [При наиболее жесткой постановке задачи]
    почти совпадает с Е [При глобальном усреднении], то значения
    х* (] = 1, 2, . . ., k) близки к оптимальным значениям xj (j =
    — 1, 2, . . ., k), получаемым в результате решения задачи с упреждением.
    16.5. МОДЕЛЬ С ВЕРОЯТНОСТНЫМИ ОГРАНИЧЕНИЯМИ

    Подводя итоги рассмотрения изложенного в предыдущем разделе
    метода решения двухшаговой стохастической задачи линейного программирования, мы приходим к заключению, что основной недостаток этого метода состоит в том, что получающаяся в результате
    его применения стандартная линейная модель (эквивалентная исходной стохастической модели) имеет слишком большую размерность.
    Увеличение размерности обусловлено тем, что для построения исчерпывающих правил принятия решения на втором шаге необходимо
    учитывать все возможности значения фигурирующих в задаче случайных показателей. Если, однако, сделать ряд дополнительных
    упрощающих предположений, то можно построить другой, более
    простой метод решения, позволяющий свести двухшаговую линейную стохастическую модель к обычной линейной оптимизационной
    модели той же размерности. Этот метод называют программированием с вероятностными ограничениями 1). Поясним его сущность
    на примере, уже рассмотренном в предыдущем разделе.
    Пример. Обратимся вновь к задаче фирмы «Супердранка». Попытаемся упростить эту задачу в еще большей степени, предположив,
    что коэффициенты а 4 и а 2 являются известными, а вместо строгого
    требования полной реализации избыточной продукции будем предполагать, что возможны альтернативные варианты действий, эконох
    ) Такое название было предложено А. Чарнсом и У. Купером, заложившими основы данного метода.

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    47

    мические последствия которых не определены. Тогда случайными
    величинами будут являться лишь рыночные цены г;- и предельные
    значения для уровней спроса Dt. При этом для ожидаемого значения
    удельной прибыли будем иметь Е [GJ] = Е [г,-] -а;- — е^ где / = 1,2
    означает номер выпускаемой фирмой продукции.
    Подлежащая максимизации целевая функция имеет вид
    Максимизировать Е [cj х\ + Е [с2] £2 + €3X3.
    (1)
    Заметим, что выражение для целевой функции содержит лишь переменные первого шага, так как нами не конкретизированы варианты
    решений (или действий) в случае, когда объем выпускаемой продукции превышает объем спроса. Учтем теперь уже известные ограничения на объем имеющегося в наличии леса, а также условия неотрицательности Xj\
    Xi -\- xz + хз = Т (имеющийся в наличии лес),
    (2)
    х} > 0, / = 1, 2, 3.
    (3)
    Наконец, необходимо наложить ограничения на объем производимой продукции, поскольку в противном случае модель, ориентированная на максимизацию ожидаемой прибыли, очевидно, приведет к яначениям Xi и ж а , превышающим уровни спроса. Допустим
    далее, что президент фирмы «Супердранка» ставит условием, чтобы
    все выпускаемые фирмой продукты i в объеме а^х^ (i = 1, 2) были
    полностью реализованы с вероятностью, не меньшей |3г (i = 1, 2).
    Математически это условие записывается следующим образом:
    Р [aixi ^ DJ ^ Pi (спрос на пиломатериалы),
    (4)
    Р [а2х2 ^D2] ^ (52 (спрос на фанеру).
    (5)
    Ограничения (4) и (5) называются вероятностными, поскольку они
    выражены через вероятности возможных исходов. Условия (4) и (5)
    эквивалентны следующим обычным линейным неравенствам:
    ajZi ^ BI
    а2;г2 ^ J92

    [детерминистский эквивалент соотношения (4)], (6)
    [детерминистский эквивалент соотношения (5)]. (7)

    Другими словами, линейная модель, состоящая из целевой функции (1) и ограничений (2), (3) и детерминистских эквивалентов
    ограничений (4), (5), позволяет получить оптимальное решение
    сформулированной выше задачи с вероятностными ограничениями.
    Чтобы показать, каким образом, зная безусловное распределение
    случайных величин, можно определить Bt (i = 1, 2), обратимся
    к следующему примеру. Пусть безусловное распределение для DI
    задано, а именно допустим, что
    р [£, = 1] = 0,2, Р Wi = 3] = 0,4,
    Р (Di = 8] = 0,3, Р [Di = 10] = 0,1.

    (8)

    48

    ГЛАВА 18

    (График Р [Di ^ BI\ приведен на рис. 16.5.) Нетрудно убедиться,
    что Bi = 1 при условии, что 0,8 < р ^ 1,0; В\ = 3 при условии,
    что 0,4 < р ^ 0,8, и т. д.
    Отметим, что решение для линейной модели (1) — (3), (6) — (7)
    находится так же просто, как и решение задачи (6) — (10), рассмот-;
    ренной в предыдущем разделе.
    Метод решения. Отталкиваясь
    от примера с фирмой «Супердранка», дадим общее описание
    метода решения для двухшаговой
    модели с вероятностными ограничениями. Пусть х^ (/=1, 2, . . ., К)
    являются переменными, значения
    которых выбираются на первом
    шаге. (Переменные второго шага
    о
    ]0
    в явном виде мы не указываем.)
    В,
    Допустим, что все коэффициенты
    и
    Р и с. 16.5. Задача фирмы «Супер» 3аДаНЫ' На„конеЧ' предполодранка».
    жим, что случайные события не
    зависят от того, какие значения
    принимают переменные первого шага. Решение модели с вероятностными ограничениями сводится к нахождению значений Xj в следующей задаче:
    Максимизировать 2 Е \.ci] x)

    (9)

    3=1

    при ограничениях
    h

    ^uijXj = bi,

    1 = 1, 2, ..., g

    (первый шаг),

    (10)

    m (вероятностные

    ограниче-

    3=1
    h

    Р [ S o,ijXj ^bi]^-PJ,

    i = g-f-l, ...,

    (11)
    (12)

    ния),
    Xj ^ 0 для всех значений }.

    Соотношение (11) интерпретируется следующим образом: безусловh

    ная вероятность того, что выполняется неравенство bt ^э 2 аах]->
    не может быть меньше Р; (где Р; удовлетворяет условию 0 ^ р г ^ 1).
    В предположении, что существуют такие значения Xj, которые
    одновременно удовлетворяют всем условиям (10) — (12), решение
    сформулированной нами задачи может быть получено в результате
    решения обычной задачи линейного программирования, целевая
    функция которой имеет вид (9), а в систему ограничений наряду
    с соотношениями (10) и (12) входит детерминистский эквивалент

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    49

    вероятностных ограничений (11), а именно условие
    h

    i = g + i,...,m,

    (13)

    где В i — предельное значение &,, удовлетворяющее условию
    Plbi^BJ^Vi,
    (14)
    или (что то же самое)
    Р [bi < Бг] < 1 — р г

    [Bt: (1 - Р,) - квантиль].

    (15)

    Обсуждение результатов. Сравним теперь метод вероятностных
    ограничений с изложенным ранее методом, основанным на использовании двухшаговой модели. Модель с вероятностными ограничениями обладает двумя положительными качествами. Во-первых, она
    сводится к эквивалентной задаче линейного программирования,
    имеющей ту же размерность и такую же структуру, что и детерминистский аналог исходной модели. Следовательно, после надлежащего определения всех констант, стоящих в правых частях соотношений (10), вычислительные процедуры, связанные с нахождением
    оптимального решения для стохастической модели, оказываются
    не более громоздкими, чем процедуры поиска оптимального решения для ее детерминистского аналога. Во-вторых, относительно случайных величин bt требуется знать лишь значения констант PJ,
    определяющих соответствующие безусловные распределения вероятностей. В силу указанных свойств модели с вероятностными ограничениями выгодно отличаются от моделей, рассмотренных в предыдущем разделе, когда при отображении стохастической задачи
    на обычную задачу линейного программирования размерность модели сильно возрастает и, кроме того, приходится предполагать, что
    число возможных состояний Q ограничено. Основной недостаток
    моделей с вероятностными ограничениями заключается в том, что
    экономическое последствие «нарушения» того или иного ограничения может быть оценено лишь косвенным путем. Так, например,
    в задаче фирмы «Супердранка» метод вероятностных ограничений
    не позволяет проанализировать зависимость убытков, которые может
    понести фирма, от избыточного объема выпускаемой ею продукции.
    Выражаясь иными словами, в большинстве случаев определение
    численных значений р г , правильно описывающих анализируемую
    ситуацию, должно быть составной частью оптимизационного процесса. [Дополнительная концептуальная ограниченность данного
    метода состоит в том, что он заведомо исключает рандомизированные
    стратегии, которые (как было показано в разд. 16.2) иногда оказываются более выгодными. Необходимо также отметить, что оптимальное решение, полученное методом вероятностных ограничений,
    может отличаться от оптимального решения, найденного с помощью
    Двухшаговой модели (разд. 16.6). Таким образом, у нас нет никакой

    50

    ГЛАВА 16

    уверенности в том, что существуют такие значения р г , для которых
    методом вероятностных ограничений было бы получено решение,
    являющееся оптимальным для двухшаговой модели, проиллюстрированной в предыдущем разделе.]
    Поэтому, столкнувшись с проблемой выбора между двумя подходами к моделированию двухшаговой процедуры принятия управляющих решений, операционист должен взвесить положительные
    и отрицательные качества как первого, так и второго методов: двухшаговая модель, рассмотренная в предыдущем разделе, приводит
    к необходимости оперировать слишком большими системами линейных соотношений, тогда как в модели с вероятностными ограничениями сам термин «оптимальное решение» имеет весьма ограниченный смысл. При ознакомлении с многошаговой моделью читатель
    заметит, что концептуальные трудности метода вероятностных ограничений при этом катастрофически возрастают. Вопрос о применимости этого метода к решению задач многошагового характера
    пока еще находится в стадии исследования как в теоретическом,
    так и в эмпирическом плане.
    В оставшейся части этой главы приводится анализ одного специального примера двухшаговой модели, а также рассматриваются
    способы построения линейных стохастических моделей, отличные
    от предложенных выше. Этот материал представляет для читателя
    определенный интерес в том случае, если он хочет глубже разобраться в методах отображения стохастических оптимизационных моделей
    на эквивалентные модели с детерминированной структурой. В то же
    время наше введение в методы построения оптимальных стратегий
    в условиях неопределенности вполне достаточно для того, чтобы
    подготовить читателя к анализу рассматриваемых в гл. 17 моделей
    динамического программирования, содержащих элементы вероятностного характера.
    В некоторых приложениях вместо индивидуальных ограничений
    типа (11) могут возникнуть совместно-вероятностные ограничения.
    Такого рода модели обычно оказываются эквивалентными нелинейным оптимизационным моделям, решение для которых может быть
    получено методами, изложенными в гл. 15. Чтобы пояснить, что
    мы имеем здесь в виду, рассмотрим следующую ситуацию. Пусть
    вместо (11) имеет место единственное вероятностное ограничение вида
    h

    k

    Р \^jag+i,jXj^.bg+l,
    3=1

    ..., 2

    ЯгоЛ'<Ьт]>Р,

    (I)

    3=1

    (совместно-вероятностное ограничение).

    где 0< р < 1.
    Заметим, что в этом случае подлежит конкретизации только одна
    константа р, и, следовательно, анализ чувствительности получаемого решения будет относительно простым. Обозначим функции безусловного распределения через FI (Ъ) SE P [bi
    ТЕОРИЯ СТОХАСТИЧЕСКИХ

    ОПТИМИЗАЦИОННЫХ

    МОДЕЛЕЙ

    51

    что все они непрерывны. Допустим, кроме того, что функция совме7П

    стного распределения для bt имеет вид

    [] Ft, где П означает

    i=g+l

    операцию взятия произведения (умножения). Следовательно,
    bg+i, . . ., bm статистически независимы. Наконец, пусть Gt =
    = 1 — Ft. Тогда эквивалентная стохастической детерминистическая
    модель представляется с помощью (9), (10), (12) и соотношений
    ft
    —У» + 2 uijXj = 0, i = g-\-l, ..., т (определение квантиля),
    (И)

    т

    П

    £<(#«) ^-Р

    (детерминистский эквивалент
    совместного распределения),

    (III)

    где г/, не ограничен по знаку. Отметим, что ограничение (III) имеет
    нелинейный вид. Лишь в отдельных случаях GI таковы, что (III)
    определяет вогнутую функцию, т. е. удовлетворяет требованиям
    большинства алгоритмов решения нелинейных оптимизационных
    задач. Однако логарифмическое представление (III), имеющее вид
    m

    2 I n G j (г/г)>-1п (3
    i=s+i

    (эквивалентное логарифмическое
    представление),

    (IV)

    чаще всего оказывается вогнутым (например, в том случае, когда
    Ь{ задается нормальным распределением, гамма-распределением или
    равномерным распределением). Для решения задачи, представленной соотношениями (9), (10), (12), (II), (IV), можно воспользоваться
    математическим методом, изложенным в гл. 15.
    Рассмотрим случай, когда значения bt известны, а величины а^
    являются случайными. Например, предположим, что (11) заменено
    следующим соотношением:
    ъ^
    >pi, i = g-\-i, ..., т (в качестве коэффициентов фигурируют случайные величины). (V)
    Если допустимо предположение, что для каждого значения i случайные величины аи (у = 1, 2, . . ., k) имеют нормальное совместное распределение со средними значениями а,ц (;' = 1, 2, . . ., k)
    и смешанными моментами (ковариациями) aiih (j = 1, 2, . . ., k;
    h = 1, 2, . . ., k), то нелинейный детерминистский эквивалент (V)
    имеет следующий вид:
    Ъ

    Й

    з=1

    '

    J

    3

    h

    1/9

    j=l ft=l

    (детерминистский эквивалент), (VI)

    52

    ГЛАВА 16

    где BI есть квантиль (1 — р г ) нормального распределения нормированной случайной величины. Если р, ^1 / 2 , так что Bt ^ 0, то представление (VI) является вогнутым, и для модели (9), (10), (12), (VI)
    решение может быть найдено с помощью математических приемов,
    рассмотренных в гл. 15.
    16.6. СЛУЧАЙ ТРАНСПОРТНОЙ СЕТИ

    Как уже отмечалось в гл. 6, транспортная задача (или задача
    размещения) является одной из наиболее важных задач оптимизации на сетях. Математически она формулируется следующим образом:
    m

    n

    Минимизировать 2 S Сцхц.
    i=l 3=1

    (1)

    при ограничениях
    n

    2^i,- = 5'j,
    ;=i

    i = l, 2, ...,

    т (предложение),

    (2)

    т

    2 xi} = D), 7 = 1, 2, ..., п (спрос),
    t=i
    хц ^ 0 для всех значений i и у,

    (3)
    (4)

    где Si можно интерпретировать как имеющийся в наличии объем
    продукции, ожидающий погрузки в i-м пункте отправления, a DJ —
    как объем продукции, требуемый в /-м пункте назначения (/-му
    потребителю), причем модель построена в предположении, что суммарное предложение равняется суммарному спросу (25; = 2-D^).
    В гл. 6 постулировалось, что значения St и DJ являются точно
    известными. В гл. 7 было показано, каким образом находится численное решение этой задачи, основанное на применении симплексного метода. Рассмотрим теперь случай, когда уровень спроса DJ
    оказывается неопределенным. Покажем, что соответствующая такому предположению двухшаговая модель выглядит лишь в незначительной степени сложнее своего детерминистского аналога (1) — (4).
    Будем считать, что основными этапами оптимизационного процесса являются следующие:
    1. Первый шаг. При наличии точных данных относительно значений Si, c t j и, возможно, некоторых из DJ требуется выбрать значения всех управляемых переменных Xtj.
    2. Получение информации относительно частных исходов. Становятся известными фактические значения случайных величин DJ.
    Значения DJ оказываются независимыми от выбора значений переменных Xij.
    3. Второй шаг. Определяется «фактический» объем неудовлетворенного спроса или избыточной продукции.

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    53

    Заметим, что в силу п. 3 на втором шаге в модели (1) — (4)
    появляются п переменных
    m

    Uj^Dj—^j

    i=l

    xtj,

    / = 1, 2, ..., п,

    (5)

    не ограниченных по знаку. Чтобы сделать задачу первого шага
    нетривиальной, необходимо к выражению для целевой функции
    прибавить член, содержащий и/, поскольку в противном случае
    оптимальное решение будет заключаться в том, чтобы из каждого
    i-го пункта отправления транспортировать всю имеющуюся в наличии продукцию объемом St в тот пункт назначения /, которому
    соответствует минимальное значение ctj. Пусть с/ (uj) представляют
    собой потери (например, в виде штрафа), связанные с результирующими значениями и/. Необходимо иметь в виду, что функции Cj (uj)
    не обязательно являются линейными; можно, например, предположить, что функция потерь (или штрафная функция) имеет квадратичную форму. Допустим теперь, что целевая функция представляет
    собой сумму транспортных затрат и ожидаемого значения возможных потерь (при Uj *£ 0), т. е. пусть требуется
    m

    n

    Минимизировать 2 2

    n

    m

    с

    i=l j=l

    г#й"т- S Е [С] (Dj—2
    j=l

    t=l

    х

    ч}\

    (6)

    при ограничениях (2) и (4). Фигурирующие в (6) средние значения
    случайных величин определены с учетом безусловного распределения вероятностей для DJ.
    Отметим важную особенность приведенной выше двухшаговой
    модели: на втором шаге проблемы оптимизации не существует.
    Значения переменных второго шага и} с помощью (5) однозначно
    определяются значениями переменных, выбранными на первом шаге,
    и значениями, принимаемыми случайными величинами DJ. Эта
    особенность модели полностью используется при решении задачи,
    и, таким образом, в отличие от случая, рассмотренного в разд. 16.4,
    отпадает необходимость оперировать детерминистским аналогом
    исходной стохастической модели. Примем еще два постулата, позволяющие свести двухшаговую стохастическую модель (2), (4)-(6)
    к математически эквивалентной ей обычной транспортной задаче.
    Во-первых, предположим, что возможны лишь целочисленные значения DJ (для всех значений /'). Определим для каждого значения j
    т

    Xj s= 2 xtj
    f=i

    (суммарный объем поставок в /-и пункт назначения)

    (7)
    и введем величину
    Cj (х}) = Е [с} (D} — х}}]

    (ожидаемые потери, связанные
    с /-м пунктом назначения).

    (8)

    ГЛАВА 16

    54

    (Способ вычисления Cj (xj) проиллюстрируем на примере, который
    рассматривается ниже.)
    Во-вторых, допустим, что Cj (x^ есть выпуклая функция:
    (для всех целочисленных
    значений xj).
    (9)

    Cj(Xj-{-i)—Cj(Xj)^Cj(xj)—Cj(xj—1)

    Чтобы функция Cj(xj) была выпуклой, достаточно выпуклости самой
    функции потерь Cj (u}). С помощью приведенного ниже примера
    мы покажем, что предположений о целочисленности и о том, что
    функция потерь является выпуклой, достаточно, чтобы свести рассматриваемую нами задачу к обычной расширенной транспортной
    задаче.
    \ Столбец
    1

    Jl
    '1
    .*!

    Спрос

    Предложение

    Л. \

    f
    °\
    *\
    7

    НА
    *\

    i
    i

    ,5_\

    1

    1\

    В

    '\

    i

    fj
    2

    10

    7

    Р и с . 16.6. Транспортная задача (оптимальное
    решение для детерминистической модели).
    Минимальные общие затраты = 100.

    Чтобы не ввести читателя в заблуждение, необходимо предупредить его о том, что существуют значительно более эффективные
    методы численного решения рассматриваемой нами задачи, чем ее
    решения в полностью развернутой постановке. (Чаще всего используются вычислительные процедуры, основанные на применении обобщенного алгоритма, приведенного в разд. 15.10.) Поэтому при анализе сформулированной ниже задачи читатель должен стремиться
    главным образом понять, почему введение в рассмотрение факторов
    неопределенности приводит лишь к незначительным концептуальным
    усложнениям данной специфической двухшаговой модели. Разработку более совершенных алгоритмов мы оставим специалистам в области прикладной математики.
    Пример. Рассмотрим детерминированную задачу, представленную таблицей на рис. 16.6 (эта таблица уже приводилась нами на
    рис. 7.2, т. I); здесь же указано единственное оптимальное решение.
    Предположим теперь, что значения D3 и Z)4 оказываются неопреде-

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    55

    ленными; в частности, допустим, что соответствующие распределения вероятностей задаются следующими соотношениями:
    так что E[D3]=3,

    РШз=1]=РШз=3]=Р[03=5]=±,

    4

    (10)

    = = - , так что
    (И)

    Таким образом, ожидаемые уровни спроса совпадают с детерминированными уровнями спроса в модели, рассмотренной в гл. 7; однако, несмотря на то что Е Ю 4 ] = 2 , фактический исход Z)4 = 2
    исключен.
    Предположим, что для j = 3, 4 за избыточные поставки (и, ^ 0)
    J-TSL потребитель штраф не взимает, а за недопоставку каждой требуемой единицы продукции назначается штраф в размере /,-, т. е.

    0

    fjl(D._X])

    при

    .

    при D)> x

    (ФУНКЦИЯ потерь).

    (12)

    Легко убедиться, что функция с/ (и,) (где и, = Dj — Xj) является
    выпуклой. Следовательно, ожидаемые потери определяются формулой
    C](xj)~

    2 1i(P — Xj)P[Dj = D] (среднее значение функции (13)
    >xi
    потерь).

    D

    Так, например, для х3 = 1
    0=3, 5

    (14)

    а для х 4 = о

    С 4 (3)=2 /4ф-3)Р[/) 4 = £)] = / 4 (4-3)1 = 1/4.

    (15)

    0=4

    Значения Cj (x}) (j = 3, 4) приведены в таблице на рис. 16.7. Чтобы
    убедиться в умении пользоваться формулой (13), читатель может
    попытаться самостоятельно вычислить значения С 3 (3) и С 4 (0)
    и сравнить полученные результаты с соответствующими данными,
    приведенными в таблице на рис. 16.7. Требуется также объяснить,
    почему Cj (0) = fjE [Dj], а функция Cj (xj) асимптотически стремится к нулю при стремлении Xj к максимально возможному значению DJ. Читателю рекомендуется также проверить, что функция
    Cj (xj) является выпуклой в смысле определения (3); при этом можно
    воспользоваться таблицей на рис. 16.7, в которой приведены значения Cj (х}) — Cj (xj + 1), j = 3, 4.

    56

    ГЛАВА 16

    Чтобы преобразовать стохастическую модель в расширенную
    транспортную сеть, мысленно свяжем с каждой единицей возможного1
    спроса D3 и £> 4 самостоятельный пункт назначения. В рассматриваемой задаче для D3 имеется пять пунктов назначения, т. е. наибольшее из возможных значенийD s равняется 5; аналогично число пунктов назначения для Z>4 равняется четырем. Каждый из этих пунктов
    назначения характеризуется единичным уровнем спроса (т. е. каждому пункту назначения требуется продукция в количестве одной
    условной единицы). Такая схема рассуждений приводит нас к тому,
    что суммарная потребность в продукции на всех пунктах назначения (т. е. у всех потребителей) равняется 21 единице (7 + 5 + 5-\- 4).
    Поскольку суммарное предложение (суммарное количество продукции, имеющейся в наличии на пунктах отправления, т. е. у всех
    фигурирующих в задаче поставщиков) равняется, согласно таблице
    на рис. 16.6, 17 единицам (6+ 1+ 10), необходимо ввести в рассмотрение четвертый (фиктивный) пункт отправления, для которого
    54 = 4 единицам (21—17). Таким образом, каждая единица продукции, поставляемая из четвертого пункта отправления (т. е. за счет
    iS4), фактически соответствует единице неудовлетворенного спроса.
    Предположим, что потребности DI и D 2 должны быть удовлетворены
    при любых обстоятельствах и, следовательно, четвертый поставщик
    (т. е. четвертый пункт отправления) в соответствующие пункты
    назначения продукцию не отправляет. Тогда мы приходим к табличному представлению транспортной задачи, приведенному на рис. 16.8.
    В таблице на рис. 16.8 значения с^ для i = 1, 2, 3 совпадают
    с соответствующими значениями сц, фигурирующими в таблице
    на рис. 16.6, и одинаковы для столбцов, отвечающих значениям
    с одним и тем же DJ. Содержание четвертой строки требует некоторых пояснений. В этой строке фигурируют значения, принимаемые
    приращениями Cj (xj~) — Cj (xj-\- 1) (см. таблицу на рис. 16.7).
    Xj

    0
    1
    2
    3
    4
    5
    (и>5)

    t/з ,£3)

    З/з
    2/з
    4

    C3(xa)-C3(x3+l)

    l/з
    2

    /з/з

    /з/з
    2
    /з/з

    V 3 /3

    V3/3

    l/3/з

    0

    С 4 (х 4 ) C4(*4)-C 4 (*4+1)

    2

    /3/3

    0

    6

    3

    2/4

    3

    /4/4

    /4/4

    2

    /4/4

    /4/4
    V4/4
    0
    0

    2

    /4/4
    Х
    /4/4

    0
    0

    Р и с. 16.7. Ожидаемые экономические потери при неполном
    удовлетворении спроса.

    Заметим, что сумма приращений С3 (#з) — ^з (#з + 1) по всем возможным значениям х3 равняется С3 (0) [аналогично сумма прираще-

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
    Столбец
    1

    2

    3

    10

    4

    ,5

    7

    S

    D2

    1

    1

    Предложение

    s=sr

    <

    fcj
    О,

    11

    Jj

    JLJ

    Спрос

    57

    1

    i
    1

    1

    1

    Oj

    1

    1

    1

    Л^

    Р и с . 16.8. Матрица для расширенной транспортной задачи.

    ний GI (х±) — С 4 (я4 + 1) по всем возможным значениям а;4 равняется С 4 (0)]. Поскольку функция С/ (х) является убывающей
    и выпуклой, значения коэффициентов при /7- в столбцах, содержащих
    С] (xj), убывают с ростом значения /. [Заметим, что в тех случаях,
    когда элементы четвертой строки, относящиеся к смежным столбцам (рис. 16.8), совпадают, элемент, стоящий слева, помечен знаком плюс и его численное значение можно считать «несколько
    большим» значения элемента данной пары, стоящего справа.}
    Отсюда следует, что для каждого DJ оптимальное решение заключается в том, чтобы распределить 54 по столбцам, начиная с самого
    правого и переходя последовательно к столбцам, расположенным
    левее. Таким образом, в случае оптимального решения суммарные
    потери, связанные с размещением /54 (S4 представляет собой неудовлетворенный спрос) в столбцах, соответствующих DJ (]' = 1, 2, 3, 4),
    равняются Cj (xj).
    Предположим, например, что три единицы из «S4 распределены
    по столбцам 5, 6 и 7, отвечающим D3- Тогда х3 = 2 (в чем нетрудноубедиться), и с помощью таблицы на рис. 16.7 получаем

    =/,+-•/,+••/„—•/а.

    (16)

    (Поскольку St = 4, х3 ^ 1, и, следовательно, первый вклад в Z>3,
    представленный матричным элементом 1/з на пересечении третьего
    столбца и четвертой строки, можно исключить из рассмотрения.
    Еще одно упрощение может быть достигнуто путем подбора такой
    комбинации столбцов, для которой совокупный спрос равен 2.)
    Если бы функция С) (xj) не была выпуклой, мы не могли бы
    гарантировать, что оптимальное решение свелось бы к распределению 54 по потребителям, спрос которых оказался неудовлетворенным, начиная с наиболее высокого из возможных значений уровня

    ГЛАВА 16

    58

    спроса и последовательно переходя к более низким уровням. В заключение можно сказать, что оптимальное решение для модели, изображенной на рис. 16.8, которое минимизирует при заданных значениях /з и / 4 суммарные транспортные затраты, определяемые целевой
    функцией (6), находится с помощью алгоритма решения транспортной задачи, который приведен в разд. 7.3.
    Анализ чувствитеьности. Построив расширенную транспортную
    модель, которая математически эквивалентна двухшаговой стохастической модели, мы можем оценить эффект, порождаемый фактором неопределенности. В частности, мы можем исследовать чувствительность решения по отношению к вариациям значений / 3 и /4.
    Поскольку суммарный объем имеющейся в наличии продукции равен
    17 единицам (Si-]- ^2+ ^з); а спрос (Di -)- Z)2) в объеме 12 единиц
    должен быть удовлетворен (в обязательном порядке), то остается
    5 единиц (17—12) продукции, которые требуется полностью распределить по потребителям 3 и 4, характеризующимся уровнями спроса DS и £)4 соответственно. Это означает, что возможны лишь следующие решения:
    #3 — 1, л» • • ч 5»

    и

    2^4 — " — 2-3-

    (17)

    Для каждой пары значений xz и ж 4 оптимальные значения всех
    управляемых переменных xt]- приведены в таблице на рис. 16.9
    (оптимальные значения Хц можно найти путем решения соответствующей детерминистической задачи, аналогичной той, которая
    представлена таблицей на рис. 16.6). Ответ на вопрос, какой из вариантов размещения действительно является оптимальным, т. е. приводит к наименьшему ожидаемому значению целевой функции (6),
    разумеется, зависит от фактических числовых значений / 3 и /,..
    Оптимальное
    размещение *
    'ИЗ

    Х

    2*

    -^33

    ^

    Ожидаемые
    суммарные затраты
    83 + 2f3

    3

    2

    О

    При этом

    х/г=$,ха-/,^=7.

    Р и с . 16.9. Оптимальное размещение при заданных значениях (хз, xj и (/3, ft).

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    59

    Можно также считать, что оптимальный вариант размещения зависит от значения отношения / 3 // 4 и абсолютного значения /3. Для
    трех значений / 3 // 4 в таблице на рис. 16.9 указаны также значения /3, для которых приводятся возможные оптимальные решения.
    Заметим, что
    (I) если отношение /3//4 велико (например, равняется 3), то при
    возрастании / 3 увеличивается число единиц продукции, предназначаемое для третьего потребителя;
    (II) если отношение / 3 // 4 мало (например, равняется 1/3), то
    в третий пункт назначения отправляется минимальное количество
    продукции независимо от того, какое значение принимает /3;
    (III) всегда можно подобрать такие значения /з и / 4 , для которых
    каждый из возможных вариантов размещения является оптимальным
    Экономический эффект, обусловленный наличием неопределенности, можно измерить путем сравнения минимальных ожидаемых
    затрат, вычисленных с учетом (6), с минимальными затратами, которые имели бы место, если бы значения D3 и /?4 были известны до
    момента принятия решения относительно выбора варианта распределения объемов транспортных перевозок по пунктам назначения.
    Для того чтобы произвести такого рода оценки, допустим, что значение /з достаточно велико, чтобы считать вариант полного удовлетворения потребностей предпочтительным в любом случае, а также
    предположим, что все 5 единиц продукции, оставшейся после удовлетворения спроса DI и спроса Dz, отправляются в третий и четвертый пункты назначения даже в том случае, если (-D3+ D 4 ) < 5.
    Тогда можно показать, что для достаточно больших значений / 3
    -Суммарные транспортныеI
    О
    оЬ
    /4
    расходы плюс потери при
    Е наличии точной информа(I)
    195
    +
    8/э
    при
    £
    =
    1
    и
    1
    Щии
    и, следовательно,
    ГОжидаемая

    цена]

    11-п- + оо/з
    1+|/g

    [-6 + 11/3

    при т^ = 3,
    npH£=lf
    П

    (П)

    р И /?= .1_.

    Формулой (II) представлена оценка максимума того, что был бы
    готов выплатить руководитель, если бы он получил взамен абсолютно точный прогноз относительно случайных исходов. Цена неопределенности есть линейная функция /3; при достаточно больших значениях /з эта цена оказывается наибольшей при / 3 // 4 = 1/3, так как
    в этом случае третьему потребителю отправляется наименьшее
    количество продукции.

    60

    ГЛАВА 16

    Метод вероятностных ограничений. Весьма поучительным может
    оказаться сравнение только что рассмотренной двухшаговои модели
    с вариантом этой модели, построенным методом вероятностных
    ограничений, в котором наряду с детерминированной целевой функцией (1) и ограничениями на предложение (2) и спрос (3) для / = 1,2,
    а также условиями неотрицательности управляемых переменных (4)
    принимаются следующие ограничения:
    Р [D3 ^ х3] ^ Рз и Р LD4 ^XJ s2s Р 4 (вероятностные ограничения),
    (18)
    где суммарный объем поставок X] в ;-й пункт назначения определяется по формуле (7). Таким образом, согласно (18), необходимо,
    чтобы вероятность удовлетворения уровней спроса DJ (/ = 3,4)
    была не меньше Р^, причем р^ могут принимать любые значения
    в интервале (О, 1). Заметим, что соотношения (18) ориентированы
    на предотвращение случаев неудовлетворения спроса, тогда как
    соотношения (4) и (5) из разд. IG.5 обеспечивают устранение ситуаций, при которых объем поставок превышает существующие уровни
    спроса.
    При заданных значениях Р З и р 4 задача с вероятностными ограничениями эквивалентна задаче, в которой вместо (18) рассматривается ограничение
    m

    У> x ^Bj,
    i=i i}

    1 = 3, 4

    (детерминистский эквивалент),

    (19)

    где Bj указывают на нижнюю границу для уровней спроса и удовлетворяют условию
    Р ID} < Bj\ > ру.
    (20)
    Остальные компоненты модели, т. е. целевая функция (1) и ограничения (2) и (3) для / = 1, 2, остаются без изменений.
    Отметим еще раз, что единственно возможными вариантами распределения оставшихся пяти единиц продукции между третьим
    и четвертым потребителями являются варианты, определяемые формулой (17); соответствующие значения Р [D, ^ xj] приведены в таблице на рис. 16.10. Из этой таблицы вытекают два важных вывода.
    Во-первых, не существует допустимого решения в том случае, если
    Р! и Р 2 принимают одновременно слишком большие значения. Так,
    например, если Р З = 2/3, то не существует ни одного допустимого
    решения для Р 4 > 1/2. Во-вторых, варианты размещения (xs = 2,
    £ 4 = 3) и (х3 = 4, £4 = 1) являются неоптималъными при любых
    значениях р 3 и Р 4 . Вариант размещения (xs — 1, х 4 = 4) всегда
    предпочтительнее варианта (xz = 2, #4 = 3), поскольку вероятности
    удовлетворения спроса Ds и спроса D^ для х3 = 1, х 4 = 4 не могут
    быть меньше соответствующих вероятностей для варианта (х3 = 2,
    £4 = 3), и, следовательно, для первого варианта транспортные
    расходы не могут превышать транспортных расходов для второго

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    з

    х±

    Суммарные
    транспортные
    расходы

    1

    4
    3
    2
    1
    0

    89
    94
    100
    106
    112

    х

    2
    3
    4
    5

    Р [D3 ^ хз]

    V.


    Р [£*4 'С £4]

    1
    3

    2

    /3

    /4
    V,

    2



    1/2

    1

    61

    V4

    Р и с . 16.10. Вероятности удовлетворения спроса при
    заданных значениях ars и ;г4.

    варианта. Аналогично объясняется неоптимальность варианта
    (х3 = 4, ж 4 = 1).
    Расхождения в выводах, полученных вначале с помощью двухшаговой модели, а затем методом вероятностных ограничений, указывают на принципиальное различие рассмотренных типов моделей,
    заключающееся в том, что возможные оптимальные решения в одном
    случае могут не совпадать с возможными оптимальными решениями
    в другом случае. Уверен ли читатель, что упомянутые выше
    варианты размещений (х3 = 2, xk = 3) и (х3 = 4, я4 = 1) действительно следует исключить из рассмотрения? Ответ должен быть
    надлежащим образом аргументирован.
    16.7. МНОГОШАГОВАЯ ЛИНЕЙНАЯ МОДЕЛЬ

    Логика рассуждений, позволившая преобразовать двухшаговую
    стохастическую модель линейного программирования в математически эквивалентную ей обычную линейную оптимизационную модель,
    может быть успешно применена и в случае многошаговых задач.
    Как и ранее, необходимо исходить из предположения, что возможно
    лишь конечное число Q наборов значений для фигурирующих в модели случайных величин (или, другими словами, конечное число
    состояний). В реальной многошаговой задаче значение Q может
    быть настолько большим, что решение результирующей задачи
    линейного программирования окажется практически невозможным;
    поэтому излагаемый ниже метод анализа представляется полезным
    главным образом в связи с попыткой глубже разобраться в особенностях организационного управления в условиях неопределенности.
    Однако в некоторых (хотя и редких) случаях многошаговая модель
    оказывается практически применимой при решении реальных задач.
    Пусть детерминистский прототип задачи выглядит следующим
    образом:
    Максимизировать 2 cixi

    (1)

    62

    ГЛАВА 16

    при ограничениях
    п

    ^aijX) = bi,

    г = 1, 2, . . . , т о ,

    (2)

    Zj>0, / = 1 , 2, ..., /г.
    (3)
    Предположим, что в стохастическом варианте модели С], ао- и bi
    являются случайными величинами. В частности, допустим, что число
    возможных состояний равняется Q. Обозначим эти состояния через
    (с91, aqij, bqi). Ниже рассматривается трехшаговая процедура, используемая при формулировке соответствующей задачи линейного
    программирования. Предлагаемая процедура представлена в самом
    общем виде и поэтому пригодна для любых многошаговых моделей.
    Однако при рассмотрении конкретных задач эту процедуру нередко
    удается редуцировать.
    Идея заключается в том, чтобы начать с формулировки задачи,
    в которой предполагается, что еще до момента принятия того или
    иного управляющего решения известно, какой из возможных Q
    исходов фактически имел место. Если бы такое предположение соответствовало реальному положению вещей, то в результате мы получили бы Q альтернативных вариантов действий или правил, которые
    в совокупности исчерпывающим образом определили бы стратегию
    поведения. Следующий шаг заключается в учете того обстоятельства,
    что в момент принятия решения относительно выбора значений
    некоторых (по условию задач — вполне конкретных) переменных
    не все случайные величины на самом деле оказываются определенными. Поэтому первоначальная формулировка задачи должна быть
    видоизменена путем наложения дополнительных ограничений, из которых должно вытекать, что в соответствующих правилах упомянутые управляемые переменные не должны различаться по индексу д. Так, например, во всех Q правилах принятия решений значения всех управляемых переменных первого шага должны совпадать.
    На заключительном шаге шлифуется форма представления модели»
    полученной на втором шаге.
    Приведем более подробное описание данного метода.
    Шаг 1. Рассматривается формулировка задачи, которая была
    бы правильной, если бы имелась возможность получать информацию
    относительно значений всех фигурирующих в модели случайных
    величин до того, как выбираются значения управляемых переменных Xj, а именно рассматривается следующая задача:
    Q

    п

    Максимизировать 2 Рд S cqixni
    при ограничениях

    g=l

    i=l

    (4)

    п

    ^aqijxqj = bqi, i = l, 2, . . . , иг; д = 1, 2, . . . , < ? ,
    j=i
    xqj>0, i = 1, 2, . . ., m; q = 1, 2, . . ., Q,

    (5)
    (6)

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    63

    где Xqj (] = 1, 2, . . ., п) — значения жу, соответствующие исходу
    c

    ( qji

    0-qiji

    bqi).

    Шаг 2. Учитывается фактический порядок поступления информации; при этом всякий раз, когда в момент принятия решения
    фактические исходы для случайных величин неизвестны, соответствующие Xqj не различаются по индексу q. Так, например, если
    значение х^ подлежит определению до того, как станут известными
    значения фигурирующих в задаче случайных величин, то к ограничениям (5) и (6) добавляется условие ж 4 1 = ж 2 1 = . . . = х^.
    Шаг 3. С учетом ограничений, принятых на втором шаге, производится упрощение тех или иных соотношений модели. Например,
    в случае, если имеет место дополнительное условие, приведенноевыше (см. шаг 2), то xql (q = 2, 3, . . ., Q) всюду заменяются на Хц~
    затем приводятся подобные члены и исключаются избыточные уравнения.
    Важно четко уяснить, что оптимальные значения xqj для модели (4) — (6) — это такие значения xqj, которые определяют управляющие решения, принимаемые в условиях, когда случайные исходы
    (cqj, aqij, bqt) оказываются уже реализованными. Следовательно,
    излагаемый нами метод анализа должен в результате привести
    к формулировке исчерпывающего предписания относительно вариантов действий для каждого возможного исхода. Вместо того чтобы
    пытаться развить данный метод во всех его деталях (связанных,
    например, с устранением различного рода неоднозначностей), мы
    обратимся к примеру, который позволит одновременно получить
    представление о методе в целом.
    Пример календарного планирования производства. Рассмотрим
    фирму, составляющую календарный план выпуска продукции, в котором должен быть определен объем производства xt для каждого
    отрезка t, где t = 1, 2, 3. Обозначим уровень спроса на отрезке t
    через Dt и предположим, что неудовлетворенная на отрезке t часть Dt
    полностью пропадает. Пусть it есть уровень запасов в конце периода t; допустим, что в начале отрезка 1 запасы отсутствуют, а запасы
    в конце отрезка 3 обесцениваются. Обозначим через ct прибыль,
    получаемую от каждой единицы продукции, выпущенной на отрезке t и коммерчески реализованной до конца планового периода.
    Положим ct = г — et, где г — рыночная цена единицы продукции,
    a et — затраты, связанные с производством единицы продукции
    на отрезке t. Пусть хранение каждой единицы продукции, остающейся заскладированной до конца отрезка t, обходится ht. Тогда
    в детерминистском варианте задача формулируется следующим
    образом:
    Максимизировать 5j c&t — S fait — (^з -<- г) г'3

    (7)

    64

    ГЛАВА 16

    при ограничениях
    ^i — ij

    + Si = DI

    (товарный баланс в конце
    отрезка 1),
    (8)

    + $2 = DZ

    (товарный баланс в конце
    отрезка 2),
    (9)

    iz + ^s — *з + S3 = D3

    (товарный баланс в конце
    отрезка 3),
    (10)

    h + xz — h

    *| >0, it >0, «4 >0, « = 1,2,3,
    (11)
    где s( — объем неудовлетворенного спроса на отрезке t.
    Приведенная выше модель во многих отношениях напоминает
    модель, рассмотренную в разд. 8.3 (рис. 8.6), однако она обладает
    двумя характерными особенностями, на которых следует остановиться отдельно. Во-первых, путем введения переменных st учитывается неудовлетворенный спрос. [Читатель без труда сможет модифицировать соотношения (8) и (9) в случае, если неудовлетворенный
    спрос не аннулируется (т. е. поступившие заказы не теряются),
    а прибавляется к спросу в последующие периоды.] Во-вторых,
    задача заключается в «максимизации прибыли». Поскольку ct (коэффициент при переменной, обозначающей объем производства) линейно зависит от рыночной цены г, коэффициентом при i3 также является г, причем ri 3 есть величина, определяющая нереализованную
    часть дохода, которая соответствует части продукции, оставшейся
    на складе на конец отрезка 3. При известных значениях Dt решение
    для модели (8) — (11) является тривиальным: предположив, что
    ct > О (t = 1, 2, 3), спрос в период t следует удовлетворить за счет
    продукции, выпускаемой на отрезке k (k ^ t), так, чтобы разность
    c
    h — h-ъ. была максимальной. Для того чтобы прийти к такого рода
    тривиальному заключению, вряд ли требуется обращаться к помощи
    модели.
    Но предположим теперь, что задача содержит элементы неопределенности. В частности, допустим, что Dt есть случайная величина.
    Каковы в этом случае оптимальные значения z ( ? Чтобы ответить
    на этот вопрос, необходимо располагать дополнительными данными
    о вероятностном законе, определяющем поведение Dt, a также знать,
    в какой последовательности устанавливаются индивидуальные уровни xt и каков порядок поступления информации относительно спроса.
    Допустим, что значения Dt не зависят от выбора значений xt. Кроме
    того, предположим, что -Dt может принимать только два различных
    значения. При фиксированном значении DI число возможных значений Dz примем равным 2; другими словами, существует четыре
    возможных значения Z)2- Аналогично допустим, что для каждого
    возможного значения Di и D3 существует два возможных значения Пз, т. е. суммарное число возможных значений D3 равняется 8.
    Короче говоря, уровни спроса Dt являются зависимыми случайными
    величинами, причем существует Q = 8 возможных
    состояний

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    01

    02



    Pq

    013

    Pi

    023

    Pz

    033

    Рз

    043

    Рь

    053

    Р5

    063

    Рв

    073

    P^

    083

    Ps

    65

    п
    П
    Л
    Г)
    ii — U2i — ^31 — ^41

    u

    D

    n
    52 — ^62

    Р и с. 16.11. Возможные значения Dt (t = 1, 2, 3).

    ( D i , Dz, Ds), которые мы обозначим через (Dqi, D q = 1, 2, . . ., 8 (см. таблицу, приведенную на рис. 16.11). Чтобы
    выяснить, как отражается на структуре модели порядок поступления информации относительно случайных исходов, а также порядок
    следования управляющих решений, рассмотрим четыре различные
    ситуации.
    Наличие полной прогностической информации. Предположим,
    что фактические значения всех случайных величин оказываются
    известными до того, как выбирается значение каждой из управляемых переменных. В этом случае задача, описанная в связи с приведенной выше формулировкой шага 1, сводится к следующей задаче
    линейного программирования:
    8

    3

    2

    Максимизировать 2 Pq I 3 ct%qt—
    при ограничениях

    + Л/i —

    x

    qi — 1<
    I,qi

    qt

    0,

    91'

    ~т~ "^q%
    _|_ г
    "Р ^q3

    L

    ^3]

    4=1

    ,•
    ^Q3

    I

    \

    о — П
    °q3
    -^03'

    >0, g = 1, 2, . . . . 8.

    (12)
    (13)
    (14)
    (15)
    (16)

    66

    ГЛАВА 16

    Данная модель содержит 72 переменные при 24 ограничениях,
    каждое из которых имеет форму равенства. (Совершенно очевидно,
    что для получения численного решения этой задачи систему уравнений (12) — (16) можно разложить на 8 (Q = 8) автономных линейных «программ». Получаемые в результате программы имеют тривиальные решения, поскольку они обладают структурой, совпадающей со структурой детерминистической модели (7) — (И). Оптимальное значение целевой функx
    Дии (12) определяется как «сред' «42
    qz>
    невзвешенное» на множестве решений автономных систем уравнений
    2 = '22
    при условии, если соответствующие
    = «22
    вероятности pq заданы.)
    '11 = *2l = '31 '-=41
    Случай, когда вначале уточня332 = Я42
    ется спрос, а затем принимается
    «11 = «21 = «31 = «41
    '32 — *42
    решение. Предположим, что к мо«32= «42
    менту принятия решения относительно объема производства на
    отрезке t известно точное значение
    Dt, а также предыдущие уровни
    спроса. Тогда, в соответствии с
    '51 = 'в! = '71 = '81
    рассмотренным выше шагом 2,
    51 = 61 =«71 = 81
    необходимо ввести дополнительные
    ограничения, указанные в таблице
    на рис. 16.12. Так, например, если
    DI = DU = . . . = Z) 4 i, то объемы
    Р и с . 16.12. Дополнительные ограничения в случае, когда вначале производства на отрезке 1, запасы
    уточняется спрос, а затем прини- на конец этого отрезка и объемы
    мается решение.
    нереализованной продукции будут
    одинаковыми для q = 1, 2, 3, 4.
    Аналогично, если D%=D32= . . . = Diz, то объемы производства,
    запасы и объемы неудовлетворенного спроса для g = 3, 4 совпадают.
    Для реализации шага 3 оказывается удобным все тождественные
    величины обозначать одним и тем же символом; например, вместо £ 2 i,
    #3i и ж41 следует всюду подставить ги (аналогичная подстановка
    осуществляется для iql, sql и Dqi). При этом сразу же обнаруживается, что ограничения (13) для q = 1, 2, 3, 4 полностью идентичны, и, следовательно, достаточно рассмотреть лишь одно из них.
    Таким образом, в упрощенном виде задача содержит переменные
    S

    S

    S

    Xqt, iqt, Sqt

    при

    «7=1, 5,
    q=l, 3, 5, 7,
    q=l, 2, . . ., 8

    если f =
    если t =

    (17)

    если t =

    и включает ограничения (13) для q = 1. 5, ограничения (14) для
    q = 1, 3, 5, 7, ограничения (15) для q = 1, 2, . . ., 8 и ограничения
    (16). В общей сложности в редуцированной задаче фигурируют 42 пере-

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    67

    менные и 14 уравнений, задающих ограничения. Читатель может
    самостоятельно записать упрощенное выражение для целевой функции и, в частности, показать, что коэффициенты при х^ и хм имеют
    соответственно вид (PI + . . . + р4) ci и (р5+• • • + Ps) с\Уточнение спроса после принятия решения. Предположим, что
    к моменту принятия решения относительно объема производства
    xql

    (iqi,

    «,i, *92)

    ('72, «g2> xqa)

    «12 = «22
    '11= • • • ='41
    5^ — . . . — S^
    '32 = '42
    «32 — «42

    '52 = '62
    «52 = «62

    '51 =• • • = '81
    «51 — . . . — «д!

    *2 = *Ю

    Р и с . 16.13. Дополнительные ограничения в случае,
    когда вначале принимается решение, а затем уточняется
    спрос.

    на отрезке t известны лишь предыдущие уровни спроса. Дополнительные ограничения в этом случае (в соответствии с шагом 2) представлены таблицей на рис. 16.13. Заметим, что при этом переменные
    x
    qi (ч = 1' 2, . . ., 8) не различаются по индексу д, поскольку уровень производства на отрезке 1 устанавливается до получения
    каких-либо точных сведений относительно спроса. Отметим также,
    что ограничения на iqi, sgi и xqz накладываются при одних и тех же
    значениях д, так как уровни этих переменных выбираются на основе
    одной и той же информации, а именно с учетом точно известного
    значения DI.
    После упрощений, предусмотренных шагом 3, задача содержит
    переменные
    11^

    Oil

    "01'

    02

    iqv s g2 , xqz
    f'gsi Sq3

    Д«*

    :/ 2

    '

    '

    для
    для

    q = 1, 3, 5, 7,
    q = 1, 2, . . ., 8

    (18)

    и включает в себя ограничения (13) при q = 1, 5, ограничения (14)
    при < 7 = 1 , 3 , 5, 7, ограничения (15) при q = 1, 2, . . ., 8 и ограни-

    68

    ГЛАВА 16

    чения (16). В общей сложности в редуцированном варианте модели
    фигурируют 35 переменных при 14 ограничениях, записанных
    в виде равенств. Читатель может самостоятельно записать соответствующее выражение для целевой функции и убедиться, что коэффициентом при z14 является с 4 .
    Случай принятия решения при полном отсутствии данных о спросе. Предположим, наконец, что объемы производства для всего планового периода должны быть определены до того, как станут известными значения Dt (хотя бы для одного значения t — 1, 2, 3). Легко
    показать, что после надлежащих упрощений в соответствующей
    модели будут фигурировать переменные
    ж и , ж 12 , ж 13 ;

    i
    iqi, sqi

    Для g = l , 3 , 5, 7;

    для q = 1, 5;

    i 93 , s g3 Для q = 1, 2, . . ., 8

    \ ^ *•*)

    и те же самые ограничения, что и в случае, когда вначале принимается решение, а затем уточняется спрос.
    В каждом последующем из четырех рассмотренных случаев объем
    информации, имеющейся в наличии до момента принятия решения,
    уменьшается по сравнению с предыдущим вариантом. Поэтому
    соответствующая последовательность оптимальных значений целевой функции, как правило, является убывающей (и никогда не
    может быть возрастающей). (Математический довод в пользу этого
    утверждения сводится к следующему: в каждой последующей модели появляются дополнительные ограничения (уравнения), и, следовательно, область возможных значений управляемых переменных
    сужается.) В случае, когда имеется полная информация, достигается
    максимум того, чего можно добиться при наличии безошибочных
    предсказаний случайных исходов. В других рассмотренных нами
    случаях разность между оптимальным значением целевой функции
    при неполной осведомленности и оптимальным значением при наличии полной информации представляет собой меру экономического
    ущерба за счет неопределенности.
    О других методах. При анализе некоторых задач, аналогичных
    только что рассмотренной задаче календарного планирования,
    можно воспользоваться другими методами построения многошаговой
    модели. Один из таких методов (который мы уже применяли в разделах 16.5 и 16.6) заключается в использовании вероятностных ограничений. В случае когда имеется конечное число Q возможных
    состояний (т. е. наборов значений, принимаемых случайными величинами), метод вероятностных ограничений позволяет избежать
    многократного увеличения размерности соответствующей задачи
    линейного программирования, которое наблюдается при только что
    изложенном подходе к постановке такой задачи. Если же иметь
    в виду трудности, связанные с необходимостью различать управляемые переменные и данные о случайных исходах, то они «внутренне
    присущи» стохастическим моделям, и не существует такого, во всех

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    69

    отношениях последовательного метода, который мог бы эти трудности обойти. Когда случайные переменные, относящиеся к одному
    временному отрезку, совершенно не зависят от случайных переменных, отвечающих другим периодам, задача нередко может решаться
    методом динамического программирования. Справедливость данного
    утверждения будет подтверждена нами в следующей главе.
    16.8. К В А Д Р А Т И Ч Н А Я КРИТЕРИАЛЬНАЯ ФУНКЦИЯ
    (ЛИНЕЙНЫЙ ВИД ОПТИМАЛЬНОГО РЕШЕНИЯ)

    Рассматриваемая в этом разделе многошаговая стохастическая
    модель описывает ситуацию, когда оптимальные решения можно
    построить только на основе данных относительно ожидаемых значений случайных величин. Варианты временной последовательности
    принятий решений и порядок поступления информации относительно значений, принимаемых случайными величинами, могут при этом
    выглядеть так же сложно, как и в задаче, рассмотренной в предыдущем разделе. Предположим, однако, что ограничения имеют вид

    xi+

    п

    S dijXj = bi, i = l, 2, .. ., т,

    j=m+l

    (1)

    где переменные Xj (/ = 1, 2, . . ., п) не ограничены по знаку, все
    коэффициенты atj заданы, a bt представляют собой случайные величины, для которых известны соответствующие математические ожидания. Как будет показано ниже, возможны случаи, когда в результате решения оптимизационной задачи приходят к стратегии, для
    которой Xj ^ 0 (/ = 1, 2, . . ., п); существуют также ситуации,
    когда Xj представляют собой отклонения от заданных (целевых)
    значений, так что имеют смысл и отрицательные значения xs.
    Предположим далее, что решается задача минимизации и целевая функция может быть записана в виде математического ожидания
    квадратичной формы
    П

    П

    71

    S X Cj XjX + 2 Cj*j,
    (2)
    j=i h=i h h
    j=i
    причем выражение (2) является положительно определенным и отличным от нуля при любых значениях Xj (j = 1, 2, . . ., п), кроме
    случая, когда все Xj = 0. Допустим, что cih (/ = 1, 2, . . . . п;
    k = 1, 2, . . ., ft) являются известными, а величины С] (/ = 1 , 2 , . . .
    . . ., п) могут быть случайными.
    Как и в предыдущих случаях, будем считать, что на первом
    шаге решение заключается в выборе значений тех переменных,
    которые подлежат определению до того, как становится точно известным значение хотя бы одной случайной величины. Можно доказать,
    что оптимальные значения переменных первого шага определяются
    так же, как и в случае детерминистической модели, а именно в соответствии со следующей схемой:

    70

    ГЛАВА 16

    1. Заменим в (1) и (2) Cj и £>; математическими ожиданиями этих
    величин, вычисленными с помощью соответствующих безусловных
    распределений вероятностей.
    2. Подставим xl (i = 1, 2, . . ., т), найденные с помощью (1),
    в выражение (2).
    3. Соберем члены с одинаковыми переменными Xj (j = те + 1, . . .
    . . .. re).
    4. Приравняем нулю частные производные квадратичной формы
    по Xj для / = т + 1, . . ., тг.
    5. Разрешим уравнения, полученные в результате выполнения
    п. 4, относительно Xj, где / = т + 1, . . ., п.
    6. Определим с помощью (1) xi для i = 1, 2, . . ., т.
    В результате выполнения этих операций мы обнаруживаем одну
    важную особенность рассматриваемой модели, состоящую в том, что
    оптимальные значения переменных первого шага линейно зависят
    от Е [cj] и Е [ b i \ . Поэтому эту модель иногда называют моделью
    линейных решений. После того как значения переменных первого
    шага установлены в соответствии с изложенной выше схемой, наступает период выжидания, которое продолжается до того момента,
    когда станут известными фактические значения других случайных
    величин; затем данная процедура повторяется. При этом происходит
    «переименование» переменных второго шага, которые теперь логично называть переменными «первого шага», и т. д. Кроме того, может
    возникнуть необходимость в уточнениях (или в вычислении заново)
    математических ожиданий с,- и bit если полученная дополнительная
    информация указывает на такого рода необходимость. Проиллюстрируем данный метод на следующем гипотетическом примере.
    Задача регулирования численности обслуживающего персонала.
    Директору ресторана «Сальная ложка» необходимо определить число
    официанток, требуемое для обслуживания посетителей в часы пик
    каждый i-й день в течение периода продолжительностью Т дней
    (т. е. £ = 1 , 2 , . . ., Т). Ежедневное изменение числа официанток
    обходится ресторану дорого по целому ряду причин (в частности,
    здесь действует психологический фактор и то обстоятельство, что
    опытные официантки являются весьма дефицитными). Не выгодно
    также иметь слишком много или слишком мало официанток, поскольку в первом случае возрастают затраты, связанные с выплатой официанткам заработной платы, а во втором случае возникают потери
    за счет ухода части посетителей, не желающих дожидаться обслуживания слишком долго. Вместе с тем точно определить число
    требуемых официанток невозможно, так как ежедневно флуктуирует как число посетителей, так и объем трудозатрат на их обслуживание.
    Обозначим через Dt объем трудозатрат (в человеко-часах) на
    обслуживание будущих посетителей столовой в часы пик t-то дня.
    Пусть yt означает объем трудозатрат (в человеко-часах) на обслуживание в t-ж день, на который ориентируется директор ресторана

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    71

    при составлении календарного плана. Обозначим через ft разницу
    между трудозатратами в t-й день и трудозатратами в (t — 1)-й день
    (т. е. флуктуацию объема трудозатрат), а через et — ошибку, допущенную при планировании трудозатрат для £-го дня; упомянутые
    выше величины удовлетворяют соотношениям
    ft = 2/t-i — yt,

    t = 1,2, . . ., Т

    (флуктуация трудозатрат),

    (3)

    £t — Vt — DI,

    t = 1,2, . . ., Т

    (ошибка, допущенная при планировании),
    (4)

    где уо — объем трудозатрат накануне 1-го дня. В рассматриваемом
    примере переменные ft и et играют ту же роль, что и переменные xt
    (i = 1, 2, . . ., т), а переменные yt — ту же, что и переменные Xj
    (j = т + 1, . . ., п), фигурирующие в (1).
    Пусть задача заключается в том, чтобы минимизировать ожидаемое значение квадратичной формы

    S (/? + <**)

    t=i

    (5)

    при ограничениях (3) и (4), где с ^ 0 — заданное число. Заметим,
    что если с = 0, то оптимальным является решение yt = y0 для всех
    значений t. Если с является произвольно большим, то оптимальное
    решение имеет вид yt = Е [ D t ] . На первом шаге определению подлежит значение у^.
    Выполняя пп. 1 и 2 указанной выше последовательности, заменим в (4) Dt на Е [Dt] и подставим в выражение (5) ft и et, определяемые соотношениями (3) и (4). В результате будем иметь
    т
    C = ^{(yt-i-y (6)
    После приведения подобных членов положим дС/дуг = О (t =
    = 1, 2, . . ., Т), в результате чего получим Т линейных уравнений с Т неизвестными:
    (2 + с)У1-у2 = сЕ [Я,] + уо,
    (7)
    -2/1-1 +(2 + c)yt- yt+i = сЕ [ D t ] ,
    -Ут-i - (1 + с) ут = сЕ [DT].

    t = 1, 2, . . ., Т - 1, (8)

    (9)

    При заданных значениях с, Е [Dt] и г/0 система уравнений (7) — (9)
    решается однозначно. Получаемое в результате значение yt является
    оптимальным для первого шага принятия управляющих решений
    и линейно зависит от Е [ D t ] .
    Допустим, что плановый период практически не ограничен,
    причем значение переменной у\ выбирается таким, чтобы оно было
    оптимальным при сколь угодно большой протяженности Т. Тогда
    можно показать, что, разрешив систему (7) — (9) относительно i/i

    72

    ГЛАВА 16

    при Т —>• оо , получим
    оо

    = а(Уо + ^[А]) + Ца'^[А] (неограниченный период
    ^2
    планирования),
    (10)
    где предполагается, что сумма, стоящая в правой части, имеет
    конечное значение. В выражении (10)
    У1

    (И)

    и, следовательно, 0 < а ^ 1 при О =SC с < оо, a z/4 ^ 0. Еще раз
    обратим внимание на то, что z/4 есть линейная функция Е [ D t ] ,
    что непосредственно видно из (10). После получения сведений о фактическом значении Dt директор ресторана может пересмотреть свои
    прогнозы относительно последующих значений Dt, так что на следующий день вычисления по формуле (10), возможно, придется
    выполнить заново, заменив Е LDj] на математическое ожидание
    потребностей в трудозатратах для второго дня (найденное с учетом
    полной информации о D^ и т. д.). Однако в том случае, когда
    Е [Dt] = D* для всех t независимо от того, какими были фактические значения Dt в предыдущие дни (т. е. если распределение вероятностей ожидаемых трудозатрат окажется стационарным), то значения yt для всех последующих дней определяются формулой
    acD*
    _a —

    yt = ayt-i i
    t--,

    =a

    , acD* I I — a1'1 \

    J/0 + -T3;— ( —iT2 — I

    1

    ,

    -

    (стационарные потребности
    в обслуживании)

    ,,„,

    (12)

    для О ^С с •< °°, и г/г ->-£>* при t -> оо.
    КОНТРОЛЬНЫЕ УПРАЖНЕНИЯ

    1. Объясните содержание каждой из перечисленных ниже задач
    организационного управления и сформулируйте вашу точку зрения
    относительно причин появления в них неопределенности и ее роли
    в процессе принятия решений. Попытайтесь также выяснить, можно
    ли раскрыть характер неопределенности и уточнить порождаемые
    ею следствия с помощью анализа чувствительности детерминистских
    аналогов соответствующих стохастических моделей. Рассмотрите
    следующие задачи организационного управления:
    а) выбор мест строительства новых товарных складов, обслуживающих розничную торговую сеть;
    б) прекращение производства определенного вида продукции;
    в) начало выпуска нового вида продукции;
    г) определение числа лифтов для проектируемого административного помещения фирмы;
    д) определение маршрутов доставки корреспонденции для почтальонов;

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    73

    е) определение числа резервных операционных, которое необходимо иметь в клинике;
    ж) определение периодичности пополнения запасов бензина на
    бензозаправочных станциях;
    з) оптимизация банковского баланса фирмы;
    и) определение числа бригад, занимающихся ремонтом телефонных аппаратов;
    к) выбор емкости водохранилища при строительстве плотины;
    л) определение количества пассажирских мест в сверхзвуковом
    лайнере.
    2. В каждом из приведенных ниже случаев требуется вычислить
    математическое ожидание случайной величины D, математическое
    ожидание D 2 , математическое

    ожидание

    / (D) = (— 1)д

    и Е [/ (D \ у)] по формуле (8), приведенной в разд. 16.2, положив
    с = 1, h = 2, р = 5 и у = О, 1, . . ., 6:

    а) P[D = d]=4-

    для d = 0, 1, . . . , 6;

    б) P[D = d]=~

    для d = l, 2, . . . , 6 ;

    в) P(D = d] = ±-

    для d = 0, 1, . . - , 5;

    г) P[D = d}=

    для d = 0, 2, 4, 6;

    ц) P[D = d} = ~-

    д л я й = 1 , 3, 5;

    е) ^[£> = d] = d- 1 .0,5 d - 1 .0,5 3 -* fl для d = l, 2, 3, 4.
    ж)Р[£> = й] = СГ2.0,5'г-2.0,53-<г+2 для d = 2, 3, 4, 5;
    з) P[D = 2/] = CJ.O,5 8 -;
    3

    и) ^[0 = 2/] = ^ . к) P[£ = 2/] = C

    3
    3

    для d = 0, I, 2, 3;

    .

    для d = 0, 1, 2, 3;

    . . -

    для d = 0, 1, 2, 3.

    3. Для каждого указанного ниже вида / (D \ у) требуется
    вывести формулу, аналогичную формуле (8) из разд. 16.2:
    а)

    I су ~г~ it (у — cL) ,
    cyz -4- р (d—г/)2,

    f(D\y) =

    если
    если d^>y;

    с(у)-{-Н — v (у — d),

    если d^.y,

    с(у)-}-Р,

    если d>y,

    где

    с (у) —

    О

    при у = О,
    при г/>0;

    74

    ГЛАВА 16

    в) / (D \ у) = с (у) -| h (у — d)-+-p(y, d),
    О
    при у = 0,
    ? + су при г/>0,
    А! (г/ — d), если 0<г/ — d^I,
    h(y — d)={ H^-h2(y — d), если y — d>l,
    О
    во всех остальных

    случаях;

    если
    р,
    0

    если d-y>S,
    во всех остальных случаях.

    4. Задача фирмы «Бонбон» (разд. 16.2).
    а) Предположим, что годовая прибыль за счет увеличения производственных мощностей действующего предприятия в случае, когда
    фирма контролирует 30% рынка сбыта, равняется (90 + е), где
    е >• 0. Каково наибольшее значение е, при котором решение строить
    новый завод все еще является оптимальным? Аналогичным образом
    проанализируйте модель на чувствительность в тех случаях, когда
    фирма будет контролировать 35 и 40% рынка сбыта.
    б) Предположим, что годовая прибыль за счет строительства
    нового завода в случае, когда фирма контролирует 30% рынка
    сбыта, равняется (50 — е), где е > 0. Каково наибольшее значение е, при котором решение строить новый завод все еще является
    оптимальным? Аналогичным образом проанализируйте модель на
    чувствительность в тех случаях, когда фирма будет контролировать
    35 и 40% рынка сбыта.
    в) Обозначьте через pi и pz вероятности того, что фирма «Бонбон»
    будет контролировать соответственно 30 и 35% рынка сбыта, причем
    Pi ~г Pz ~ 5 /s- Каково наибольшее значение р^, при котором решение строить новый завод все еще остается оптимальным?
    г) Обозначьте через pi, pz и р3 соответственно вероятности того,
    что фирма «Бонбон» будет контролировать 30, 35 и 40% рынка сбыта.
    Учтите, что £>з = 1 — Pi — Pz- Постройте график, позволяющий
    определить все значения PJ и р2, для которых решение строить
    новый завод является оптимальным. (Указание: Запишите неравенство между ожидаемыми прибылями, которые соответствуют первому
    и второму вариантам решений и отражают то условие, что оптимальным является решение строить новый завод; после этого производите
    необходимые упрощения. Постройте (в пространстве решений) график для Pi и pz.)
    д) Пусть предположения относительно вероятностей исходов
    являются вполне реалистичными, однако допустим, что за некоторую плату К (тыс. долл.) президент может получить точную информацию о том, какую долю рынка сбыта будет фактически контролировать его фирма. Другими словами, президент фирмы «Бонбон»

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    75

    может за соответствующую плату получить точный прогноз до
    момента принятия решения. Каково наибольшее значение К, при
    котором все еще стоит воспользоваться возможностью получения
    такого прогноза?
    5. Сформулированные ниже упражнения связаны с календарным
    планированием производства. Выполняя эти упражнения, читатель
    должен иметь в виду соотношения (10) и (11), приведенные в разд. 16.2.
    а) Пусть на начало текущего отрезка объем продукции, хранящейся на складе, равнялся 2 единицам. Объясните, почему на последующем отрезке объем выпускаемой продукции будет нулевым с вероятностью V 2 , а на следующем по порядку отрезке — нулевым
    с вероятностью V 4 . Чему равняется вероятность нулевого уровня
    производства на третьем по отношению к текущему отрезке?
    б) Предположите, что вместо (11) мы имеем Dt = 2 с вероятностью */4 и Dt = 3 с вероятностью 3 / 4 . Определите, чему в этом
    случае будут равняться вероятности нулевого уровня производства на каждом из трех следующих за текущим отрезков.
    в) Пусть вместо (11) стратегия имеет следующий вид:
    ( 5 — i для j = 0, 1, 2,
    х
    °° (^ 0 = \[ 0
    л
    для -i =о3,
    3
    причем Dt = 2 с вероятностью / 4 , a Dt — 3 с вероятностью V 4 .
    Найдите вероятности нулевого уровня производства для каждого
    из трех (следующих за текущим) отрезков, если объем продукции,
    хранящейся на складе на начало текущего отрезка, равняется 2 единицам.
    г) Предположите, что всякий раз, когда уровень производства
    отличен от нуля, имеют место накладные расходы К = 4 и что
    стоимость производства единицы продукции равняется с = 1. Кроме
    того, считайте, что за каждую единицу продукции, отправляемую
    на хранение на склад в конце того или иного отрезка, взимается
    плата в размере h = 2. Найдите ожидаемые расходы для одного
    отрезка при неограниченном плановом периоде, воспользовавшись
    данными, приведенными в соотношениях (12) и (13) из разд. 16.2.
    д) Пусть вместо (10) стратегия имеет вид
    Zoo

    (-2)

    =

    Z o o (-1)

    =

    Z o o (0) = 3,

    Zoo (1) = О,

    т. е. в некоторых случаях спрос превышает объем наличных складских запасов; считайте, что неудовлетворенный спрос не аннулируется, а присовокупляется к спросу на последующих отрезках.
    Таким образом, если запасы составляют 1 единицу, продукция не
    производится; неудовлетворенный спрос при Dt = 2 составляет
    1 единицу, а при Dt = 3 равняется 2 единицам (это отражено отрицательными уровнями запасов —1 и —2 соответственно). Требуется
    определить, какие значения примут в этом случае стационарные
    вероятности (вместо значений, заданных соотношениями (12) и (13)
    из разд. 16.2), и пояснить полученные результаты.

    76

    ГЛАВА 16

    6. Рассмотрим задачу пекарни «Пышка» (разд. 16.2).
    а) Каким будет оптимальное решение, если управляющий захочет, чтобы вероятность полного удовлетворения суточного спроса
    была не менее V^? не менее x / 2 ?
    б) Каким будет оптимальное решение, если управляющий захочет, чтобы ежедневно продавалось в среднем не менее */з торта?
    не менее 1 торта?
    7. Рассмотрим последовательность .(-ffj, R2, R3) и предположим,
    что RI при любом значении t равняется либо 0, либо 1. Пусть вероятность исхода (1, 0, 0) равна нулю, исхода (0, 1,0) — V 4 , исхода
    (О, 1,1) — 3/16, исхода (1, 1, 0) — 1 / 16 , а любого другого исхода—V 8 .
    Предположим, что а = 1 / 2 .
    а) Для данного совместного распределения вероятностей найдите
    математическое ожидание суммарной прибыли [т. е. вычислите значение RI -f- а/?2 + а2-й з Для каждого возможного исхода (Rt, R%, R3),
    умножьте каждое из полученных значений на вероятность соответствующего исхода и просуммируйте по всем возможным исходам].
    б) Вычислите Е [Rf] для t = 1, 2, 3 и сравните полученный
    результат с оценкой Е [ R t ] из разд. 16.2.
    8. Рассмотрите примеры, приведенные в упражнении 1, и в каждом случае предложите метод построения распределения вероятностей; укажите, к какому (или к каким) из методов, перечисленных
    в разд. 16.2, относится каждый из предложенных вами способов
    построения распределения вероятностей.
    9. Задача фирмы «Швец и Жнец» (разд. 16.3). Рассмотрите данные, приведенные на рис. 16.2 и в таблице на рис. 16.3.
    а) Проверьте, правильно ли вычислены вероятности, указанные
    в(1).
    б) Проверьте, что если каждая случайная величина принимает
    свое среднее значение, то продолжительность времени с момента
    начала работ до пуска нового предприятия равняется 5 отрезкам
    времени. Покажите, чему равняется средняя продолжительность
    выполнения всего комплекса работ, исходя из условий задачи, приведенных в разд. 16.3.
    в) Целесообразен ли наем специального помощника по строительству нового завода, если его участие приводит к сокращению
    продолжительности выполнения планируемого комплекса работ на
    3
    1 отрезок лишь с вероятностью / 4 ? Подкрепите ваш ответ соответствующими количественными оценками.
    г) Предположите, что услуги специального помощника с вероятностью 1 / 2 приводят к сокращению продолжительности выполнения
    комплекса запланированных работ на 2 отрезка и с такой же вероятностью могут не привести ни к какому сокращению вообще. Пусть
    дополнительная прибыль фирмы за счет сокращения сроков строительства на 2 отрезка равняется 130. Целесообразен ли наем упомянутого выше специального помощника?

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    77

    д) Считайте, что президент фирмы решает обойтись без услуг
    специального помощника, но намеревается за сумму F получить
    гарантию того, что выполнение работы В займет в точности 3 отрезка.
    Каково наибольшее значение F, при котором использование такой
    возможности остается целесообразным?
    е) Выполните упражнение д), предположив, что за сумму F можно будет гарантировать то, что работа С будет выполнена в течение
    3 отрезков времени.
    ж) Выполните упражнение д), предположив, что за сумму F
    можно будет гарантировать, что работа Е будет выполнена за 2
    отрезка.
    з) Выполните упражнение д), предположив, что за сумму F
    можно будет гарантировать выполнение работ В и С за 3 отрезка.
    и) Каковы наибольшие значения F в пп. д) — з), если президент
    принимает решение воспользоваться услугами специального помощника по строительству нового завода?
    к) Предположите, что строительство заводских корпусов может
    продлиться с одинаковой вероятностью либо 1, либо 2 отрезка времени и аналогично разработка проекта новой модели комбайна
    может продлиться 3 или 4 отрезка, комплектование штатов — 3 или
    4 отрезка, а окончательная отладка модели — 2 или 3 отрезка.
    Пусть на монтажные работы по-прежнему требуется 1 'отрезок времени. Проведите анализ с целью определения степени целесообразности найма специального помощника президента по строительству.
    При известном оптимальном решении вычислите выигрыш за счет получения точного прогноза для сроков выполнения планируемых работ.
    10. Предложите метод доказательства теоремы об эквивалентности форм, формулировка которой приведена в разд. 16.4. (Проиллюстрируйте предложенное вами доказательство на примере максимизации функции CjXj + czxz при ограничении 2ж 4 + 3_r2 ^ 6,
    предположив, кроме того, что с одинаковой вероятностью и независимым образом каждый из коэффициентов c t и с2 может принимать
    значения 0 или 1.)
    11. Задача фирмы «Супердранка» (разд. 16.4).
    а) Объясните, почему структура модели (6) — (10) настолько
    проста, что ее численное решение при заданных а^ Cj и Dt является
    тривиальным. (Проиллюстрируйте тривиальность решения системы
    уравнений (6) — (Ю), положив c t = 10, с 2 = 15, с3 = 3, Т = 10,
    а, = 3, а 2 = 5, Dl = 10, D2 = 50.)
    б) Покажите, как изменится система соотношений (13) — (21),
    если Q = 4. Приведите формулу, показывающую зависимость числа
    уравнений модели и числа фигурирующих в ней переменных от Q.
    в) Покажите, как изменится система соотношений (13) — (21),
    если на х3 наложить ограничение х3 ^ К, где К — заданное число.
    Как изменится результат, если предположить, что К — случайная
    величина? Примите также допущение, что если х3 превысит К,
    то штраф составит / 3 (К — х3).

    78

    ГЛАВА 16

    г) Покажите, как упростится система соотношений (13) — (21),
    если величины а^, az и D2 являются детерминированными (кроме
    того, предположите, что избыток продукта 2 недопустим).
    д) Объясните, как видоизменится структура (12) — (21), если
    величины г,- и uj будут взаимно коррелированными. (Дополнительно
    предположите, что Q — число возможных комбинаций значений для
    фигурирующих в модели случайных величин — равно 3.)
    е) Покажите, как изменится структура (12) — (21), если стоимость производства единицы продукции в] (/ = 1, 2) является случайной величиной. Предположите, что значения е}- могут стать
    известными лишь после принятия решения на первом шаге. (Дополнительно предположите, что Q — число возможных комбинаций
    значений для фигурирующих в модели случайных величин — равно
    3.)
    ж) Предположите, что фактические значения / t и / 2 становятся
    известными лишь после того, как будут выбраны значения управляемых переменных второго шага. Обозначьте через Е [/г | q] ожидаемое значение / г при фиксированном значении д (q = 1, 2, . . ., Q).
    Покажите, как изменится при этом выражение для целевой функции (13).
    12. Задача фирмы «Супердранка» (разд. 16.4). Предположим, что
    президент фирмы, уплатив сумму F,- может узнать заранее, какая
    из Q возможных комбинаций значений случайных величин будет
    фактически иметь место.
    а) Предложите метод определения наибольшего значения F,
    при котором все еще имеет смысл покупать такого рода точную
    прогностическую информацию.
    б) Предположите, что за сумму F приобретается точная прогностическая информация лишь относительно a t , и допустите, что а^
    статистически не зависит от других фигурирующих в задаче случайных величин (т. е. эта информация бесполезна при прогнозировании исходов для других случайных величин). Объясните, как
    изменится метод, предложенный вами, при выполнении упражнения, сформулированного в п. а).
    13. Задача фирмы «Супердранка» (разд. 16.4). В силу специфики
    данной задачи возможен другой метод построения соответствующей
    модели, приводящий лишь к одному ограничению (для имеющегося
    в наличии леса) при нелинейной целевой функции. Из соотношений (15) — (20) следует, что на втором шаге оптимизирующие решения фактически отсутствуют; при заданных aqiXi и Dqi из условия
    допустимости вытекает, что либо sg,, либо tqi являются положительно определенными. Обозначим через ut (xt \ at, /;, Dt) потерю прибыли, обусловленную выбором xt при фиксированных значениях
    а г , /j и Dt.
    а) Требуется вывести формулу для и( (xt\ а{, f i : DI) (i = 1, 2)
    (Указание: значение целевой функции зависит от того, какое из
    соотношений имеет место: atXi ^ Z), или a^j >Z) ; .)

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    79

    б) Обозначим
    через
    Ut (xi)
    математическое ожидание
    t (xi Iaii fii Df)- Требуется вывести формулу, позволяющую вычислять Ui (xt) при заданном числе Q возможных состояний.
    в) Требуется полностью записать нелинейную оптимизационную
    модель для рассматриваемой задачи.
    14. Рассмотрим двухшаговую линейную модель общего вида
    (разд. 16.4). В каждом из приведенных ниже пунктов требуется
    п пленить, каким образом учитываются принимаемые нами допущения в структуре модели, представленной соотношениями (22) — (25).
    а) Пусть значение каждой случайной величины не зависит
    от выбора значений Xj.
    б) Пусть значение Xj (/ = 1, 2, . . ., k) подлежит определению
    на первом шаге до того, как будет точно известно значение хотя
    бы одной из фигурирующих в модели случайных величин.
    в) Пусть значения управляемых переменных второго шага выбираются после того, как станут известными значения всех случайных
    величин. Является ли допущение о том, что всегда существуют
    допустимые значения переменных второго шага, эквивалентным
    предположению о существовании допустимого решения системы
    соотношений (23) — (25)? (Ответ требует обоснования.)
    г) Допустим, что существует конечное число Q комбинаций
    частных исходов. Вытекает ли из структуры соответствующей модели, что случайные величины взаимно независимы? (Ответ требует
    обоснования.) Если нет, то можно ли упростить модель, приняв
    такое допущение. (Ответ требует обоснования.)
    д) Объясните, почему в модели (22) — (25) допустимо использовать точно установленные значения с,-, bt и а,ц. Какие упрощения
    модели будут иметь место, если окажутся известными bt или а,;для i = g + 1, . . . , m? (Рассмотрите частные случаи.)
    15. а) Сформулируйте для задачи (13) — (21) из разд. 16.4 соответствующую двойственную задачу.
    б) Сформулируйте двойственную задачу для рассмотренной в разделе 16.4 задачи (22) — (25).
    16. Рассмотрим следующую двухшаговую задачу:
    u

    Максимизировать ба^ + &с2 — 12ж 3 — За;4
    при ограничениях
    " ^з — •^•'4 "=~

    >

    где Xj ^ 0, величины at, az и D являются случайными, а х3 и xt —
    переменные, значения которых конкретизируются на втором шаге.
    Предположим, что возможны лишь следующие комбинации частных
    2
    исходов: (1, 2, 4) с вероятностью V 3 и (2, 1, 10) с вероятностью / 3 .
    а) Преобразуйте данную двухшаговую модель в эквивалентную
    ей обычную модель линейного программирования и найдите оптимальное правило для принятия решения. Дайте экономическое
    истолкование полученного результата.

    80

    ГЛАВА 16

    б) Предложите альтернативную структуру модели, основанную
    на максимизации нелинейной целевой функции при наличии лишь
    следующих записанных в явном виде ограничений: х^ ^ 0, х2 ^ 0.
    (Указание: воспользуйтесь тем обстоятельством, что если заданы
    значения х\ и х2, a также известны значения а 4 , а 2 и D, то из условия
    допустимости вытекает, что либо х3 ^ 0, либо х 4 ^ 0.) Необходимо
    вывести формулу, позволяющую определить приращение математического ожидания целевой функции в результате выполнения
    второго шага, когда переменными первого шага являются xi и х2.
    в) Воспользовавшись соображениями, изложенными в конце
    разд. 16.4, вычислите Е [При ожидании], Е [При глобальном усреднении], Е [При усреднении на первом шаге], Е [При наиболее жесткой постановке задачи] и «цену» неопределенности.
    17. Задача фирмы «Супердранка» (разд. 16.5). Рассмотрите
    модель с вероятностными ограничениями (1) — (5). Пусть Е [q] = 10,
    Е [с2] = 15, с 3 = 3, Т = 10, величины DI (i — 1, 2) имеют безусловное распределение (8).
    Каким будет оптимальное решение, если
    а) р\ = Р 2 - 0,9?
    д) p t - 0,5, р 2 = 0,9?
    б) р, = р 2 = 0,95?
    е) Pi = Р 2 = 0,3?
    в) р, = р 2 = 0,5?
    ж) р\ = р 2 = О?
    г) Pi =0,9, р% = 0,5?
    18. Задача фирмы «Супердранка» (разд. 16.5). Ответьте на вопросы, поставленные в упражнении 17, приняв новое предположение относительно безусловных распределений вероятностей, а именно положив для каждого вида продукции Р [D = d] = 1/10 при
    d = 1, 2, . . ., 10.
    19. а) Пусть Cj (Uj) — выпуклая функция, где и/ принимает лишь
    целочисленные значения. Докажите, что Cj (xj) = Е [Cj (Dj — х)]
    есть выпуклая функция Xj. (Предположите, что число возможных
    значений случайной переменной DJ является конечным.)
    б) Объясните, почему целевая функция (6) из разд. 16.6 сохраняет свой вид и в том случае, когда уровни спроса DJ являются
    взаимно коррелированными.
    Упражнения 20 — 24 относятся к транспортной задаче (в общей
    постановке) и к примеру, рассмотренному в разд. 16.6.
    20. а) Убедитесь, что значения С3(х3) и С 4 (х4), приведенные
    в таблице на рис. 16.7, вычислены правильно. Проверьте также
    столбец, в котором приведены значения С3 (xs) — С3 (х3 -\- 1). Убедитесь, что каждая функция Cj (z,-), в соответствии с определением (9),
    является выпуклой.
    б) Объясните, почему Cj (0) = fjE [Dj], а также почему Cj (xj)
    асимптотически стремится к нулю при стремлении Xj к максимально
    возможному значению DJ.

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    81

    в) Найдите оптимальное решение при / 3 = 15 и / 4 = 5; проверьте полученный ответ, воспользовавшись данными, приведенными
    в таблице на рис. 16.9.
    21. Пусть вместо (11) мы имеем Р [D4 = d] — 1/5 для d =
    = О, 1, 2, 3, 4. Найдите новые значения С 4 (xt) (см. таблицу на
    рис. 16.7), составьте новую матрицу для расширенной транспортной задачи (рис. 16.8) и вычислите оптимальное решение при/ 3 = 15
    и / 4 = 5.
    22. а) Проверьте, что решение ха = 2 и а;4 = 3 является оптимальным для соответствующих значений / 3 и /4, фигурирующих
    в таблице на рис. 16.9.
    б) Проделайте то же самое для х3 = 3 и ж 4 = 2.
    23. а) Проверьте формулы (I) и (II).
    б) Получите формулы, аналогичные (I) и (II), для случая больших значений / 4 .
    24. Рассмотрите вариант модели, построенный методом вероятностных ограничений (разд. 16.6).
    а) Убедитесь, что суммарные транспортные расходы, указанные
    в таблице на рис. 16.10 для (х3 = 2, ж 4 = 3), а также для (х3 = 3,
    а:4 = 2), вычислены правильно.
    б) Объясните, почему вариант размещения (х3 = 4, ж 4 — 1)
    в случае, когда применяется метод вероятностных ограничений,
    не может быть оптимальным.
    в) Уясните, в чем состоит принципиальное различие между
    методом вероятностных ограничений и методом, основанным на использовании двухшаговой модели, применительно к транспортной
    задаче. Не считаете ли вы, что имеются основания исключить варианты размещения (х3 = 2, ж 4 = 3) и (х3 = 4, ж 4 = 1) из рассмотрения?
    Дайте обоснованный ответ.
    25. Рассмотрите пример календарного планирования производства, приведенный в разд. 16.7.
    а) Объясните, почему модель (12) — (16) описывает ситуацию,
    когда имеет место «полная информация». Дайте обоснование утверждению о том, что в модели фигурируют 72 переменные при 24 ограничениях (каждое из которых имеет форму равенства). Объясните,
    почему модель (12) — (16) можно разложить на Q автономных задач
    линейного программирования.
    б) Убедитесь, что в случае, когда вначале уточняется спрос,
    а затем принимается решение, модель после упрощения содержит
    лишь переменные, указанные в (17); подтвердите, что число управляемых переменных модели равняется 42, а число ограничений,
    имеющих форму равенств, равняется 14. Запишите в явном виде
    упрощенное выражение для целевой функции.
    в) Убедитесь, что в случае, когда вначале принимается решение,
    а затем уточняется спрос, модель после упрощения содержит только
    те переменные, которые указаны в (18); подтвердите, что число
    управляемых переменных модели равняется 42, а число ограничений

    82

    ГЛАВА 16

    (каждое из которых имеет форму равенства) — 14. Запишите в явном виде соответствующее выражение для целевой функции.
    г) Убедитесь, что в случае, когда решение принимается при
    полном отсутствии данных о спросе, после упрощения модель содержит лишь те переменные, которые указаны в (19); подтвердите, что
    число управляемых переменных модели равняется 31, а число ограничений (в виде уравнений) — 14.
    д) Предположите, что плановый период увеличивается на один
    отрезок, т. е. t = 1, 2, 3, 4. Допустим, что Z)4 формируется аналогично Dt (t = 1, 2, 3), так что суммарное число возможных состояний Q = 16. Определите число управляемых переменных и число
    уравнений для каждого из упомянутых выше четырех случаев.
    26. Рассмотрите пример календарного планирования производства, приведенный в разд. 16.7.
    а) Покажите, как видоизменится (или объясните, почему не видоизменится) каждый из упомянутых выше вариантов модели, если
    предположить, что величины Dt взаимно независимы. (Обязательно
    проконтролируйте, уменьшится ли число управляемых переменных
    и число ограничений модели в каждом из четырех упомянутых
    случаев.)
    б) Проанализируйте во всех подробностях модель линейного
    программирования, эквивалентную исходной стохастической при
    следующих допущениях: на отрезке t к моменту принятия решения
    относительно уровня производства xt известны как Dt, так и Dt+i.
    (При этом требуется определить число управляемых переменных
    и число уравнений модели, а также построить целевую функцию.)
    27. Рассмотрим пример календарного планирования производства, приведенный в разд. 16.7.
    а) Предположим, что в (7) коэффициент удельной прибыли ct
    представляет собой случайную величину и что значение ct становится известным в то же самое время, когда становится известным Dt.
    Допустим также, что число возможных состояний (Di, Dz, D3;
    c
    C
    ii 2> c3) равняется Q = 8, а спрос Dt формируется в соответствии
    с данными таблицы на рис. 16.11. Объясните, как изменится структура модели в каждом из упомянутых выше четырех случаев.
    б) Предположим, что неудовлетворенный спрос отрезка 1 присовокупляется к спросу на отрезке 2, а неудовлетворенный спрос
    отрезка 2 присовокупляется к спросу на отрезке 3. Пусть удельный
    штраф (т. е. потери в расчете на единицу продукции) в случае,
    когда в конце отрезка t часть спроса оказывается неудовлетворенной,
    равняется dt. Любая часть спроса, оставшаяся неудовлетворенной
    на конец отрезка 3, аннулируется. Все прочие условия задачи
    сохраняются. Объясните, какие изменения претерпит структура
    модели в каждом из упомянутых четырех случаев. (Обязательным
    является определение числа управляемых переменных и числа уравнений модели, а также построение соответствующей целевой функции.)

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    83

    28. Рассмотрим задачу регулирования численности обслуживающего персонала из разд. 16.8.
    а) Докажите, что принятие условия dCldyt = 0, t = 1, 2, . . ., Т,
    для (6) приводит к уравнениям (7) — (9).
    б) Докажите, что при 0 ^ с ^ ею имеет место 0 ^ а ^ 1, где
    а определяется уравнением (11).
    в) Докажите, что в (12) yt —>~D* при устремлении t к бесконечности.
    29. Рассмотрим задачу регулирования численности обслуживающего персонала (разд. 16.8). Пусть у0 = 0, а с — 1/2. Определите
    оптимальное значение г/ 4 , предположив, что
    а) Т = 4, Е [Dt] = 16 при любом значении t.
    б) Т = 4, Е [Dt] = ^t при t = 1, 2, 3, 4.
    в) Т = 4, Е [Dt] = 20 - 4г при * = 1, 2, 3, 4.
    г) Г = 4, £ [Я,] = £ [D3] = 4, а £ [£2] = £ Ш 4 ] = 16.
    д) Т = 4, Е [Dt] = £ [D3] = 16, а Е [D2] = Е Ш J = 4.
    е) Плановый период не ограничен, а Е [Dt] = £>* = 16 при
    любом значении t. Определите также yt для t = 2, 3, 4.
    30. Выполните упражнение 29, предположив, что
    а) с = 1/2.
    б) с = 9/4.
    31. Объясните, как вы понимаете следующие термины:
    математическое ожидание (ожидаемое значение,
    среднее значение);
    рандомизированная стратегия;
    двухшаговая линейная модель;
    теорема об эквивалентности форм;
    модель упреждения;
    модель выжидания;
    модель глобального усреднения;
    модель усреднения на первом шаге;
    модель с вероятностными ограничениями;
    эквивалентное детерминированное ограничение;
    многошаговая линейная модель;
    квадратичная целевая функция.
    У П Р А Ж Н Е Н И Я НА ПОСТРОЕНИЕ МОДЕЛЕЙ
    И РАЗВИТИЕ ВЫЧИСЛИТЕЛЬНЫХ НАВЫКОВ

    32. Задача фирмы «Швец и Жнец» (разд. 16.3). Пусть на рис. 16.2
    дуга между узлами 1 и 2 имеет противоположное направление.
    Проведите анализ сформулированной в разд. 16.3 задачи поиска
    оптимального решения, предположив, что дополнительная прибыль
    равняется нулю, если продолжительность выполнения планируемого
    комплекса работ превышает 6 отрезков. (Обязательно укажите оптимальное решение и вычислите по формуле, приведенной в конце
    разд. 16.3, выигрыш за счет обладания точным прогнозом.)

    84

    ГЛАВА 16

    33. Календарное планирование методом критического пути. Рассмотрите пример, приведенный в разд. 6.6 [модель (1) — (6)]. Считайте, что продолжительности выполнения некоторых операций являются неопределенными (рис. 16.3). Пусть требуется определить сроки
    начала операций yCD, yE и ур так, чтобы каждое из неравенств (2) —
    (6) выполнялось по крайней мере с вероятностью 1/2 (например,
    требуется, чтобы Р [yF ^ tc + yCD] ^ 0,5). Сроки начала операций
    должны быть определены до того, как станут точно известными
    продолжительности выполнения операций, являющихся случайными.
    Раскройте содержание вероятностных ограничений.
    а) Постройте детерминированную модель линейного программирования, эквивалентную только что описанной стохастической
    модели.
    б) Найдите для данной модели (как в исходной, так и в двойственной формулировке) оптимальное решение. Покажите, как изменяется решение, если потребовать, чтобы каждое из условий (2) —
    (6) удовлетворялось с вероятностью 0,25; с вероятностью 0,75.
    34. Задача «двух картошек» (разд. 1.6). Как правило, количество
    продукции, получаемое из единицы веса (например, из 1 т) сельскохозяйственного сырья, подвержено случайным колебаниям. Предположите, что из 1 т картофеля поставщика 1 можно с одинаковой
    вероятностью получить продукты 1, 2 и 3 в следующих количествах
    (также выраженных в тоннах): либо (0,2; 0,2; 0,3). т. е. в количестве,
    указанном в таблице на рис. 1.1, либо (0,25; 0,25; 0,35), либо (0,18;
    0,15; 0,29). Предположите также, что соответствующие показатели
    для картофеля поставщика 2 оказываются следующими: либо (0,3;
    0,1; 0,3), т. е. в количестве, указанном в таблице на рис. 1.1, либо
    (0,35; 0,1; 0,25), причем первая возможность реализуется с вероятностью 2 / 3 , а вторая — с вероятностью V 3 . Пусть продукт 1, оказавшийся в избытке по отношению к уровню спроса, можно продать
    оптовому покупателю и получить при этом удельную относительную прибыль F; аналогично, удельная относительная прибыль в случае реализации по оптовым ценам продукта 2 составляет Н, а продукта 3 —L.
    а) Постройте двухшаговую линейную модель, позволяющую
    выбрать объемы закупок картофеля у поставщиков 1 и 2 таким образом, чтобы ожидаелгая прибыль была максимальной.
    б) Дайте математическую формулировку соответствующей двойственной задачи.
    35. Задачи фирмы «Мультиконвейер» (разд. 2.2).
    а) Предположим, что удельная прибыль для каждого из вариантов выбираемого технологического процесса равняется выручке от
    продажи единицы продукции за вычетом себестоимости единицы
    продукции. Пусть себестоимость является случайной величиной.
    Предположим, что удельные значения выручки для процессов 1 и 2
    равняются 15, а для процессов 3 и 4 равняются 20. Пусть значения
    себестоимостей определяются следующим образом:
    >
    • :

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    85

    для технологического процесса 1

    себестоимость единицы продукции равняется 8 + с\
    для технологического процесса 2 себестоимость единицы продукции равняется 8 + 2с, где
    Р[с = 01=1/3, Яс= 11=2/3;
    для технологического процесса 3 себестоимость единицы продукции равняется 6 + d;
    для технологического процесса 4 себестоимость единицы продукции
    равняется б + 3d. где
    p[d = Q] = 1/6, P[d = i] =
    = 1/2, Р [d = 2] = 1/3.
    Постройте модель, позволяющую определить объемы производства так, чтобы ожидаемая прибыль была максимальной.
    б) Предположим, что имеющаяся в наличии рабочая сила представляет собой случайную величину W, причем
    Р [W = 10] = 1/8, Р [W = 12] = 1/2, Р [W = 15] = 3/8.
    Допустим, что если, согласно календарному графику производства,
    требуемые трудозатраты (в человеко-неделях) превышают имеющиеся
    возможности, то в графике предусматриваются сверхурочные работы,
    оплачиваемые по ставке с за человеко-неделю. (Объемы производства
    устанавливаются в начале недели, а сверхурочные часы добавляются в конце недели.) Построим модель, позволяющую определить
    объемы производства так, чтобы ожидаемая прибыль была максимальной.
    в) Пусть сохраняются условия упражнения в п. б), однако
    предположим, что фирмой разрабатывается календарный план,
    который должен быть выполнен с вероятностью не менее 0,8 при
    имеющейся в наличии рабочей силе. (Стоимость трудозатрат в сверхурочное время в явном виде не учитывается.) Постройте соответствующую линейную оптимизационную модель. Покажите, как
    изменится структура модели, если потребовать выполнение разрабатываемого календарного плана с вероятностью 0,9.
    36. Задача свинофермы «Суперрацион» (разд. 2.3). Прочитав
    научно-исследовательский отчет, только что опубликованный Министерством сельского хозяйства, управляющий пришел к выводу,
    что минимальная суммарная потребность г в компоненте В равняется либо 225 с вероятностью V 5 , либо 250 с вероятностью 3 / 1 0 - либо
    300 с вероятностью 1 / 2 . Постройте соответствующую линейную оптимизационную модель, которая гарантировала бы обеспечение по
    крайней мере минимальных потребностей свинофермы в компоненте В
    с вероятностью не менее 0,25 (не менее 0,5; не менее 0,75).
    37. Задача фирмы «Электрон» (разд. 6.4). Предположим, что
    фирма «Электрон» не уверена, что компоненты ее субподрядчиков
    смогут удовлетворять ее техническим требованиям. Обозначим
    через ри полученную фирмой оценку вероятности того, что каждый
    i-й электронный компонент, изготовленный /-м подрядчиком, будет

    86

    ГЛАВА 16

    удовлетворять ее техусловиям, а через К; — убытки, которые потерпит фирма за счет каждой единицы i-ro компонента, не отвечающей
    этим условиям. Требуется построить модель, минимизирующую суммарные затраты на выполнение заказа. Является ли построенная
    вами модель стандартной (обычной) моделью для задачи о назначении?
    38. Модель выбора кратчайшего пути (разд. 6.5). Рассмотрим
    пример, представленный на рис. 6.8. Предположим, что стоимости
    переезда от одного узла к другому являются случайными величинами, а переезд вдоль каждой дуги занимает один период. Пусть в течение каждого из трех первых периодов стоимость переезда из узла i
    в узел j равняется либо c t j с вероятностью p t j , либо dtj с вероятностью 1 — PIJ. После третьего периода стоимость переезда из узла i
    в узел ; равняется либо etj с вероятностью q^, либо /^ с вероятностью 1 — qi]. Допустим, что стоимость переезда вдоль той или
    иной дуги в каждый из периодов не зависит от стоимости переезда
    вдоль этой дуги в другие периоды. (Так, например, одна из возможных последовательностей для стоимости переезда из узла 3
    в узел 4 за семь периодов выглядит следующим образом: с 34 > ^34,
    С
    з4> /34' /34' «341 /34-) Полный маршрут подлежит определению до того,
    как станут известными фактические значения c,-j, причем задача
    заключается в минимизации ожидаемых затрат, связанных с переездом из узла 8 (источник) в узел 1 (сток). Покажите, каким образом
    можно отобразить данную стохастическую модель на эквивалентную
    ей детерминированную модель для задачи выбора кратчайшего пути.
    (Нарисуйте сеть и проставьте стоимости переезда вдоль дуг.)
    39. Рассмотрим модель линейного программирования, содержащую ограничение

    где «и — случайная величина, имеющая распределение вероятностей Р [а,ц = а] =0,1 для а = 1, 2, . . ., 10.
    а) Покажите, каким образом можно перейти от данного вероятностного ограничения к обычному линейному неравенству.
    б) Выполните упражнение, сформулированное в п. а), положив
    '0,75 для а = 1, 2, . . ., 10,
    0,8
    для а = 1, 2, . . ., 10,
    = а\ -<
    а = 6, 7, . . ., 15,
    ,1
    для а = — 4, — 3, . . ., 5.
    40. Задача фирмы «Гигант» (разд. 2.6). Пусть Т = 3, а также
    предположим, что St (t = 1, 2, 3) есть случайная величина, причем
    P[St = iQ]=±,
    />[£, = 15] = -|.

    Р[5 2 = 20]=у,
    П32 = 25]=4-,

    P[Sa = lQ] = ^,
    P[5,= 18]=-g-.

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    87

    а случайные исходы St являются полностью независимыми. Предположим, что часть неудовлетворенного на отрезке t спроса аннулируется и фирма терпит убыток в размере rt (в расчете на единицу
    продукции).
    а) Предположите, что имеет место случай, когда в начале планового периода фирма располагает полной прогностической информацией (разд. 16.7). Постройте соответствующую линейную модель
    и укажите суммарное число фигурирующих в ней управляемых
    переменных и уравнений.
    б) Проанализируйте, как изменится структура только что построенной вами модели, если точные значения St и предыдущие уровни спроса к моменту определения объемов производства на отрезке t
    оказываются известными (см. в разд. 16.7 случай, когда вначале
    уточняется спрос, а затем принимается решение).
    в) Проанализируйте, как изменится структура модели, удовлетворяющая условиям п. а), если к моменту определения объемов
    производства на отрезке t становятся известными лишь значения
    предыдущих уровней спроса (см. в разд. 16.7 случай, когда вначале
    принимается решение, а затем уточняется спрос).
    г) Проанализируйте, как изменится структура модели, удовлетворяющая условиям п. а), если решение принимается при полном
    отсутствии точной информации относительно уровней спроса (см.
    аналогичный случай в разд. 16.7).
    ДОПОЛНИТЕЛЬНЫЕ УПРАЖНЕНИЯ

    41. Лемма Неймана — Пирсона. Рассмотрим случайную величину V, которая может принимать значения 1, 2, . . ., п. Пусть
    с помощью единственного выборочного наблюдения требуется определить, какое из двух возможных распределений вероятностей
    отвечает V. Обозначим одно из возможных распределений (включающее вероятности р3 > 0) через Р, а другое (включающее вероятности 0) через Q. Объясните, почему всегда можно заиндексировать наблюдаемые значения 1, 2, . . ., п таким образом, чтобы
    Pi ^ Pz <--

    ^- Рп

    31 "" 92 ~~~ " ' ^ Чп

    (т. е. чтобы при у = 1 отношение Pj/qj имело наименьшее значение,
    а при у = п — наибольшее). Пусть выборка приводит к наблюдению V с индексом ;'. Обозначим через X] вероятность того, что распределение вероятностей отождествляется с Р (тогда 1 — Xj есть
    вероятность того, что распределение вероятностей отождествляется с Q).
    а) Постройте модель линейного программирования, позволяющую
    максимизировать вероятность отождествления распределения вероятностей с Р, когда действительно имеет место Р, при ограничении,
    отражающем требование, чтобы вероятность отождествления рас-

    ГЛАВА 16

    пределения с Р, когда на самом деле имеет место Q, не превышала р*
    (О < р <С 1). Постройте также модель для соответствующей двойственной задачи.
    б) Покажите, что оптимальное решение данной задачи имеет
    следующий вид: Xj = 0 для / ^ / и Xj = 1 для / > /, где / —
    некоторое критическое значение /.
    42. Рассмотрим пример транспортной сети, приведенный в
    разд. 16.6. Предположим, что St также являются случайными величинами и их значения до момента выбора значений xi} точно не
    известны. Пусть Р [Si = 5] — вероятность того, что S, принимает
    значение S. (Значения, устанавливаемые для x t j , следует рассматривать как обязательства осуществить доставку соответствующих
    объемов продукции из i-ro пункта отправления в ;'-й пункт назначения.) Если хц + х',2 -f-. . . -\-Xim превышает фактическое значение Si, то продукция в объеме, равном разности указанных величин,
    подлежит доставке с помощью других средств по стоимости С\
    за единицу продукции. Подробно обсудите вопрос о внесении изменений в структуру модели, рассмотренной в разд. 16.6. и отображении видоизмененной задачи на эквивалентную ей детерминированную транспортную задачу «расширенного» типа.
    43. Календарное планирование трудовых ресурсов. Рассмотрим
    задачу фирмы «Дик О'Браз», приведенную в разд. 6.7. Предположим,
    что количество бригад R^, требуемое в период k, есть случайная
    величина. В частности, допустим, что Р [Rh = R] = ph (R), где
    R = 1, 2, . . ., 10, причем величины Rh взаимно независимы.
    Требуется построить линейную оптимизационную модель, эквивалентную стохастической модели, для каждого из указанных в пп. а)
    и б) предположений относительно порядка поступления информации о Rh. (Требуется дать точное определение каждого из используемых понятий и соответствующих символических обозначений,
    а также указать число управляемых переменных и число уравнений,
    входящих в структуру модели.)
    а) Рассмотрите случай, когда R^ становится известным в начале
    отрезка k до того, как принимается решение относительно значений
    x

    h. h+li • • •' xhn-

    б) Рассмотрите случай, когда Rh становится известным в начале
    отрезка k — 1 до принятия решения относительно xh_llh, . . ., xh_it n
    в
    (т. е. в начале отрезка 1 известны RI и Д 2 - начале отрезка 2 известны RZ и Rs и т. д.).
    44. а) Рассмотрим нелинейную оптимизационную задачу, решение которой может быть получено с помощью алгоритма, аналогичного алгоритму, описанному в гл. 14 и 15. Предположим, что по самому существу постановки задачи возникает необходимость построения двухшаговой модели (разд. 16.4). Можно ли метод, изложенный в разд. 16.4, обобщить на случай нелинейных моделей? Можно
    ли построить расширенную нелинейную модель, эквивалентную
    исходной стохастической, решение для которой удалось бы найти

    ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    §9

    с помощью алгоритма решения детерминированных нелинейных
    задач оптимизации (гл. 14 и 15)?
    б) Ответьте на вопросы, сформулированные в п. а), рассмотрев
    случай многошаговой стохастической модели (разд. 16.7).
    в) Ответьте на вопросы, сформулированные в п. а), рассмотрев
    случаи двухшаговой (а также многошаговой) стохастической модели
    целочисленного программирования и учтя материал, изложенный
    в соответствующих разделах гл. 13 и 16.

    ГЛАВА 17

    Вероятностные модели динамического
    программирования

    17.1. ВВЕДЕНИЕ

    В предыдущей главе мы проанализировали влияние неопределенности на процесс формирования оптимального управляющего решения,
    или выработки оптимальной стратегии поведения. Особое внимание
    при этом уделялось вопросам структуризации модели, содержащей
    случайные величины, в частности разбору различных последовательностей из актов принятия управляющих решений при различных предположениях относительно порядка поступления сведений, характеризующих фактические или прогнозируемые исходы.
    Наш анализ относился главным образом к задачам линейного программирования. Было показано, что линейные модели стохастического характера можно свести к детерминированным линейным
    моделям большей размерности; при этом увеличение размерности
    в реальных задачах настолько значительно, что нахождение оптимального решения подчас оказывается практически невозможным.
    В данной главе мы попытаемся, хотя частично, преодолеть эту
    трудность. Каждая из приведенных ниже моделей представляет
    собой типичную модель вероятностного динамического программирования. С помощью рассматриваемых здесь примеров мы убедимся,
    что метод решения стохастических задач динамического программирования оказывается лишь в незначительной степени сложнее
    метода нахождения решений для соответствующих динамических
    оптимизационных моделей детерминированного характера.
    Мы рассматриваем здесь лишь модели с ограниченным плановым
    периодом или с конечным числом оптимизирующих шагов (исключение составляет лишь разд. 17.7). Задачи оптимизации при неограниченном плановом периоде анализируются в гл. 18. В данной главе
    главное внимание сосредоточено на методе учета вероятностных
    элементов в структуре многошаговой модели. Мы предполагаем,
    что читатель уже знаком с приемами построения детерминированных моделей динамического программирования, и рекомендуем ему
    уделить хотя бы несколько минут гл. 8 и 10, с тем чтобы освежить
    в памяти основные понятия, используемые в теории динамического
    программирования. (Необходимо, в частности, вспомнить, что понимается под переменными состояния и переменными /-го шага, и убедиться в правильности понимания возникающих в динамических
    моделях рекуррентных соотношений и вычислительных процедур,
    связанных с поиском численных решений рекуррентных уравнений.)
    При изложении принципов вероятностного динамического программирования мы используем подход, уже применявшийся нами

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    91

    в гл. 8 и 10, т. е. объясняем эти принципы с помощью ряда наиболее
    характерных примеров. Начиная с относительно простых, мы постепенно переходим к более сложным моделям, причем некоторые из них
    представляют собой стохастические обобщения детерминистических
    моделей, уже рассматривавшихся в гл. 8 и 10. В этой главе мы
    не останавливаемся подробно на способах получения численных
    решений для приведенных ниже моделей, так как при решении
    практических задач вычислительные процедуры оказываются настолько трудоемкими, что для их реализации приходится прибегать к помощи ЭВМ и использовать машинные программы, разрабатываемые
    специалистами по программированию ЭВМ. Не углубляясь в вычислительный аспект проблемы, мы пытаемся сосредоточить внимание
    на процедурах построения моделей и на методах анализа, учитывающих стохастический характер величин, фигурирующих в этих моделях.
    Для того чтобы анализ роли неопределенности в задачах динамического программирования был более целенаправленным, при
    изучении излагаемого ниже материала читатель должен постараться
    дать исчерпывающий ответ на следующие вопросы:
    1. Какова оптимальная стратегия, вытекающая из детерминистского варианта каждой из рассматриваемых моделей?
    2. Какой объем информации относительно распределения вероятностей фигурирующих в той или иной модели случайных величин
    требуется для построения оптимального решения?
    3. В какой степени алгоритм решения стохастической задачи
    динамического программирования отличается от алгоритма решения
    для соответствующего детерминистического аналога рассматриваемой задачи?
    17.2.

    ЗАДАЧА РАСПРЕДЕЛЕНИЯ УСИЛИЙ

    Рассмотрим вначале пример, в котором влияние вероятностных
    элементов на процедуры вывода и применения рекуррентных соотношений динамического программирования оказывается почти тривиальным. Приведенная ниже задача представляет собой стохастический аналог так называемой задачи распределения усилий, сформулированной в гл. 10. Чтобы избавить читателя от необходимости
    обращаться к разд. 10.2, в котором эта задача обсуждается в детерминистском варианте, мы сформулируем ее здесь повторно.
    Владелец фирмы «Свежие продукты» должен распределить имеющийся у него недельный запас яиц в количестве N штук по s магазинам, принадлежащих данной фирме. Из опыта известно, что если
    направить у, яиц в магазин j, то будет обеспечена прибыль в размере RJ (У]). Владелец фирмы стремится найти такой вариант распределения имеющихся в наличии яиц по магазинам, для которого
    суммарная прибыль была бы максимальной.

    92

    ГЛАВА 17

    Математически задача формулируется следующим образом:
    s
    Максимизировать ^Rj(yj)
    (1)
    j=i

    при ограничениях
    s

    2 yj = N (наличный запас яиц),
    j=i
    У] = О, 1, . . .

    (2)

    при любом значении j (поставляется лишь целое
    число яиц).
    (3)

    В разд. 10.2 мы ввели следующее обозначение:
    gj (n) —прибыль при оптимальном распределении п яиц по магазинам 1, 2, . . . , / .
    (4)
    Мы видим, что задача, определяемая соотношениями (1) — (3), преобразуется в многошаговую задачу, решение которой может быть
    получено с помощью рекуррентного соотношения динамического
    программирования:
    g j ( n ) = m a x [ R j ( y j ) + g j _ i ( n — z/;-)], для jf = l, 2, ...,s,
    y
    i
    go(n) = Q для / = 0,

    (5)
    (6)

    где п = О, 1, . . ., N, а максимизация выполняется над множеством
    неотрицательных целочисленных значений у}, удовлетворяющих
    s

    условию

    j/j ^ п. Оптимальное значение

    2 Rj (yj)
    j=i

    определяется

    величиной gs (N).
    Приведенная выше формулировка задачи основывалась на предположении, что прибыль, которую можно получить за счет поставки г/j яиц магазину ;', известна заранее и определяется однозначно.
    Предположим, однако, что прибыль зависит не только от t/7-, но и от
    фактического спроса на яйца в /-м магазине, причем допустим, что
    объем спроса в /-м магазине представляет собой случайную величину, которая не зависит от i/7- (/ = 1, 2, . . ., s) и значение которой
    становится точно известным лишь после того, как выбраны значения всех управляемых переменных z/j. Введем следующие обозначения:
    r

    i № I У) — прибыль, получаемая магазином / в случае, когда фактический уровень спроса равняется и, а объем поставок
    в этот магазин составляет у яиц;
    (7)
    PJ (d) — вероятность того, что уровень спроса для магазина /
    равняется d,
    (8)

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    93

    Функцию TJ (d | у) можно записать, например, в следующем виде:
    jd

    при d
    jy

    ,
    при а>г/

    (объем поставок достаточен,
    чтобы удовлетворить спрос),
    ,
    *
    (спрос
    превышает объем
    поставок).

    (9)

    В данном случае г,- представляет собой прибыль, получаемую
    J-M магазином за счет каждого проданного яйца. Когда объем поставок у достаточен для того, чтобы полностью удовлетворить спрос d,
    суммарная прибыль равняется Tjd. Однако в случае, когда фактический спрос превышает объем поставок, то оказываются проданными
    только у яиц, и, таким образом, суммарная прибыль равняется r^i/.
    Математическое ожидание прибыли за счет поставок в у'-й магазин у, яиц определяется формулой

    R}(Vi) = ^ r ] ( d \ y , ) p ) ( d ) ,
    d

    (Ю)

    где суммирование производится по всем возможным значениям уровня спроса (именно поэтому d стоит под знаком суммы). Если исходить
    из такого определения RJ (г/j), то решение для модели (1) — (3),
    в которой максимизируется математическое ожидание суммарной
    прибыли, будет соответствовать оптимальному варианту распределения, причем оптимальное решение по-прежнему находится с помощью соотношений (4) — (6). Таким образом, как только математические ожидания TJ (d \ у) оказываются вычисленными, процедура
    решения стохастической задачи ничем не отличается от процедуры
    определения оптимального варианта распределения для соответствующей детерминированной модели.
    17.3. ПРОБЛЕМА У Л У Ч Ш Е Н И Я КАЧЕСТВА ПРОДУКЦИИ
    И ДЕРЕВО РЕШЕНИЙ

    После прочтения предыдущего раздела читатель, по-видимому,
    вновь обрел уверенность в своем умении обращаться с рекуррентными соотношениями динамического программирования и готов
    перейти к рассмотрению более сложной задачи организационного
    управления. В гл. 16 было сформулировано следующее фундаментальное положение относительно нахождения оптимальных решений динамической задачи организационного управления при наличии
    в ней стохастических элементов: оптимизации подлежат вначале
    лишь значения управляемых переменных, выбираемые на первом
    шаге, а для последующих интервалов времени устанавливаются
    оптимальные правила принятия управляющих решений. Эти правила позволяют определить оптимальный вариант действий при
    наличии информации о фактически реализованных исходах в прошлом, т. е. до момента принятия решения.

    94

    ГЛАВА 17

    Пусть фирма «Комфорт» занимается коренным усовершенствованием выпускаемых ею установок для кондиционирования воздуха
    в бытовых помещениях. Проект продвинут настолько, что изменения
    в существующие конструкции можно было бы внести немедленно.
    Однако фирма предпочитает подождать завершения ряда дополнительных исследований и окончания испытаний, поскольку еще не
    преодолены некоторые трудности, осложняющие организацию соответствующего технологического процесса. С другой стороны, президент фирмы «Комфорт» понимает, что если задержка будет слишком
    большой, то некоторые из конкурентов непременно объявят об аналогичном усовершенствовании своих изделий, и фирма потеряет
    часть своего рынка. Таким образом, возникает проблема принятия
    компромиссного решения, учитывающего, с одной стороны, потенциальную прибыль в случае, если до начала выпуска усовершенствованного изделия будут устранены все технические дефекты проекта, и с другой — возможную потерю рынка сбыта в случае, если:
    конкурирующие фирмы опередят фирму «Комфорт» с выпуском
    усовершенствованных установок для кондиционирования воздуха.
    Попытаемся описать эту ситуацию математически. Предположим,,
    что президент фирмы стремится к тому, чтобы оптимальным образом:
    решить, в каком месяце объявить о выпуске модернизированных
    изделий. Пусть президент фирмы считает, что это объявление необходимо сделать не позднее месяца Т и что он внесет изменения
    в конструкции выпускаемых фирмой установок сразу же, как только»
    это сделает хотя бы одна из конкурирующих фирм. Введем следующие обозначения:
    rt — прибыль, получаемая фирмой «Комфорт» в случае, если
    об усовершенствованных установках будет объявлено в 2-й
    месяц, причем раньше чем это сделают конкурирующие фирмы;
    gt — прибыль, получаемая фирмой «Комфорт» в случае, если
    она (в t-ж месяц) внесет изменения в конструкцию своей:
    установки, причем сделает это одновременно с конкурирующими фирмами;
    ht — прибыль, получаемая фирмой «Комфорт» в случае, если она
    объявит об усовершенствованной установке в <-й месяц,
    причем после того, как конкурирующие фирмы уже предприняли аналогичные шаги.
    Вероятнее всего (хотя это и не так существенно) можно постулировать, что rt > gt > ht и что rt, gt и ht являются возрастающими
    функциями времени.
    Предположим, что если до t-то месяца не делалось никаких
    объявлений о выпуске моделей, то фирма «Комфорт», так же как
    и конкурирующие с ней фирмы, принимают в i-й месяц решения
    совершенно независимым образом, не располагая никакой информацией о текущих решениях своих конкурентов. В соответствии с такой
    ситуацией допустим, что президент фирмы полагает вероятность

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    95

    того, что в 2-й месяц конкурирующие фирмы объявят о выпуске
    усовершенствованных установок, равной pt при условии, что до
    этого времени пи один из конкурентов не предпринял подобных
    шагов; при этом президент фирмы считает, что рт = 1. Затем, согласно предположению, постулируется, что условные вероятности р
    не зависят от того, какой конкретной стратегии будет придерживаться фирма «Комфорт». Однако президент фирмы абсолютно убежден,
    что если его фирма внедрит усовершенствование в t-м месяце, опередив при этом своих конкурентов, то последние непременно внесут
    аналогичные изменения в модели выпускаемых ими установок для
    кондиционирования воздуха в последующий период. Поэтому он
    производит численную оценку rt с учетом прогнозируемой реакции
    конкурирующих фирм.
    Структура процесса принятия управляющего решения может
    быть описана деревом решений, представленным на рис. 17.1 (для
    случая Т = 3). С помощью букв Ф is. К, проставленных в узловых
    точках, показано, кем предпринимается действие (фирмой «Комфорт»
    или ее конкурентами). Процесс выработки решения завершается
    в 2-й месяц при условии, что либо фирма «Комфорт», либо ее конкуренты отказываются от выжидательной тактики (если же все фирмы
    придерживаются «политики отсрочки», то дерево решений продолжает ветвиться).
    Читатель должен внимательно изучить представленное на
    рис. 17.1 дерево решений, чтобы разобраться в графическом изображении многошагового процесса формирования решения. Нижние
    ветви дерева соответствуют первому шагу (или решению, которое
    президент фирмы «Комфорт» должен принять немедленно). Если
    он выражает намерение ввести усовершенствование своего изделия
    незамедлительно, процесс формирования решения прекращается.
    Если же принимается решение «выждать», то при этом в зависимости
    от исхода случайного события, характеризующего поведение конкурирующих фирм, либо сохраняется, либо теряется возможность
    выжидать на отрезке 2.
    Пусть президент хочет выработать стратегию, которая максимизировала бы ожидаемое значение прибыли. Как и для любой
    другой задачи динамического программирования, не представляет
    особого труда найти оптимальное решение в случае, когда процесс
    формирования решения продолжается вплоть до последнего периода,
    т. е. до отрезка Т. К этому моменту необходимо лишь сравнить
    ожидаемую прибыль при внедрении проектируемых усовершенствований с ожидаемой прибылью в случае дальнейшей отсрочки начала
    выпуска усовершенствованных изделий. Читатель должен объяснить,
    почему сравниваемые значения прибыли равняются соответственно
    РТ£Т и Рт^-т- Поскольку предполагается, что рт = 1 и gT > hT,
    в случае, если процесс принятия решения продолжается вплоть
    До последнего периода, более правильным является решение внедрить
    усовершенствованные модели в производство. Приведенные выше

    Обозначения: Ф-решение президента фирмы „Комфорт"
    К-решения конкурентов
    Р и с . 17.1. Дерево решений фирмы «Комфорт»
    (задача улучшения качества продукции).

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    97

    расчеты можно представить в следующем виде:
    [ Ртёт (при внедрении)
    /r = m a x <
    ,
    .
    . = grj
    (1)
    I Рт^т (если не внедрять)
    где / т есть математическое ожидание прибыли при оптимальном
    решении на отрезке Т.
    Посмотрим теперь, что происходит на отрезке £, предшествующем отрезку Т. Если президент фирмы идет в этот период на внедрение усовершенствованного изделия в производство, то ожидаемая
    прибыль будет равняться произведению gt на вероятность pt того,
    что его конкуренты также объявят о введении аналогичного новшества плюс произведение rt на вероятность (1 — pt) того, что фирма
    «Комфорт» застанет своих конкурентов врасплох. Если же президент
    примет решение не вносить изменений в существующую конструкцию
    установки для кондиционирования воздуха, то ожидаемая прибыль
    будет складываться из htpt и стоимости ожидания, или отсрочки,
    умноженной на вероятность (1 — pt) того, что конкурирующие
    фирмы также предпочтут выжидать. Какова стоимость отсрочки?
    Она просто равняется ожидаемому значению прибыли в случае
    оптимальной стратегии при условии, если процесс формирования
    решения продолжается до отрезка t + 1 включительно; обозначим
    стоимость отсрочки через ft+i- Тогда /( превосходит математическое
    ожидание прибыли в каждом из двух возможных вариантов решений
    на отрезке t. Все эти утверждения легко обобщаются с помощью
    выкладок, выполняемых рекуррентным способом для t = Т — 1, . . .
    . . ., 1, и в результате получаем
    f Ptgt + (l — pt)rt
    (при внедрении),
    (
    ~
    \ ptht + (i — pt)fM
    (если не внедрять).
    Для получения оптимального правила принятия решений на последующих отрезках и определения оптимального поведения на отрезке 1 следует выполнить вначале необходимые вычисления с помощью
    (1), а затем продолжить вычисления, используя формулу (2).
    Решение, приводящее к / 4 , является оптимальным для месяца 1.
    Если оно состоит в том, чтобы «не внедрять», и конкуренты фирмы
    «Комфорт» не пошли на объявление новых моделей, то решение,
    приводящее к / 2 , является оптимальным для отрезка 2. Аналогично
    находятся решения в последующие месяцы, причем всякий раз
    выбор варианта действий зависит от фактического поведения конкурирующих фирм. Читателю предлагается подумать о связи между
    так называемой процедурой обратной индукции, определяемой соотношениями (1) и (2), и деревом решений, изображенном на рис. 17.1.
    (В каком отношении эта процедура напоминает способ определения
    оптимального пути в ациклической сети?)
    В рассмотренной выше модели наиболее «рискованным» является
    предположение о том, что значения pt не зависят от собственной

    ГЛАВА 17

    стратегии фирмы «Комфорт». Поясним это с помощью анализа следующей ситуации. Предположим, что у фирмы «Комфорт» имеется
    единственный конкурент, у которого показатели прибыли совпадают
    с соответствующими показателями рассматриваемой фирмы. Тогда,
    если бы конкурирующая фирма могла заранее знать, что президент
    фирмы «Комфорт» планирует ввести усовершенствование в свои
    изделия на отрезке s, то она объявила бы об аналогичном усовершенствовании на отрезке s — 1 (если rs_i ;> gs). Однако, если бы
    президент фирмы «Комфорт» заподозрил в такого рода намерениях
    своего конкурента, он добился бы того, чтобы выполнялось условие
    Ps-i = 1, и соответствующим образом изменил бы свое первоначальное решение. Читатель сразу же поймет, что такой способ рассуждений может привести к некоторой последовательности пересмотров
    решений как со стороны фирмы «Комфорт», так и со стороны ее конкурента. Возникает вопрос: существуют ли стратегии поведения
    рассматриваемой фирмы и ее конкурента, которые находились
    бы во взаимном равновесии, т. е. такие стратегии, которые не подлежали бы пересмотру и изменению в тех случаях, когда одной
    из упомянутых фирм стало бы известно о решении своего конкурента?
    Более того, если бы такие стратегии действительно существовали,
    то можно ли было бы их считать в том или ином смысле оптимальными? Ответ на такого рода вопросы может дать теория игр, изложение которой читатель найдет в соответствующих учебниках
    и монографиях.
    17.4. ЭЛЕМЕНТАРНАЯ МОДЕЛЬ УПРАВЛЕНИЯ ЗАПАСАМИ

    Задача фирмы «Комфорт» является весьма простой, так как
    состояние системы на любом отрезке t зависит практически только
    от того, продолжается ли процесс формирования решения вплоть
    до t-ro отрезка, или, другими словами, от того, рекламировались
    ли усовершенствованные установки для кондиционирования воздуха
    фирмой «Комфорт» или ее конкурентом на предшествующих отрезках.
    Переменная состояния в приведенном ниже примере соответствует
    тому, что уже рассматривалось нами в ранее представленных детерминистических задачах.
    Этот пример представляет собой вероятностный аналог задачи
    планирования производства и управления запасами фирмы «Надежный поставщик» (разд. 8.4). Более широкое обсуждение моделей
    управления запасами при стохастическом характере спроса будет
    проведено в гл. 19 и приложении П. Основное внимание при этом
    будет уделено получению формы оптимальной стратегии и нахождению с помощью предлагаемого метода численных решений для
    упомянутого класса моделей.
    В детерминистическом варианте задачи фирмы «Надежный поставщик» были приняты следующие предположения относительно фигу-

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    99

    рирующих в модели данных:
    Спрос D = 3; объем производства х ^ 5;
    Уровень запасов /' на конец отрезка (являющегося частью
    планового периода) удовлетворяет условию / ^ 4.
    (1)
    Сумма затрат, связанных с производством и хранением,
    равняется С (х, /) =С (х) + hj,
    (2)
    где х и j — неотрицательные целые числа, а
    С (0) = 0 ,
    С (1) = 15, С (2) = 17,
    (
    С (3) = 19, С (4) = 21, С (5) = 23,
    '
    /i = l,
    для всех отрезков (внутри планового периода). Таким образом,
    параметры модели стационарны во времени. Переменной состояния
    системы является уровень запасов на начало отрезка планового
    периода; уровень запасов был обозначен через i (i = О, 1, . . ., 4).
    Рекуррентное соотношение динамического программирования в этом
    случае имеет следующий вид:
    / n (i) = min[C(a:)-|-(i + *-3) + / B -i(» + a:-3)] для п = 2, 3, ..., (4)
    X

    при

    / 4 (О = С (3 - О для i = О, 1, 2, 3,
    (5)
    причем в (4) i = О, 1, . . ., 4, а минимизация осуществляется над
    множеством только таких целочисленных значений переменной г,
    которые лежат в интервале 3 — i =£С х ^ min (5,7 — i).
    Предположим теперь, что уровень спроса принимает одно из
    двух независимых и равновероятных значений:

    Р[Я = 2]=|,

    Р[Д = 4] = |,

    (6)

    так что Е [D] = 3 для всех отрезков планового периода. Чтобы
    сделать анализ данной стохастической модели сравнимым с анализом соответствующей детерминированной задачи, необходимо принять ряд дополнительных допущений. Во-первых, предположим,
    что в конце планового периода складские запасы не принимаются
    во внимание и не приводят к затратам на хранение (в детерминистском случае уровень запасов в конце планового периода мы полагали равным нулю). Во-вторых, допустим, что объем производства
    Достаточен для того, чтобы запасы никогда не истощались (не принимали отрицательных значений), что приводит к следующему
    ограничению:
    Объем запасов на начало отрезка +
    + Объем произведенной продукции ^ 4.
    (7)
    Поскольку наименьшее значение для уровня спроса равняется 2,
    а уровень запасов в конце отрезка не может превышать 4 единицы,

    100

    ГЛАВА 17

    то должно удовлетворяться также следующее условие:
    Объем запасов на начало отрезка +
    + Объем произведенной продукции ^ 6.

    (8)

    Наиболее важным является то обстоятельство, что переменная,
    характеризующая состояние в данной стохастической модели, попрежнему представляет собой уровень запасов на начало отрезка.
    Чем это объясняется? Поскольку случайные величины, характеризующие уровень спроса, полностью независимы, единственным связанным с прошлым показателем для момента времени, в котором
    до конца планового периода остается п отрезков, является имеющийся в наличии объем запасов. Предполагая, что задача заключается в минимизации значения целевой функции, представляющей
    собой математическое ожидание суммарных (за плановый период)
    затрат, мы можем интерпретировать /л (г) как ожидаемые затраты
    на реализацию оптимальной стратегии при заданном значении i для
    уровня запасов на начало отрезка, когда до конца планового периода
    остается п отрезков.
    В случае когда п = 1, простые вычисления приводят к следующей формуле:
    Л (О = С (4 - i), i = О, 1, . . ., 4.
    (9)
    Читатель должен объяснить, почему из принятых нами предположений вытекает, что оптимальный объем производства х при п ~ 1
    равняется 4 —- i.
    Для больших значений п при заданном уровне запасов i ожидаемые затраты при реализации оптимальной стратегии могут быть
    определены с помощью следующей схемы рассуждений. Во-первых,
    нужно учесть затраты С (х), связанные с производством х единиц
    продукции. Во-вторых, необходимо включить в /n (i) ожидаемые
    затраты на хранение продукции (по состоянию на конец рассматриваемого отрезка, т. е. в объеме i + х — D). Наконец, следует принять в расчет затраты, которые будут иметь место в последующие
    отрезки планового периода. Эти затраты представляют собой не что
    иное, как Е [/ п _ 4 (I + х — D)], где D характеризуется распределением вероятностей, определяемым соотношениями (6). (Читатель
    должен дать последнему утверждению надлежащее обоснование.)
    Таким образом, при п = 2, 3, . . . рекуррентное соотношение динамического программирования для рассматриваемой стохастической
    модели имеет следующий вид:

    . 1t

    ,, , _ _2) + -

    1 ,^
    /n-i(» + s—4)]},

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    Уровень
    запасов на
    начало отрезка
    i

    п— 1

    re — 2

    МО

    re = 5

    re— 4

    re — 3

    Ю1

    Heorpaниченныи
    плановый
    период

    «4(0

    /4(0

    *s(0

    57,5

    5

    75,25

    5

    93

    5

    5

    52,25

    5

    70,00

    5

    87,43

    5

    32,5

    4

    50,25

    4

    68,00

    4

    85,43

    4

    3

    30,5

    3

    48,25

    3

    66,00

    3

    83,43

    3

    0

    20

    0

    37,75

    0

    54,87

    0

    72,62

    0

    *i(0

    /i(0

    X2(i)

    0

    4

    21

    4

    41

    5

    1

    3

    19

    5

    34,5

    2

    2

    17

    4

    3

    1

    15

    4

    0

    0

    /2(0

    * 3 (0

    /5(0

    *=o (0

    Р и с . 17.2. Задача фирмы «Надежный поставщик»
    (стохастический вариант модели управления запасами).

    где i = О, 1, . . ., 4, а минимизация производится над множеством
    только таких неотрицательных целочисленных значений х, которые
    лежат в интервале 4 — i ^ х ^ min (5, 6 — i).
    Заметим, что главное отличие рекуррентного соотношения (4),
    имеющего место в случае детерминистической модели, от рекуррентного соотношения (10) для стохастической задачи заключается в том,
    что в последнем случае необходимо произвести дополнительные вычисления, связанные с количественным определением
    В таблице на рис. 17.2 наряду с /n (i) приведены оптимальные
    значения для объемов производства хп (i) для п = 1, 2, . . ., 5.
    Можно доказать, что стратегия, оптимальная для п = 3, является
    оптимальной также и для всех п ^ 3.
    Сравнивая результаты, приведенные в таблице на рис. 17.2,
    с результатами, полученными в случае детерминированной ситуации
    (рис. 8.12), мы приходим к следующим выводам:
    1. При любом начальном значении объема запасов i и произвольной протяженности оставшейся части планового периода п ожидаемые затраты при оптимальной стратегии в случае стохастического
    поведения уровня спроса бу дут выше оптимальных затрат при детерминированном спросе.

    102

    ГЛАВА 17

    2. При заданном i оптимальное значение хп (i) при стохастическом спросе никогда не убывает с ростом п.
    3. Оптимальная стратегия для планового периода большой протяженности была нами получена в случае стохастического спроса при
    п = 3, тогда как в детерминированной ситуации — при п = 18.
    Эти выводы, правда, сделаны на основе количественного анализа
    модели частного вида, однако рассмотренный пример позволяет
    сделать следующее общее заключение: характеристики решения для
    детерминистического и стохастического вариантов модели могут
    коренным образом отличаться.
    17.5. ЗАДАЧА ОПРЕДЕЛЕНИЯ ОПТИМАЛЬНОГО
    РАЗМЕРА ПАРТИИ

    Фирма «Вольтекс», выпускающая магнитофоны промышленного
    назначения, покупает у другой фирмы ряд дорогостоящих деталей,
    изготовляемых по специальному заказу. Фирма «Вольтекс» не держит запасов таких деталей, так как она производит магнитофоны
    по заказам потребителей, а технические условия заказчиков не
    повторяются. Поскольку требования к качеству всех блоков и устройств, идущих на изготовление магнитофонов, являются исключительно высокими, детали упомянутого выше типа нередко выходят
    из строя от короткого замыкания в процессе предварительных технических испытаний. В таких случаях фирма «Вольтекс» может
    вернуть отказавшие детали своему поставщику при полном возмещении последним их стоимости. Чтобы не допустить экономических
    потерь и неудобств, связанных с задержками в производстве при
    ожидании замены в случае обнаружения брака, фирма «Вольтекс»
    заказывает, как правило, большую партию по сравнению с фактически требуемым количеством деталей. Если же, однако, заказанная
    партия окажется слишком большой и, таким образом, возникнут
    излишки деталей, фирма «Вольтекс» потерпит убытки. (Это может
    произойти потому, что поставщик, согласившись принять неиспользованные детали, сможет в ряде случаев продать их лишь по более
    низким ценам. Возможны также случаи, когда поставщик не захочет
    принять излишки деталей, так как они являются слишком специализированными и не имеют других потребителей.)
    Задача принятия решения фирмой «Вольтекс» заключается в определении оптимального размера заказываемой партии деталей.
    Если бы управляющий фирмой знал точно, сколько деталей окажется непригодными для использования при любом размере партии,
    задача принятия решения была бы весьма простой. Управляющий
    этого не знает, и поэтому анализ задачи становится нетривиальным.
    Введем следующие обозначения:
    с — цена одной детали, приобретаемой у данного поставщика;
    v — цена одной детали, оказавшейся в избытке (при этом
    О < v < с);

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    ЮЗ

    К — затраты, связанные с оформлением дополнительного заказа
    при возникновении такой необходимости;
    Рх 0) — вероятность того, что из партии в х деталей / деталей окажутся непригодными для использования в процессе технической проверки (при этом рх (х) < 1).
    Рассуждая о том, как будет развиваться во времени соответствующий процесс принятия решения, мы сможем определить способ
    построения (для рассматриваемой задачи) соответствующей многошаговой оптимизационной модели. Предположим, что требуемое
    число исправных (пригодных для использования) деталей равняется N, а заказ оформляется на х деталей (х ^ N). Если неисправными окажутся / деталей, причем / ^ х — N, то потребности фирмы
    будут удовлетворены, но N — х + ;' деталей останутся неиспользованными. Если же j > х — N, то неудовлетворенные потребности
    фирмы составят N — х + / деталей. (Так, например, если из 15 заказанных деталей 6 окажутся неисправными, а фирме требуется
    10 исправных деталей, то дополнительно понадобится 1 (= 10 —15 + 6)
    исправная деталь.)
    Таким образом, при / > х — N потребуется повторный заказ.
    Возникающая при этом задача принятия решения носит такой же
    характер, что и в предыдущем варианте. Разница заключается лишь
    в том, что теперь требуется меньшее число деталей (исключение
    составляет ситуация, когда все заказанные ранее детали оказываются неисправными). В любом случае для принятия решения
    необходима лишь та информация относительно предыдущей партии
    деталей, которая позволяет определить, какое количество исправных
    деталей требуется фирме дополнительно. Таким образом, соответствующей переменной, характеризующей состояние системы, является дополнительное число исправных деталей, в которых фирма испытывает потребность.
    Пусть оптимальной является такая стратегия, при которой минимизируются ожидаемые суммарные затраты на полное удовлетворение потребностей фирмы в упомянутых выше деталях. Обозначим
    через п требуемое число деталей и посмотрим, чему будут равняться
    ожидаемые затраты, если заказать х деталей. Прежде всего из полной стоимости х деталей нужно вычесть математическое ожидание
    стоимости неисправных деталей, так как они возвращаются фирмепоставщику на условиях компенсации. Если же число неисправных
    деталей окажется настолько незначительным, что потребности фирмы
    будут полностью удовлетворены и даже останутся излишки исправных деталей, следует учесть сокращение ожидаемых суммарных
    затрат на величину стоимости неизрасходованных деталей. Если
    же число неисправных деталей окажется слишком большим и поэтому придется делать дополнительный заказ, в выражение для суммарных ожидаемых затрат необходимо добавить величину затрат
    при повторном заказе К, умноженную на вероятность возникновения потребности в повторном заказе; аналогично учитываются ожи-

    104

    ГЛАВА 17

    даемые затраты при повторном возникновении потребностей в исправных деталях.
    Таким образом, обозначив через / (п) минимальные ожидаемые
    затраты в случае, когда требуется п исправных деталей, будем
    иметь *)
    Ж—П

    X

    /(га) = тш{с[л: — ^ jpx(})}~ v 2 (x — n—i)px(j) +
    «Jsn
    x

    +

    2

    j=0

    j=0

    при ra = l, 2, 3, .... (1)

    [K + f(n-x + j ) ] p x ( j ) }

    j=3C-Tl+l

    Определяющее / (п) значение х (п) есть оптимальный размер партии.
    Последовательность х (п) для п = 1, 2, 3, . . . представляет собой
    оптимальное правило для принятия управляющего решения. (Читатель должен объяснить, как это предписание используется на практике.)
    Если требуется N деталей, то последовательно вычисляются / (п)
    для п = 1, 2, . . ., N. Заметим, однако, что соотношение (1) необходимо слегка преобразовать, поскольку / (п) (при / = х) появляется также и в правой части упомянутого соотношения. [Читатель
    должен объяснить, почему вероятностный характер задачи приводит
    к тому, что / (п) фигурирует в обеих частях соотношения (1).] После
    некоторых упрощений соотношение (1) приводится к виду, удобному
    для получения численного решения. С помощью ряда несложных
    алгебраических преобразований получаем следующее выражение:
    X

    1

    — рх(х)Г

    \с[х—^\ j p x ( i ) ] —
    }—0

    *
    j—O

    j=x— n+1

    г=зс— n-fl

    в котором исключен член, соответствующий п = 1 .
    Пример с конкретными числовыми показателями. Покажем, как
    используется соотношение (2), положив
    с = Ю, v = О
    (3)
    и приняв для описания рх (/) биномиальный закон распределения

    Р'О'Н-щЙТ)!^-^1"'' / = 0 , 1 , . . . , * ,

    (4)

    где р есть вероятность обнаружения одной неисправной детали.
    Тогда оптимальные размеры партии х (п) в случае, когда требуется п
    деталей, р = 1/4, р = 1/2, р = 3/4, а К = 50 и К — 1000 задаются
    таблицей на рис. 17.3. При увеличении значений п, р я К значение
    х (п), естественно, возрастает. Дополнительная информация отноЧитателю предлагается проверить правильность соотношения (1).

    К

    50

    1000

    п

    *(я)

    P = V4

    P = Vs

    / И f ( n ) — cn х(п)

    /(») i ( n ) — cn х(п)

    /(») f ( n ) — cn

    3

    24,3

    14,3

    8

    27,8

    17,8

    9,3

    Р = 3/4

    1

    2

    19,3

    2

    3

    33,5

    13,5

    6

    38,3

    18,3

    13

    42,7

    22,7

    3

    5

    44,9

    14,9

    8

    51,3

    21,3

    17

    56,1

    26,1

    5

    8

    68,3

    18,3

    12

    75,7

    25,7

    26

    80,9

    30,9

    10

    15

    123,8

    23,8

    23

    132,4

    32,4

    46

    138,8

    38,8

    1

    4

    34,0

    24,0

    7

    43,1

    33,1

    17

    50,4

    40,4

    2

    6

    49,8

    29,8

    11

    61,1

    41,1

    24

    69,5

    49,5

    3

    8

    64,4

    34,4

    13

    76,7

    46,7

    30

    86,2

    56,2

    И

    90,3

    40,3

    19

    105,1

    55,1

    41

    116,5

    66,5

    51,7

    31

    170,5

    70,5

    67

    184,5

    84,5

    ^

    10

    19

    151,7

    О б о з н а ч е н и я : К — затраты, связанные с оформлением дополнительного заказа;
    с —цена одной детали, приобретаемой у поставщика;
    у —цена одной детали, оказавшейся в избытке;
    р—вероятность обнаружения одной неисправной детали;
    п — требуемое количество деталей.
    Р и с . 17.3. Задача фирмы «Вольтекс»
    (определение оптимального размера партии).

    106

    ГЛАВА 17

    с = 10,

    1>=0,

    р = 1/2

    сительно поведения х (п) в зависимости от значений п та К при р = 1/2
    К
    приведена в таблице на рис. 17.4.
    Если размер заказанной партии
    п 50
    500 5000 50000
    равняется х, то ожидаемое количество
    деталей, пригодных для использова9
    1 3
    6
    13
    ния, равняется (1 — р) х. Следователь9
    13
    17
    2
    6
    но, при х — п/(1 — р) ожидаемое коли16
    20
    3
    8
    12
    чество исправных деталей совпадает с
    17
    5 12
    22
    27
    требуемым количеством п. В рассмат30
    36
    41
    10 23
    риваемом примере значение х (п) всегда
    превосходит х. Значения разности
    (Обозначения см. на рис. 17.3.)
    х (п) — х, т.е. своего рода гарантийной доли партии, приведены в таблиР и с . 17.4. Оптимальный размер партии х (п) (задача фир- це на рис. 17.5. Заметим, что разность
    мы «Вольтекс»).
    х (п) — х с увеличением п возрастает;
    однако отношение этой разности к х
    с ростом п убывает. (Читатель должен объяснить, почему такое
    поведение х(п) — х и (х (п)— х)1х выглядит вполне правдоподобным.)

    с = ю,

    v=Q

    l

    p =U
    К

    50

    1000

    P = V2

    Р = 3 /4

    п

    х

    1

    1,33

    0,66

    2

    1

    4

    4

    5

    6,66

    1,33

    10

    2

    20

    6

    10

    13,33

    1,66

    20

    3

    40

    6

    1

    1,33

    2,66

    2

    5

    4

    13

    5

    6,66

    4,33

    10

    9

    20

    21

    10

    13,33

    5,66

    20

    11

    40

    27

    х(п)-х

    х

    х(п) —х

    X

    х (п) — х

    Обозначения:
    остальные обозначения см. на рис. 17.3.
    Р и с . 17.5. Гарантийная часть партии при оптимальном заказе (задача фирмы «Вольтекс»).

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    Ю7

    Один из способов оценить экономические последствия неопределенности основываются на сравнении значений / (п) и сп (минимальные затраты фирмы «Вольтекс» в случае приобретения п исправных
    деталей). Разность / (п) — сп можно интерпретировать как максимум того, что готова была бы заплатить фирма «Вольтекс» за гарантию поставщика поставлять только исправные детали. Значения
    I/ (п) — сп] для рассматриваемой задачи приведены в таблице
    на рис. 17.3. Заметим, что указанная разность увеличивается с ростом п, К и р, но нетрудно убедиться, что отношение [/ (п) — сп]/п
    с ростом п убывает. (Читатель должен объяснить, почему указанное
    выше поведение / (п) — сп и [/ (п) — сп]/п можно считать вполне
    пр авдоподо бным.)
    17.6.

    З А Д А Ч А СОСТАВЛЕНИЯ КОММЕРЧЕСКОГО ПРОГНОЗА

    До сих пор рассматривались примеры, в которых фигурировала
    одномерная переменная, характеризующая состояние, а случайные
    величины были полностью независимыми. С помощью примера,
    приведенного ниже, мы проиллюстрируем метод введения в модель
    взаимно коррелированных случайных величин за счет увеличения
    размерности переменной, описывающей состояние системы.
    Рассмотрим следующую упрощенную модель реальной ситуации.
    В течение первых N недель сезона фирма «Паутинка», специализирующаяся на производстве женских свитеров, имеет возможность
    в определенной степени регулировать объем каждого вида выпускаемой ею продукции. Фирма, изготовляющая модную одежду для
    определенного сезона, как и многие другие фирмы, занятые производством продукции, спрос на которую нерегулярен, не может с полной уверенностью прогнозировать суммарный объем заказов, которые
    она получит на тот или иной вид изделия. Пока персонал фирмы,
    занятый розничной торговлей упомянутыми выше товарами, подводит итоги за прошедшие N недель, от покупателей непрерывно
    поступают новые заявки.
    Производственные затраты включают в себя не только стоимость
    рабочей силы и стоимость используемых материалов, но и расходы
    на регулирование уровня производства на предприятиях. Последние
    возникают из-за остановок при переналадке, связанной с существенным изменением мощностей поточных линий; особенно дорого обходится увеличение объема выпускаемой продукции в самом разгаре
    сезона. Если фирма «Паутинка» установит слишком высокий суммарный объем для того или иного вида изделия, то часть соответствующей продукции останется не реализованной до конца сезона
    и фирма будет вынуждена распродать излишки по сниженным ценам
    и, таким образом, потерпит убытки. Если же фирма «Паутинка»
    запланирует слишком незначительные объемы производства, она
    может упустить потенциальную возможность увеличить свой доход.
    В то же время фирма будет нести убытки, если она будет корректи-

    108

    ГЛАВА 17

    ровать календарный план выпуска продукции слишком поспешно,
    полагаясь на уточненную информацию относительно суммарного
    количества заказов, поступающих в течение каждой недели. Кроме
    того, варьировать уровень производства можно лишь в определенных
    границах, зависящих от уровня производства в предшествующий
    период, а также и от того, сколько еще недель осталось до конца
    данного сезона.
    Фирма производит свою сезонную продукцию с опережением
    на несколько месяцев до начала этого сезона. Так, например, фирма
    «Паутинка» выпускает осенние модели в начале года. Скорее всего
    фирма завершает выпуск продукции до того, как начинается розничная продажа этой продукции, и коммерческий доход определяется лишь тем суммарным количеством заказов, которое фирма может
    удовлетворить к моменту прекращения выпуска данной продукции.
    Следовательно, задача календарного планирования производства
    фирмой «Паутинка» содержит элемент существенной неопределенности. Если бы руководство фирмы могло точно знать суммарное
    количество заказов, фирма производила бы продукцию в одном
    и том же темпе в течение всего планового периода.
    Задачу составления календарного плана на каждое изделие
    можно описать с помощью оптимизационной модели. Пусть Dt есть
    общее число поступивших заказов на определенное изделие к началу
    t-& недели. Поскольку наряду с новыми заказами часть заказов
    аннулируется, не исключено, что Dt+l окажется меньшим по сравнению с Dt. Допустим, что Dt+i зависит только от Dt и не зависит
    ни от количества заказов в предыдущие периоды, ни от объемов
    производства. Введем следующие обозначения:
    pt (D | d) — условная вероятность того, что общее число поступивших заказов Di+i = Z), если Dt = d для £ = 1 , 2 , . . .
    . . . ) • » — 11,
    pN (D | d) — условная вероятность того, что общее число поступивших заказов за сезон равняется D, если DN = d.
    При оценке pt (D \ d) и pN (D \ d) фирма исходит из статистических данных относительно общего числа поступивших заказов
    за предшествующие годы. [Читатель должен подумать о том, как
    можно использовать эти данные для оценки значений pt (D \ d)
    и pN (D | d).]
    Кроме того, введем в рассмотрение следующие показатели:
    г — доход (в долларах) от одного изделия, проданного в течение сезона;
    s — доход (в долларах) от одного изделия, проданного по
    сниженной цене по окончании сезона;
    ct (X 1 х) — затраты, связанные с переходом в t-ю неделю на уровень
    выпуска X при условии, если в предыдущую неделю
    уровень выпуска равнялся х.

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    109

    Здесь предполагается, что г и s определены с учетом стоимости
    использованной рабочей силы, а также стоимости израсходованных
    материалов, причем постулируется, что s < 0. Обозначим через
    Lt (х) и Ut (х) соответственно нижний и верхний пределы переменной X, описывающей множество допустимых значений для уровня выпуска продукции в t-ю неделю при условии, если уровень
    выпуска, запланированный на (t — 1)-к> неделю, равняется х.
    Правило принятия решения в данном случае формирует стратегию, позволяющую определить текущий уровень выпуска X при
    заданных значениях х и Dt. Пусть оптимальной является стратегия,
    максимизирующая математическое ожидание дохода. Такая стратегия может быть определена путем решения рекуррентного уравнения
    it (x, d) = maximum

    (x)

    [ — ct (X \ х) -\-

    (X, D)Pl(D\Q},

    D

    t = N-i,...,l (1)

    при
    N

    fN(z,d)=

    maximum

    )

    { 2 [rD + s(X — D)] 'pN (D\ d) +
    D=0

    (D\d)-cN(X\x)},

    PN

    (2)

    где неравенство D > X под знаком суммы в (2) означает, что суммирование производится по всем возможным значениям переменной, определяющей общее число заказов, поступающих к концу
    сезона, a D под знаком суммы в (1) означает, что суммирование
    проводится по всем возможным значениям Dt+i.
    Величина /4 (X*, D*) представляет собой максимальный ожидаемый доход в предположении, что до рассматриваемого планового
    периода уровень производства равнялся X*, а к началу первой
    недели планового периода поступило D* заказов. Заметим, что в (2)
    переменная состояния двумерна: один из ее компонентов характеризует предыдущее управляющее решение, тогда как другой компонент показывает, каким оказалось фактическое значение случайной
    величины.
    Чтобы убедиться в правильности понимания соотношений (1) и (2),
    дайте определение fN (x, d) и / г (х, d). Объясните, почему в правой
    части (2) фигурирует сумма ожидаемых значений дохода при различных соотношениях между объемами выпускаемой продукции
    и заказов (с учетом затрат, связанных с изменением уровня выпуска.) Убедитесь, что в данной модели действительно используется
    коммерческий прогноз. Покажите, как изменились бы соотношения (1) и (2), если бы Dt+i зависело не только от Dt, но и от Dt_t.

    НО

    ГЛАВА 17

    17.7. СТОХАСТИЧЕСКАЯ МОДЕЛЬ! ВОССТАНОВЛЕНИЯ
    (ЗАДАЧА ЗАМЕНЫ ОБОРУДОВАНИЯ)

    В заключение приведем пример, с помощью которого попытаемся
    проанализировать задачу оптимизации управляющих решений как
    при ограниченном, так и при неограниченном плановом периоде.
    Прежде чем приступить к изучению излагаемого ниже материала,
    читатель должен внимательно просмотреть разд. 11.4, поскольку
    мы опираемся на результаты выполненного ранее анализа, не повторяя использованной схемы рассуждений.
    В разд. 11.4 рассматривалась следующая детерминистическая
    задача: всякий раз, когда наступает момент принятия решения относительно восстановления, руководитель должен выбрать один из N
    возможных вариантов, каждый из которых снабжен индексом k
    (k = 1, 2, . . ., N). Если на временном отрезке t выбор падает
    на вариант k, то очередное восстановление производится на отрезке
    t + k. Пусть
    RK — затраты при варианте k, оценка которых
    в начале периода восстановления.

    произведена
    (1)

    Тогда в задаче с ограниченным плановым периодом положим
    /п — приведенное значение затрат при оптимальной стратегии
    восстановления, в которой один из альтернативных вариантов должен быть выбран за п отрезков до конца планового
    периода.
    (2)
    При этом должно удовлетворяться следующее рекуррентное соотношение:

    /„=

    min

    k=l, 2,. . ., N

    [ahfn-h + Rk],

    /о=0, 0<а<1,

    (3)

    где п ^ N. (При п <. N минимизация осуществляется над множеством значений k = 1, 2, . . ., п.)
    В задаче с неограниченным плановым периодом соответствующее
    предельное соотношение имеет вид

    /=

    r

    min

    h=l, 2,. ... N

    [ a / + -Rft]>

    0
    (4)

    откуда получаем
    / = minimum Г

    k

    ^

    (приведенное значение).

    _

    (5)

    Если ввести в рассмотрение эквивалентный усредненный показатель
    8=

    a

    . a ^

    '

    (6)

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    Щ

    то из (5) получим
    g = minimum —~h=i,2,...,NL
    J

    для а — 1 (усредненный доход
    расчете на один отрезок планового периода)

    в

    (?)

    Замена оборудования. Важным частным случаем модели восстановления является модель замены оборудования. В детерминистическом варианте этой задачи с индексом k связана продолжительность времени, в течение которого то или иное устройство (деталь,
    прибор и т. д.) функционирует нормально, т. е. остается пригодным
    для эксплуатации. В стохастическом варианте задачи восстановления допускается, что устройство может выйти из строя (например,
    в результате поломки) еще до запланированного момента замены,
    т. е. до наступления отрезка t -\- k. Другими словами, если на отрезке t планируется замена устройств, прослуживших срок k, а устройство выходит из строя на отрезке t + / (/ < k), то этим предполагается, что замена оборудования должна состояться на отрезке
    t + / + 1. Введем следующие обозначения:
    k — отрезок времени, на котором планируется произвести
    замену оборудования;
    Pi — вероятность того, что первая поломка оборудования
    произойдет в течение /-го отрезка использования;
    Г; — стоимость эксплуатации оборудования в течение /-го
    отрезка, если это устройство останется исправным;
    (rj + si) — стоимость эксплуатации оборудования, если поломка
    произойдет в течение /-го отрезка (/ < /с, Sj > 0).
    При этом 2 PJ = 1, a TI включает первоначальную стоимость
    устройства (для простоты предположим, что вышедшее из строя
    оборудование полностью обесценивается). Величину s7- можно рассматривать как ущерб, обусловленный преждевременной поломкой
    оборудования.
    Предположим, что оптимальной является стратегия, минимизирующая математическое ожидание дисконтированных затрат. Если
    наступил отрезок восстановления и решение, связанное с планированием замены оборудования, состоит в выборе k-то варианта,
    то в состав ожидаемых дисконтированных затрат входят все перечисленные ниже компоненты. Во-первых, необходимо учесть средние
    дисконтированные затраты в очередной и во все последующие моменты восстановления в случае, если оборудование выйдет из строя
    раньше запланированного отрезка времени. Во-вторых, следует
    учесть средние дисконтированные затраты в очередной и во все
    последующие моменты восстановления в случае, если оборудование
    не выйдет из строя до запланированного периода восстановления.
    Наконец, нужно добавить ожидаемые эксплуатационные затраты
    в период между текущим и очередным моментами восстановления.
    Следовательно, в случае ограниченного планового периода в ре-

    112

    ГЛАВА 17

    зультате надлежащего обобщения соотношения (3) для п ^ N
    и 0 ^ а =£С 1 получаем
    fc-i _
    ь-1
    /„= minimum [Д! ocj'/n-jp;- + a ft /n-ft (1— S Р;) + ^й1, /o = 0, (8)
    причем теперь

    ft-i
    fe-i
    ... + a -1Гй (l — 2j Pj) + S &3~1Sjpj.

    (9)

    Здесь, как и в последующих формулах, для k = 1 знак суммирования, естественно, опускается. (Как и ранее, при п < N минимизация в (8) осуществляется над множеством значений k = 1, 2, . . .
    . . ., п.) Читатель должен убедиться, что при р, = 0 (/ = 1, 2, . . .
    . . ., TV) формула (8) принимает вид (3). Заметим также, что в (9)
    Rk зависит от а, что при используемых нами обозначениях не получило соответствующего отражения из-за упрощенной записи.
    Неограниченный плановый период. В случае планового периода
    бесконечной протяженности в соотношении (8) все индексы при /
    следует опустить. При этом стохастический аналог формулы (4)
    запишется в следующем виде:
    / = minimum (E [aj I k] f + Rk) при 0<а<1,
    (10)
    где

    h=l, 2

    h-l

    .

    N

    fe-1

    E[a,i\k]= 2 ^Pj-^v*

    ( l — 2 Pi) (среднее значение коэффи- (11)
    :i=1
    ^=1
    циента дисконтирования),
    a Rh определяется с помощью (9). По аналогии с (5) соотношение (10)
    можно переписать в виде
    /= minimum ( _ „ ka.. )
    fe=i,2,...,N
    ~~ l I J /

    при 0-<а<;1 (математическое (12)
    ожидание дисконтированного
    значения)
    Здесь / представляет собой математическое ожидание дисконтированных затрат при неограниченном плановом периоде в случае,
    когда реализуется оптимальная стратегия.
    В соотношениях (10) и (12) априорно допускается, что оптимальной является стационарная стратегия (каждый раз, когда производится закупка нового оборудования, в качестве планируемого
    отрезка замены всегда выбирается А-й). Правомерность такого предположения может быть доказана строго (фактически это вытекает
    из теоремы о стационарной стратегии, приводимой в разд. 18.3).
    Таким образом, после того как оказываются вычисленными [по формуле (11)] математические ожидания коэффициентов дисконтирования, поиск оптимального решения с помощью (12) становится не сложнее оптимизационного процесса, основанного на использовании (5).

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    ИЗ

    В случае когда а = 1, в формуле (12) необходимо перейти к эквивалентному усредненному показателю g = (1 — а) /, после чего
    упомянутое соотношение принимает вид
    g = minimum

    (13)

    h=l, 2 ..... N

    откуда, как легко убедиться, следует
    g— minimum ( „ .h.
    h=i,2,...,N
    иI

    )

    (ожидаемые затраты за один
    отрезок планового периода),

    где Rh вычисляется с помощью (9) при а = 1, а
    ь-1
    fe-i
    — S P}) (среднее значение сроков
    E\i k] — 2
    '=1
    замены оборудования).

    (14)

    (15)

    Заметим, что (15) определяет ожидаемое число отрезков использования каждого устройства (компонента оборудования) при заданном планируемом сроке замены k. Следовательно, в формуле (14)
    k

    Ph

    a

    1

    i /4

    100

    2
    3
    4
    5

    0
    i/ 4
    0
    Oa)

    2

    6 /3

    20
    20
    56

    *

    *

    20
    Oa)
    180
    a
    O )
    a
    O )

    100
    110
    125
    180
    208

    E [j | A]

    1
    3

    1 /4
    21/2

    3
    Si/2

    Лй

    E [j \ k]

    100
    62^/7

    50
    60
    593/7

    a
    ) Вариант k = 3 остается оптимальным даже в том
    случае, когда указанные показатели принимают положительные значения.

    Р и с . 17.6. Пример стохастической
    оборудования.

    модели замены

    величину g можно интерпретировать как минимальное значение
    отношения ожидаемых затрат в течение интервала времени между
    двумя последовательными моментами замены к математическому
    ожиданию длины этого интервала. Грубо говоря, g представляет
    собой минимальные ожидаемые затраты за один отрезок при неограниченном плановом периоде. При этом также можно доказать, что
    выбор стационарной стратегии в связи с поиском оптимального
    варианта является вполне обоснованным.
    Случай, когда а = 1, иллюстрируется таблицей, представленной
    на рис. 17.6. Из таблицы видно, насколько дорого обходятся опшбки
    при неправильном учете фактора неопределенности. Так, например,
    можно показать, что если бы использовался ошибочный критерий

    114

    ГЛАВА 17

    Rklk, то решение заключалось бы в выборе k = 5, а если бы в каh

    честве критерия мы взяли 2 (Г//&), то пришли бы к решению k = 4.
    3=1

    В этих случаях ожидаемые затраты за один период превышали
    бы оптимальное значение почти на 20%.
    Корректность математических выкладок, с помощью которых
    соотношения (14) и (15) получаются из (13) при а-»-1, удается
    доказать весьма простым способом. Например, можно в (13) подставить е = 1 — а, произвести разложение знаменателя по формуле
    бинома и затем устремить е к нулю. Еще проще воспользоваться
    правилом Лопиталя. [Читателю предлагается применить упомянутые
    методы для проверки соотношений (14) и (15).] Однако строгое
    доказательство того, что g можно интерпретировать как ожидаемые
    затраты в расчете на один отрезок неограниченного планового
    периода при стратегии, определяемой соотношением (14), является
    нетривиальным. Причина возникающих при этом трудностей заключается в том, что существует несколько способов определения самого
    понятия «ожидаемые затраты за один отрезок при неограниченном
    плановом периоде».
    Можно, например, определить эту величину как предел отношения ожидаемых затрат за п отрезков к п при п —>• оо. Другой
    способ заключается в том, чтобы положить определяемую величину
    равной пределу отношения ожидаемых затрат в течение Т отрезков
    восстановления к полному числу отрезков рассматриваемого планового периода при Т —>- оо. При этом возникают следующие вопросы:
    существуют ли упомянутые выше пределы и если эти пределы существуют, то совпадают ли они? Можно доказать, что ответ как на первый, так и на второй вопрос положителен (при условии если соответствующие Rh являются конечными).
    •?
    17.8. ВОПРОСЫ ПРИМЕНИМОСТИ И ВЫЧИСЛИТЕЛЬНЫЕ
    АСПЕКТЫ МЕТОДОВ ВЕРОЯТНОСТНОГО
    ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    Читатель найдет полезным еще раз просмотреть приведенные
    в разд. 10.9 и 10.10 краткие выводы относительно динамического
    программирования, поскольку эти выводы остаются в такой же степени справедливыми и в случае, когда модель содержит элементы
    стохастического характера. Кратко отметим, что наиболее важные
    приложения моделей упомянутого класса относятся к задачам специфического характера, связанных, например, с поиском оптимальной
    стратегии пополнения запасов, с минимизацией эксплуатационных затрат и стоимости замены оборудования, с определением наиболее рациональной дисциплины очереди в пунктах массового обслуживания и т. д. (В главах, следующих за гл. 18, основное внимание
    будет уделяться более глубокому анализу такого рода задач, а также

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    Ц5

    по возможности вопросам построения специальных методов их решения, основанных на использовании структурных особенностей рассматриваемых явлений.)
    В то время как для задач, решаемых с помощью линейного программирования, созданы широко распространенные универсальные
    машинные программы, для решения задач динамического программирования, вообще говоря, таких программ не существует. Это,
    однако, не является серьезным препятствием при использовании
    конкретного метода решения, так как вычислительные формулы,
    используемые в каждой конкретной модели, после некоторой модификации достаточно легко отображаются машинными программами,
    позволяющими решать задачу с помощью ЭВМ.
    С помощью более совершенных аналитических методов удается
    решать стохастические задачи динамического программирования при
    менее жестких предположениях по сравнению с теми, которые принимались нами в данной главе. Так, например, в ряде случаев
    появляется возможность анализировать задачи организационного
    управления, в которых время рассматривается как непрерывный
    параметр, а состояние системы и управляющие решения могут быть
    как дискретными, так и непрерывными. Следует отметить, что многие из такого рода моделей можно получить путем непосредственного
    обобщения моделей, рассмотренных в настоящей главе. Однако эта
    цель здесь нами не преследуется.
    В гл. 18 анализируются модели, в которых временной период
    не ограничен. Мы не стремимся здесь охватить весь широкий круг
    разнообразных специфических моделей и ведем изложение применительно к задачам сетевой структуры. Поэтому рассматриваемые
    нами методы анализа во многих отношениях напоминают методы,
    изложенные в гл. 12. Чаще всего лам придется ссылаться на теоремы
    об оптимальности стационарных стратегий, которые играют исключительно важную роль при решении задач, рассматриваемых в гл. 18.
    При анализе любой модели частного вида, содержащей предположения, идентичные тем, которые обсуждаются в этой главе, можно
    без ущерба для оптимальности ограничить поиск классом стационарных стратегий.
    В гл. 18 изложен также метод получения численных решений
    для сетевых моделей стохастического характера. Однако, как уже
    отмечалось ранее, метод в его обобщенной формулировке всегда
    можно усовершенствовать с учетом структурных особенностей каждой конкретной модели. Вопросам разработки специальных приемов
    решения оптимизационных задач посвящена гл. 19, а также ряд
    следующих за ней глав.
    КОНТРОЛЬНЫЕ У П Р А Ж Н Е Н И Я

    1. Рассмотрим модель распределения усилий (разд. 17.2). Предположим, что уровень спроса в /-м магазине характеризуется следующим распределением вероятностей: р} (d) = 1/5 для d = О, 1, . . .

    ГЛАВА 17

    , . ., 4. В каждом из приведенных ниже случаев требуется вычислить
    математическое ожидание прибыли R}- (ys — О, 1, . . ., 5), заданной формулой (10), с учетом конкретного вида функции прибыли
    г,- (d | у) [см. определение (7) в разд. 17.2]:

    a)
    б)
    в)

    10d

    при

    iOd

    при

    10d

    при d<.y,
    при

    г)

    при
    Ш-4
    Сформулируйте условия задачи, при которых функция прибыли
    будет иметь вид, указанный в пп. б) и г ) .
    (Указание: рассмотрите такую ситуацию, когда покупатель предпочитает яйца другого сорта, а также случай, когда магазином
    принимаются меры по ускорению дополнительных поставок яиц
    с целью полного удовлетворения спроса.)
    2. Выполните сформулированные выше упражнения, предположив, что распределение для уровня спроса имеет вид
    d

    = °- !. ••"4;

    а)

    М<*)=^Г.

    б)

    P i ( d } = ~,

    г)

    Р;(0) = Р;(4) = ~,

    d = 0, I, . . . , 4 ;

    РП1) = Р;(3)=~,

    рИ2)=п-

    3. Задача фирмы «Свежие продукты» (разд. 17.2). Предположим,
    что уровни спроса в s магазинах взаимно коррелировали. В частности, допустим, что могут иметь место Q различных комбинаций
    (/?!, D2, • • •. ^ s )> характеризующих уровни спроса в магазинах
    1, 2, . . ., s, а через pq обозначим вероятность того, что реализуется
    д-я комбинация. Покажите, как можно определить экономический
    jeec (цену) неопределенности. (Другими словами, сформулируйте

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    117

    способ вычисления максимальной денежной суммы, которую было'
    бы целесообразно заплатить за точный прогноз уровней спроса
    до того, как выбраны объемы поставок яиц в каждый из s магазинов.)
    4. Задача фирмы «Комфорт» (разд. 17.3). Предположим, что дерево решений на рис. 17.1 снабжено следующими показателями:
    hi = 40, gi = 50, п = 60, pi = 1/5,
    hz = 60,

    gz = 70, r 2 = 100,

    h3 = 70, ga = 80,

    P2

    = 1/2,

    Рз

    = 1.

    а) Вычислите / 3 , / 2 , /i и укажите оптимальную стратегию.
    б) Постройте распределение вероятностей для процесса принятия
    решений, завершающегося на отрезке t (t = 1, 2, 3).
    в) Объясните, почему математическое ожидание прибыли по состоянию на начало отрезка 1 отличается от соответствующего показателя по состоянию на начало отрезка 2 при условии, что процесс
    формирования решения не ограничивается первым отрезком.
    г) Каково наибольшее значение г4, при котором решение, принятое на отрезке 1, все еще является оптимальным? Аналогично требуется произвести оценки наименьших значений /г4 и г2, при которых
    решение, принятое на отрезке 1, продолжает оставаться оптимальным.
    д) Пусть процесс формирования решения не ограничивается первым
    периодом. Каково наименьшее значение г а , при котором решение,,
    принятое на отрезке 2, продолжает оставаться оптимальным? Аналогично требуется произвести оценки наибольших значений /г 2 и g3r
    при которых решение, принятое на отрезке 2, все еще является оптимальным.
    е) Каково наибольшее значение р 4 , при котором решение, принятое на отрезке 1, все еще остается оптимальным? Аналогичную
    оценку требуется произвести для р 2 ж) Пусть процесс формирования решения не ограничивается
    первым отрезком, Каково наименьшее значение р а , при котором решение, принятое на отрезке 2, продолжает оставаться оптимальным?
    з) Предположите, что pt представляют собой точные значения
    вероятностей поведения конкурирующих фирм, но президент фирмы
    «Комфорт» имеет возможность до момента принятия решения приобрести за соответствующую плату точную информацию относительно
    намерений конкурентов объявить о выпуске новой установки для
    кондиционирования воздуха. Если процесс формирования решения
    не ограничивается первым отрезком, президент фирмы «Комфорт»
    может аналогичным образом приобрести информацию о намерениях
    своих конкурентов, касающихся отрезка 2, и т. д. Насколько ценна
    такого рода информация? (Сколько стоит за нее платить?)
    5. Задача фирмы «Комфорт» (разд. 17.3). Покажите, что численное значение фигурирующей в (2) величины / 4 можно найти методом
    линейного программирования. (Запишите все ограничения для t —
    = 1, 2, . . ., Т та сформулируйте все решения; выпишите в явном

    118

    ГЛАВА 17

    виде целевую функцию.) Дайте детальное представление модели для
    случая Т = 3. Сформулируйте двойственную задачу и дайте истолкование фигурирующих в ней переменных и ограничений. (Указание:
    в качестве переменных двойственной задачи можно рассматривать
    вероятности случайных величин.)
    Упражнения 6—12 связаны непосредственно с разд. 17.4, в котором дается описание стохастической модели управления запасами.
    6. а) Дайте подробное обоснование ограничений (7) и (8).
    б) Объясните, почему оптимальный уровень производства х при
    п = 1 равняется 4 — i.
    в) Дайте подробное обоснование адекватности каждого члена
    в выражении (10), следующего за первым знаком равенства.
    г) Предположите, что функция затрат, связанных с хранением
    запасов, имеет вид h (i -4- х — D)2 при i + х > D и тождественно
    равна нулю во всех остальных случаях. Как при этом изменится
    формула (10)?
    д) Проверьте, правильно ли вычислены показатели в таблице
    на рис. 17.2 для п = 2 и п = 3.
    е) Предположите, что до конца планового периода остается три
    отрезка, а уровень запасов на начало отрезка равняется 1. Каково
    распределение вероятностей для оптимального уровня производства
    на последующем отрезке? в конце планового периода?
    7. Пусть распределение вероятностей для уровня спроса имеет
    следующий вид: P[D = '[] =1/3 и Р [.0 = 4] = 2 / 3 .
    а) Запишите для этого случая рекуррентное соотношение, аналогичное (10).
    б) Вычислите fn (О и хп (i) (т. е. показатели, аналогичные приведенным в таблице на рис. 17.2) при ге = 1, гс = 2 и я = 3.
    8. Пусть уровень спроса задан распределением P[D = d] = 1/3
    при d = 2, 3, 4.
    а) Запишите для этого случая рекуррентное соотношение, аналогичное (10).
    б) Вычислите in (0 и хп (i) (т. е. показатели, аналогичные тем,
    которые приведены в таблице на рис. 17.2) для ге = 1,га = 2 и г е = 3.
    9. Объясните, почему оптимальная стратегия формируется значительно быстрее в рамках стохастической модели (при п — 3), чем
    в рамках детерминистической модели (при п = 18).
    10. Отбросим предположение о недопустимости истощения запасов,
    т. е. снимем ограничение (7). Всякий раз, когда уровень спроса превышает сумму уровней запасов на начало отрезка и производства,
    избыточный спрос аннулируется. Вместе с тем допустим, что за счет
    каждой единицы удовлетворенного спроса фирма получает доход
    в размере г. Обозначим через р (q) вероятность того, что уровень
    спроса окажется равным д, где q — 0, 1, 2, . . . . Покажите, как при
    этом изменится рекуррентное соотношение (10). (Указание: задача
    заключается в максимизации ожидаемой прибыли.)

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    Ц9

    И. а) Предположим, что минимизируемый критерий представляет
    собой математическое ожидание дисконтированных затрат, причем
    коэффициент приведения в расчете на один отрезок равняется а
    (О ^ ос •< 1). Покажите, как изменится при этом рекуррентное соотношение (10).
    б) Предположим, что существует вероятность q (0 ^ q ^ 1) того,
    что на любом из рассматриваемых отрезков обнаруживается отсутствие спроса на всех последующих отрезках. Другими словами, q
    представляет собой вероятность ограничения планового периода
    текущим отрезком времени. Если, однако, на следующем по порядку
    отрезке спрос отличен от нуля, то q есть вероятность того, что плановый период «оборвется» на данном отрезке, и т. д. Покажите, как
    изменится при этом рекуррентное соотношение (10).
    12. Предположим, что фирма имеет возможность получить точный прогноз спроса для каждого из отрезков планового периода.
    Другими словами, допустим, что фирме удается узнать фактический
    уровень спроса до того, как принимается решение относительно объема производства х. Это значение, разумеется, меняется при переходе
    от одного отрезка к последующему в соответствии с распределением
    вероятностей (6).
    а) Постройте рекуррентное соотношение динамического программирования, с помощью которого находится оптимальная стратегия.
    (Указание: в качестве переменной, характеризующей состояние
    системы, можно взять разность между уровнем запасов в начале
    отрезка и текущим уровнем спроса.)
    б) Найдите оптимальную стратегию для п = 1, 2, 3, 4.
    в) Какова максимальная сумма, которую целесообразно заплатить за точный прогноз относительно спроса, если плановый период
    включает п отрезков (п — 1, 2, 3)? Предполагается, что уровень запасов на начало планового периода равен нулю.
    13. Задача фирмы «Вольтекс» (разд. 17.5).
    а) Дайте определение каждого члена рекуррентного соотношения (1).
    б) Дайте развернутое математическое обоснование корректности
    преобразования (1) в (2).
    в) Рассмотрите данные, приведенные в таблице на рис. 17.3.
    Предположите, что фирме требуется три детали, причем К = 50,
    а р = 1/4. Дайте подробное описание оптимальной стратегии. Чему
    равно максимальное количество деталей, которое можно заказать?
    Возможен ли неоднократный заказ в объеме, который равняется трем
    деталям?
    г) Чему равняется средний объем заказа при условиях, сформулированных в п. в)?
    д) Как изменится характер ответов на вопросы, сформулированные в п. в), если р = 1/2?
    14. Задача фирмы «Вольтекс» (разд. 17.5). Рассмотрите стратегии,
    представленные таблицей на рис. 17.3. Требуется проверить, пра-

    120

    ГЛАВА 17

    вильно ли вычислены значения х (п) и / (п) для следующих значений К, п и р:
    а) К = 50,
    я = 1, 2, 3, р = 1/4;
    б) # = 50,
    п = 1,
    р = 1/2;
    в) Я = 1000, га = 1,
    р = 1/4.
    15. Задача фирмы «Вольтекс» (разд. 17.5). Предположим, что
    цена детали, оказавшейся в избытке, v > 0. Как это отразится
    на значениях х (п) и / (п), приведенных в таблице на рис. 17.3? Подтвердите ваши интуитивные соображения относительно экономических последствий указанного выше фактора, положив v — 5, К =
    = 50, р = 1/4 и вычислив для данного случая х (п) и / (п) при п =?
    = 1, 2, 3.
    16. Задача фирмы «Вольтекс» (разд. 17.5).
    а) Рассмотрим таблицу на рис. 17.5. Исходя из здравого смысла,
    объясните, почему отношение гарантийной части партии деталей
    к х = n/(i — р) убывает с ростом п.
    б) Исходя из здравого смысла, объясните, почему отношение
    [/ (п) — спМп убывает с ростом п (численные значения выражения,
    взятого в квадратные скобки, приведены в таблице на рис. 17.3).
    17. Рассмотрим модель, оптимизирующую размер партии
    (разд. 17.5). Пусть требуется N исправных деталей. Покажите, каким
    образом находится численное значение / (N) методом линейного программирования. (Запишите все ограничения для п — 1, 2, . . ., N
    и для каждого х. Примите допущение, что в случае, когда требуется
    п деталей, х имеет верхнее предельное значение хп.) Приведите подробную запись всех элементов модели при N = 3, Х 4 = 3, Х 2 = 4,
    Х3 = 5. Сформулируйте также соответствующую двойственную задачу и интерпретируйте фигурирующие в ней переменные и ограничения. (Указание', переменные двойственной задачи можно рассматривать как вероятности, ассоциированные со случайными величинами
    исходной задачи.)
    18. Задача фирмы «Паутинка» (разд. 17.6).
    а) Поясните физический смысл каждого слагаемого в рекуррентных соотношениях (1) и (2). (В частности, объясните, почему в этих
    соотношениях фигурируют затраты, связанные с использованием
    рабочей силы и материалов, а также издержки, связанные с регулированием уровня выпуска изделий. Объясните, как учитываются
    в рассматриваемой модели убытки в случае продажи товаров по сниженным ценам, а также покажите, каким образом принимается
    во внимание возможный экономический ущерб в том случае, когда
    уровень производства оказывается слишком низким.) Дайте определение f N (х, d) и / ( (х, d).
    б) Объясните, какие факторы влияют на нижний и верхний пределы Lt (х) и Ut (х). (Поясните, почему предельные значения указанных величин, как правило, зависят от запланированного на предыдущей неделе значения х, а также от порядкового номера рассма-

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    121

    триваемой недели.) Укажите также, какие факторы влияют на нижний и верхний пределы функции затрат ct (X \ х).
    в) Покажите, к каким правилам принятия управляющих решений
    мы приходим, основываясь на рекуррентных соотношениях рассматриваемой модели. Можно ли в результате анализа модели определить,
    каким должен быть уровень выпуска в течение каждой недели планового периода? Если ответ окажется отрицательным, предложите
    метод определения недельного уровня выпуска в рамках данной
    модели.
    г) Как изменится структура (1) и (2), если Dt+i зависит как от Z>t,
    так и от Dt-i? (Всем новым обозначениям необходимо дать определение.)
    д) Предположим, что s> 0. Сказывается ли это на рекуррентном
    соотношении (1) и на выборе оптимальной стратегии? В случае положительного ответа дайте надлежащее обоснование.
    е) Многие фирмы, аналогичные фирме «Паутинка», пользуются
    методом прогноза спроса, основанным на экстраполяции статистических данных. Можно ли считать, что информация, которую содержат
    в себе распределения вероятностей pN (D \ d) и pt (D \ d), и есть
    прогноз спроса? Дайте необходимые объяснения. Почему считают,
    что pt (D | d) и pN (D | d) должны зависеть как от общего количества
    заказов, поступивших к i-й недели, так и от порядкового номера №
    Упражнения 19—25 относятся к стохастической задаче замены
    оборудования, приведенной в разд. 17.7.
    19. Рассмотрим задачу с ограниченным плановым периодом.
    а) Объясните происхождение каждого члена в рекуррентном соотношении (8).
    б) Выведите формулу (9) для Rk. (Начните с рассмотрения концептуальной схемы, базирующейся на предположении, что используемое оборудование может выйти из строя в любой интервал времени i = 1, 2, . . ., k либо сохранится в исправном состоянии в течение всего запланированного периода восстановления.)
    20. Рассмотрим задачу с ограниченным плановым периодом.
    Пусть продолжительность периода равняется 6, а ./V = 3. Покажите,
    каким образом /8 может быть также определено методом линейного
    программирования. Сформулируйте двойственную задачу и интерпретируйте фигурирующие в ней переменные и ограничения.
    21. Рассмотрим задачу с ограниченным плановым периодом.
    а) Выполните алгебраические действия, с помощью которых можно было бы убедиться, что если в (8) опустить индексы при /, то
    в
    результате получим соотношение (10).
    б) Почему в выражение (11) входит математическое ожидание
    коэффициента дисконтирования^ Раскройте содержание данной
    формулы. Ответьте на аналогичные вопросы, обратившись к выражению (15).

    122

    ГЛАВА 17

    в) Покажите, что соотношения (14) и (15) получаются из (13)
    в результате предельного перехода а —>- 1.
    22. а) Проверьте, правильно ли вычислены значения показателей,
    фигурирующих в таблице на рис. 17.6.
    б) Объясните, почему стратегия k = 3 остается оптимальной даже
    в том случае, когда элементы, обозначенные через 0 а, принимают
    положительные значения.
    23. Рассмотрим пример, представленный таблицей на рис. 17.6
    при а = 1. Пусть плановый период ограничен, причем N = 5.
    а) Используя рекуррентное соотношение (8), найдите оптимальную стратегию для « = 1 , 2 , . . ., 6.
    б) Проделайте то же самое, положив а = 1/2.
    24. а) Предположим, что имеется вероятность q (О ^ д ^ 1) того,
    что необходимости в замене оборудования более не возникнет (так
    как оно более не понадобится). Покажите, какой вид примет модель
    в случае ограниченного и в случае неограниченного плановых
    периодов.
    б) Пусть потребность в оборудовании наблюдается на каждом
    отрезке t. Предположим, что имеется вероятность q (О ^ q ^ 1) того,
    что на любом последующем отрезке это оборудование не потребуется.
    Покажите, какой вид примет модель в случае ограниченного и в случае неограниченного плановых периодов.
    25. Пусть при закупке нового оборудования считается установленным, что вероятность его поломки в течение /-го отрезка по-прежнему равняется PJ, однако точно известно, на каком именно отрезке
    произойдет поломка. Таким образом, можно принять решение об
    исключении замены данного оборудования в течение срока, равного
    от 1 до ] отрезков.
    а) Постройте рекуррентное соотношение динамического программирования для задач с ограниченным плановым периодом.
    б) Постройте рекуррентное соотношение динамического программирования для задачи с неограниченным плановым периодом и обсудите метод нахождения оптимальной стратегии. (Пусть коэффициент
    дисконтирования удовлетворяет условию 0 ^ а < 1.)
    в) Примените рекуррентное соотношение, полученное в п. а) для
    анализа задачи, представленной таблицей на рис. 17.6, положив
    а, = 1. Л" = 5. Найдите оптимальную стратегию для п = 1, 2, . . .
    . . . . 6.
    г) Выполните упражнение в), положив а = 1/2.
    26. Объясните, как вы понимаете следующие термины:
    правила принятия управляющих решений;
    дерево решений;
    обратная индукция;
    характеристика решения;
    гарантийная доля партии (в задаче определения
    оптимального объема партии).

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    123

    УПРАЖНЕНИЯ НА ПОСТРОЕНИЕ МОДЕЛЕЙ
    И РАЗВИТИЕ ВЫЧИСЛИТЕЛЬНЫХ НАВЫКОВ

    В приведенных ниже упражнениях требуется построить модели
    в виде рекуррентных соотношений динамического программирования.
    Все используемые обозначения подлежат исчерпывающему определению. Требуется также привести необходимое выражение оптимизационной функции на этапе, когда до конца планового периода остается один отрезок (шаг). Объясните, с чего начинаются вычисления
    и когда они заканчиваются.
    27. Фирма «Редкие самоцветы» составляет годовой финансовый
    план на работы, связанные с геологическим поиском месторождений
    редких минералов. Для поиска фирма располагает N районами, где
    вероятно обнаружение месторождений этих минералов. По оценке
    президента фирмы (он же является главным геологом) при затратах
    в dj долл. на поисковые работы в районе / вероятность обнаружения
    там ценных минералов равняется PJ (dj). При этом в случае успешного
    завершения поиска суммарная стоимость месторождения (т. е. доход,
    который можно получить в результате его эксплуатации) равняется
    Vj, причем V] — случайная величина, характеризуемая распределением вероятностей q} (Vj). Постройте модель динамического программирования для определения финансового плана на геологические
    работы, связанные с поиском редких минералов; при этом исходите
    из того, что суммарные затраты не должны превышать D долл., а максимизации подлежит среднее значение суммарного дохода, получаемого за счет эксплуатации обнаруженных месторождений.
    28. Задача фирмы «Вечный двигатель» (разд. 10.3). В первоначальной формулировке задачи требовалось максимизировать чистый
    доход за счет организации радиорекламы выпускаемых фирмой автомобилей. Пусть теперь преследуется другая цель, а именно предположим, что фирма стремится в основном к тому, чтобы реклама дошла
    до покупателя определенного типа. По оценкам фирмы дневные передачи рекламы, проводимой радиостанцией ;', достигают внимания
    покупателей желаемого типа с вероятностью p j , причем величина PJ
    считается независимой от суммарного количества рекламных объявлений, передаваемых рассматриваемой станцией. Напомним, что
    Kj (yj) есть число рекламных объявлений, включаемых в программу
    передач радиостанцией/ при ассигновании на это У] долл. Аналогично
    обозначим через q) вероятность того, что реклама дойдет до покупателей рассматриваемого типа в утреннее время, а через Я/ (г/;-) —
    число рекламных объявлений, передаваемых радиостанцией / в утренние часы, при ассигновании на это z/j долл. Определите оптимальный
    размер ассигнований, при которых минимизируется вероятность
    того, что покупатель рассматриваемого типа не услышит ни одной
    передачи радиорекламы данной фирмы.

    124

    ГЛАВА 17

    а) Постройте для данной задачи математическую модель и покажите, как с помощью метода динамического программирования
    (по аналогии с методом, изложенным ъ разд. 10.3) можно найти оптимальное решение.
    б) Покажите, как изменится модель, построенная в п. а), если
    задача заключается в максимизации математического ожидания
    числа передач радиорекламы, достигающих внимания данного покупателя.
    29. Одна японская фирма выпускает портативные телевизоры.
    Ею разрабатывается дорогостоящая модель телевизора, причем
    фирма стремится достичь максимума надежности. Телевизор содержит N последовательно соединенных блоков, так что отказ любого
    блока приводит к неисправной работе всего телевизора. Поэтому
    в конструкцию модели введены избыточные элементы параллельного
    типа. Обозначим, в частности, через хп число избыточных параллельных элементов в /г-м блоке, через рп (х) — вероятность того, что
    n-й блок будет исправно функционировать в течение первого года
    использования телевизора при заданном уровне избыточности х,
    а через сп (х) — стоимость изготовления указанного блока.
    а) Постройте оптимизационную модель,
    максимизирующую
    надежность функционирования телевизора в течение одного года при
    условии, что суммарные затраты на его изготовление не могут превышать С.
    б) Покажите, как находится решение для построенной вами модели
    с помощью метода динамического программирования.
    в) Воспользуйтесь предложенным вами методом для нахождения
    2
    оптимального решения при N = 3, положив сп (х) = пх , С = 15,
    а рп (х} = i — /?*, где pi = 0,08, р2 = 0,05, р3 = 0,1.
    г) Постройте оптимизационную модель, минимизирующую затраты на изготовление телевизора при условии, что надежность функционирования телевизора в течение первого года его использования
    была бы не менее JR. Покажите, как можно найти решение для
    построенной вами модели, если воспользоваться методом динамического программирования.
    30. Командир космического корабля и его экипаж планируют
    полет на одну из наиболее удаленных планет с целью выполнения
    определенной программы космических исследований. Они должны
    взять с собой N различных типов электронных приборов, которые,
    увы, даже в наш век небывалого технического прогресса могут
    прийти в неисправное состояние. Каждая единица оборудования i
    весит ivt кг, суммарный же вес ограничен и не должен превышать
    W кг. Значение W является достаточно большим и позволяет взять
    на борт космического корабля некоторое (естественно, ограниченное)
    количество запасного оборудования, которым можно было бы воспользоваться в случае возникновения тех или иных неисправностей
    основного комплекта оборудования. Обозначим через pt (t) распределение вероятностей для числа интервалов времени t, в течение

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    125

    которых единица оборудования i нормально функционирует (после
    чего она выходит из строя и подлежит замене). Пусть xt — число
    запасных единиц оборудования i, находящихся на борту космического корабля. Как только запас какого-либо типа оборудования полностью истощится (т. е. когда для какого-либо типа оборудования i
    Xi примут нулевое значение), космический корабль должен будет
    вернуться на Землю.
    а) Предложите модель динамического программирования, позволяющую определить такие значения xt, при которых максимизируется математическое ожидание времени пребывания космического
    корабля на упомянутой выше планете. (Примечание: в процессе
    выполнения программы космических исследований непрерывно функционируют все N типов оборудования.)
    б) Предложите модель динамического программирования, позволяющую определить такие значения xt, при которых максимизируется вероятность того, что космические исследования на планете
    будут проводиться по крайней мере в течение Т интервалов.
    в) Объясните, как видоизменятся модели, построенные в соответствии с условиями пп. а) и б), если единица оборудования i стоит ct,
    а суммарные затраты на оборудование ограничены и не могут превышать С.
    31. Студенту ./V предстоит выполнить домашнее задание по исследованию операций. Из прошлого опыта студенту N известно, что
    если он работает слишком долго, то он «выдыхается». Поэтому студент N приходит к заключению, что целесообразно решать задачу
    в несколько заходов. Обозначим через pq (t) вероятность того, что
    задача будет решена при затратах времени в количестве t часов при
    задача окажется нерешенной.
    а) Постройте модель динамического программирования, позволяющую определить оптимальную стратегию, предположив, что суммарное время, отведенное студентом N на решение задачи, не должно
    превышать Т часов. (Примечание: студент может, например, предпринять Т попыток по 1 часу каждая. Кроме того, на g-й попытке у него не может остаться более Т — q -\- 1 часов на последующие
    попытки, поскольку каждая попытка должна длиться не менее 1 часа.)
    б) Покажите, как упростится модель, если pq (t) не зависит
    от порядкового номера попытки д, т. е. если вероятность найти решение задачи при каждой попытке зависит только от продолжительности попытки t и не зависит от того, сколько попыток предпринималось ранее.
    в) Покажите, в какой степени усложнится модель, если вероятность того, что q-я попытка окажется успешной (т. е. приведет к решению задачи), зависит также от суммарного количества времени
    в часах, затраченного ранее на решение задачи.
    32. Профессор Франк Н. Штейн пользуется дурной славой из-за
    изобретенного им сурового метода приема экзаменов. По окончании

    126

    ГЛАВА 17

    семестра он представляет студентам возможность сдать ему экзамен,
    который он строит довольно коварно. Он задает экзаменующемуся
    серию вопросов, сложность которых последовательно возрастает.
    Если студент правильно отвечает на вопрос k (k = 1. 2, . . ., k), то
    он получает право выбора: либо продолжить экзамен, попытавшись
    ответить на следующий (более трудный) вопрос, либо «закончить»
    экзамен, получив при этом оценку Gh (Gh •< Gfe+1). Если студент
    оказывается не в состоянии ответить на вопрос k, профессор Штейн
    объявляет ему, что он провалился. Представьте себе, что вы студент, которому предстоит сдавать экзамен профессору Штейну, и что
    по вашей оценке вероятность вашего правильного ответа на вопрос k
    равняется р^.
    а) Постройте модель динамического программирования, из которой вытекало бы правило, позволяющее определить, на каком этапе
    следует добровольно остановить экзамен (если к этому времени вас
    еще не потопили); при этом вы должны стремиться максимизировать
    среднее значение получаемой вами оценки.
    б) Покажите, как изменится только что построенная вами модель,
    если профессор Штейн проявит некоторое великодушие и выгонит вас
    с экзамена лишь при повторном ошибочном ответе.
    33. Фирма «Скороход» располагает парком малогабаритных грузовых автомобилей, которые совершают рейсы в ряд населенных
    пунктов и доставляют продукты непосредственно покупателям. Предположим, что имеется / видов продуктов и единица веса продукта
    i (i = 1, 2, . . ., /) занимает в грузовике объем с, м3. Используемый
    для грузов объем в одном грузовике равняется С м3. Рассмотрим маршрут одного из грузовиков и допустим, что спрос qi на продукт i описывается непрерывным однородным распределением с функцией плотности
    » = •{

    I О

    в остальных случаях.
    Обозначим через xt число единиц веса продукта i, погруженного
    в рассматриваемый грузовик. Поскольку продукты продаются по одинаковым ценам, задача фирмы заключается в минимизации математического ожидания неудовлетворенного спроса за один рейс.
    а) Сформулируйте задачу определения оптимального варианта
    загрузки. Объясните, как эта задача может быть решена с помощью
    динамического программирования.
    б) Обсудите другие возможные подходы к решению этой задачи,
    опираясь на тот факт, что модель содержит нелинейную целевую
    функцию специального вида при единственном линейном ограничении на неотрицательные переменные.
    в) Используйте метод, предложенный вами в п. б), для решения
    задачи, содержащей следующие показатели:
    Т~А
    —1
    ——
    ——
    — !£
    гС у = ^ Ок., \1О,
    к. 74
    i
    Ъ — ^vj,
    90
    С/1

    h —
    —?4
    t/2
    ^^-ч

    е

    Ъ —
    !

    — 2^^i

    h — ^'
    97 •
    ^4

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    127

    34. Страховой агент одной страховой фирмы собирается сделать
    в течение недели Т телефонных звонков в вечернее время, чтобы
    дозвониться до п потенциальных клиентов. По его оценкам потенциальный клиент / может приобрести страховой полис стоимостью
    Vj. Для простоты предположим, что агент планирует Xj телефонных
    звонков потенциальному клиенту /; при этом суммарное количество
    звонков не должно превышать Т. Если агент дозванивается до /
    в результате х^ звонков, где х° < Xj, то он тем не менее не пересматривает количество запланированных вначале звонков другим возможным клиентам. Пусть р;- есть вероятность того, что в результате одного звонка возможному клиенту / агент дозванивается до этого лица;
    допустим, что эта вероятность не зависит от предыдущих, оказавшихся безрезультатными звонков. Агент хочет определить Xj так,
    чтобы минимизировать математическое ожидание суммарной стоимости страховых полисов (в соответствии с его оценками v) тех возможных клиентов, которым он не смог дозвониться в течение недели.
    а) Постройте для данной задачи оптимизационную модель. Покажите. как данная задача может быть решена с помощью методов
    динамического программирования.
    б) Покажите, как будет выглядеть модель, если агент вместо
    того, чтобы определить значения всех Xj в начале недели, принимает
    решения поэтапно (в зависимости от того, до каких потенциальных
    клиентов ему не удается дозвониться). Приведет ли такая модель
    к улучшению результата, полученного в п. а)? Ответ необходимо
    пояснить.
    35. Рассмотрим детерминистическую модель управления запасами, представленную соотношениями (1) — (3) в разд. 17.4. Предположим, что функция производственных затрат имеет стохастическую структуру, а именно
    О
    при х = 0,
    С v(х} =
    '
    13-f сх при
    причем Р [с = 1] = Р 1с = 3] = ^ •
    а) Пусть объем производства х требуется определять на каждом
    отрезке планового периода до того, как станет известным с. Постройте для данной задачи рекуррентные соотношения динамического
    программирования и покажите, чем они отличаются от соотношений (4) и (5) из разд. 17.4.
    б) Пусть объем производства х подлежит определению после того,
    как станет известным с. Постройте для этого случая рекуррентные
    соотношения динамического программирования.
    в) Определите оптимальные стратегии при условиях, сформулированных в п. б), для п = 1, 2, . . ., 5.
    36. Рассмотрим стохастическую модель управления запасами,
    заданную рекуррентным соотношением (10) из разд. 17.4. Предположим. что в случае, когда в конце некоторого отрезка планового

    128

    ГЛАВА 17

    периода уровень запасов оказывается ненулевым, имеется вероятность р = 1/5 того, что одна единица запасов окажется непригодной
    к употреблению.
    а) Покажите, как при этом изменится рекуррентное соотношение (10).
    б) Найдите оптимальную стратегию для п = 1, 2, 3.
    37. Рассмотрим стохастическую модель управления запасами,
    описание которой приведено в разд. 17.4. Пусть для каждого отрезка планового периода установлен «целевой» уровень производства х,
    а отклонение фактического уровня производства от х сопряжено
    с издержками сглаживания в размере v- [ х — х (, где х — некоторая
    заранее известная постоянная.
    а) Покажите, какие изменения следует внести в рекуррентное
    соотношение (10), чтобы учесть издержки сглаживания.
    б) Пусть v = 1, а х = 3. Найдите оптимальное решение для
    п — 1, 2, . . ., 5.
    38. Рассмотрим элементарную модель управления запасами,
    характеризуемую стохастическими уровнями спроса (см. пример,
    приведенный в разд. 17.4). Предположим, что уровень спроса на отрезке t влияет на уровень спроса на отрезке t + 1, а именно допустим, что

    а) Запишите рекуррентное соотношение динамического программирования, аналогичное (10).
    б) Найдите оптимальную стратегию для п = 1, 2, . . ., 5 и сравните полученные результаты с результатами, приведенными в таблице на рис. 17.2. Положите D0 = 2.
    в) Выполните упражнение, сформулированное в п. б), предположив, что

    - .

    Сравните полученные результаты с результатами п. б).
    г) Каким будет средний спрос за отрезок, если в п. б) плановый
    период считать неограниченным? Ответьте на этот вопрос для случая. описанного в п. в).
    39. Замена оборудования при неопределенной стоимости. Рассмотрим задачу фирмы «Таксолюкс», описание которой дано
    в разд. 6.5. Предположим, что плата за единицу нового транспортного оборудования, взятого в аренду в начале года i и замененного
    в начале года /', является величиной случайной. Для конкретности

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    129

    рассмотрим случайную переменную г, заданную в г-й год распределением вероятностей р; (г), и предположим, что арендная плата
    в интервале от i-то до ;'-го года, в начале которого производится
    замена транспортного оборудования, описывается заданной функцией
    Cjj (r). Допустим, кроме того, что в момент замены в i-й год значение
    г известно до принятия решения относительно следующей замены
    в ;-м году.
    а) Постройте с учетом сформулированных выше условий модель
    динамического программирования.
    б) Предположим, что распределение вероятностей рг (г) зависит
    от значения г в (i — 1)-й год; обозначим это распределение вероятностей через PI (г \ г г _ 4 ), причем будем считать, что значение г0 (т. е.
    для i = 1) является известным. Покажите, как изменится при этом
    модель, построенная в результате выполнения п. а).
    40. Модель выбора кратчайшего пути (разд. 6.5). Рассмотрим
    пример, представленный данными на рис. 6.8. Предположим, что
    стоимостные характеристики *) дуг представляют собой случайные
    величины, а переезд вдоль любой из дуг занимает один отрезок времени (т. е. одну условную единицу времени). Пусть в течение t-то
    отрезка стоимость перемещения вдоль дуги равняется сг1 (где ctj =
    = О, 1, 2, . . .) с вероятностью Pu.t (cij). Допустим, что при любом
    значении t величины с^ являются полностью не зависимыми от всех
    прочих случайных элементов. Предположим, что информацию относительно фактических значений с^ можно получить только по прибытии в узел i. Задача заключается в выборе маршрута из узла 8
    (источник) в узел 1 (сток), минимизирующего математическое ожидание суммарных затрат. (Примечание: не пытайтесь выбирать весь
    маршрут целиком в начале планового периода; на каждом отрезке
    планового периода дуга выбирается в зависимости от того, какого
    узла мы достигли и каковыми являются соответствующие стоимостные характеристики.)
    а) Для нахождения оптимальной стратегии постройте соответствующую модель динамического программирования.
    б) Предположим, что число отрезков планового периода, необходимое для переезда из узла i в узел /, подчиняется вероятностному
    закону. Допустим, в частности, что на отрезке t время переезда
    вдоль дуги равняется djt (djt = 1, 2, . . .) с вероятностью д^, г ( d t j ) .
    Пусть информацию о фактическом значении dtj можно получить лишь
    после того, как выбрана дуга (i, j). Покажите, как при этом изменится модель, построенная в п. а).
    41. Задача о дилижансах (разд. 8.2). Рассмотрим данные, приведенные на рис. 8.1, и положим вероятность того, что мистер М.
    при переезде из штата i в штат / не останется в живых, равной с,/20;
    *) Эти характеристики могут варьироваться в зависимости от конкретного
    содержания задачи. Например, они могут выражать собой стоимость переезда
    из одного узла в другой, время переезда и т. д.— Прим. перев.

    130

    ГЛАВА 17

    так, например, вероятность появления смертельной опасности при
    переезде из штата 2 в штат 6 равняется с 26 /20 = 3/5. Требуется
    определить маршрут, для которого вероятность благополучного исхода для мистера М. является максимальной. Рискнули ли бы вы отправиться в путешествие, если бы вы оказались на месте мистера М.?
    Дайте необходимое обоснование.
    42. Задача фирмы «Фудзи Стил» (см. упражнение 52 гл. 9). Предположим, что в момент составления технических условий на выпускаемую продукцию уровни спроса DJ точно не известны. Однако
    до начала производства фирме удается установить значения
    PJ (D) == P [Dj = D]. Постройте для нового варианта задачи модель
    динамического программирования.
    43. Рассмотрим задачу распределения времени студентом К. при
    подготовке к выпускным экзаменам (см. упражнения 23 и 24 гл. 10).
    Предположим, что его оценки баллов, приведенные в упомянутых
    выше упражнениях, реализуются лишь с вероятностью 3 / 4 , а с вероятностью V 4 студент К. может получить в каждом случае отметку
    на один балл ниже. Так, например, если студент К. отведет на изучение легких предметов три отрезка из всего имеющегося у него времени
    для подготовки к экзаменам, то он получит 3 балла с вероятностью
    3
    /4 и 2 балла с вероятностью V 4 . Пусть случайные события являются
    взаимно независимыми.
    а) Постройте соответствующую модель динамического программирования и найдите оптимальное решение; при этом исходите из
    того, что студент К. стремится максимизировать ожидаемое количество баллов, которое он хочет получить на выпускных экзаменах.
    б) Пусть цель студента К. заключается в максимизации вероятности того, что он получит на выпускных экзаменах в общей сложности не менее 9 баллов. Реконструируйте модель, полученную
    в п. а), с учетом новой постановки задачи.
    44. Обратимся к задаче скотоводческой фермы, сформулированной в упражнении 32 гл. 10. Предположим, что доход, получаемый
    в п-ы году, составляет Rn (уп \ р ) , где р — случайная переменная,
    характеризующая общий уровень цен. Распределение вероятностей
    для р в и-м году обозначим через дп (р). Предположим также, что
    число голов не проданного на убой скота возрастает к началу следующего года в / раз, где / — случайная величина, характеризуемая распределением вероятностей q (/). Запишите рекуррентное
    соотношение динамического программирования, с помощью которого
    можно определить, сколько голов скота выгодно продавать ежегодно
    в течение N лет. Рассмотрите следующие варианты:
    а) Значения р до момента принятия решения относительно уп
    являются неизвестными;
    б) Значения р до момента выбора значений уп известны.
    45. Задача расширения производственной мощности (см. упражнение 33 гл. 10). Предположим, что Rt есть случайная величина,

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    131

    характеризуемая распределением вероятностей pt (R). При R > С
    введем также в рассмотрение Ht (С, R), учитывая таким образом
    экономический ущерб, обусловленный нехваткой производственной
    мощности на отрезке t. Постройте модель расширения производственной мощности в виде рекуррентного соотношения динамического
    программирования. Рассмотрите следующие случаи:
    а) до принятия решения относительно значения xt значение Rt
    является неизвестным;
    б) значение Rt известно до момента выбора значения xt.
    46. Задача акционерного общества «Биржевик» (см. упражнение 34 гл. 10). Представим себе, что акционерное общество «Биржевик» потеряло способность точно прогнозировать цены на акции
    р (t) и может теперь лишь определять соответствующее распределение вероятности qt (p) для любого будущего отрезка t. Пусть при
    наступлении отрезка t фактическое значение р (t) становится известным до момента выбора значения xt.
    а) Сформулируйте данную задачу в виде рекуррентного соотношения динамического программирования, исходя из предположения,
    что акционерное общество «Биржевик» хочет максимизировать математическое ожидание общей суммы наличных денег к концу планового периода.
    б) Определите, как изменится только что построенное вами рекуррентное соотношение, если цена акций на отрезке t зависит от цены
    акций на предыдущем отрезке [соответствующее распределение
    вероятностей обозначьте через qt (p |/?t_i)].
    47. Мисс К. везет буквально во всем, кроме любви. Представьте
    себе, что в течение ближайших N дней она имеет возможность делать
    ставки в игре с вероятностными исходами. Предположим, что мисс
    К. в начале указанного периода располагает / долл. и каждый день
    может делать любую ставку, не превышающую, однако, сумму денег,
    которой она располагала в начале дня. Если в /г-й день делается ставка в уп долл., то вероятность увеличения капитала на такую же
    сумму равняется рп, а вероятность проиграть указанную сумму равняется 1 — рп. Мисс К. хочет максимизировать вероятность того,
    чтобы к концу N-дневного периода у нее оказалось S долл.
    а) Постройте рекуррентное соотношение динамического программирования, с помощью которого можно определить размер ставки
    в любой из рассматриваемых дней при условии, что известна сумма
    наличных денег, которой она располагает в начале этого дня.
    б) Предположим, что ситуация изменилась таким образом, что
    при ставке уп долл. в и-й день с вероятностью 1/t происходит увеличение капитала на (8рп — 1) уп, где рп имеет прежний смысл (см.
    выше), и с вероятностью 3 / 4 имеет место проигрыш в размере уп. Покажите, как при данных условиях изменится рекуррентное соотношение, полученное в п. а).
    в) Пусть N = 3, / = 1, Pi = 3/8, Pz = 5/8 и Рз= V 2 - Определите
    оптимальные стратегии при условиях, сформулированных в пп. а) и б),

    132

    ГЛАВА 17

    а также при S — 3 и S — 6. Изобразите для каждого из этих случаев соответствующее дерево решений.
    г) При условиях выигрыша и проигрыша, сформулированных
    в пп. а) и б), постройте модель, ориентированную на максимизацию
    математического ожидания суммарного выигрыша по истечении
    Л'-го дня.
    д) Используя рекуррентное соотношение, полученное в п. г),
    и данные, приведенные в п. в), найдите соответствующие каждому
    из указанных случаев оптимальные стратегии.
    48. Специализированному автомобильному магазину нужно сбыть
    в течение последних Т дней текущего года оставшиеся N автомобилей
    старой марки. Если в £-й день предложение составит п автомобилей,
    то, согласно оценке магазина, при цене г долл. за один автомобиль
    с вероятностью pt (s \ r) (s = О, 1, . . ., п) будет продано s автомашин. Если в конце Г-го дня часть автомашин окажется непроданной,
    магазин будет вынужден продать оставшиеся автомобили по цене
    v долл. за каждый. Постройте модель динамического программирования, позволяющую устанавливать цены на автомашины в каждый
    из дней рассматриваемого периода так, чтобы ожидаемый доход от N
    оставшихся автомашин был максимальным.
    49. В большом продовольственном магазине даже в часы пик
    обеспечивается быстрое обслуживание покупателей за счет достаточно большого числа контрольно-расчетных прилавков. Заведующий магазином собрал данные относительно числа покупателей,
    входящих в магазин в течение каждого единичного интервала времени (продолжительностью 15 мин.), а также относительно числа
    покупателей т, которых успевают обслужить в течение 15-минутного
    интервала (т зависит как от числа покупателей, находящихся в магазине, так и от числа действующих контрольных прилавков). Обозначим через pt (п) вероятность того, что в течение интервала t в магазин входят п покупателей (для простоты будем считать, что все п
    покупателей входят в магазин в начале интервала t). Пусть
    qt (т \ n, s) есть вероятность того, что в течение интервала t обслуживается т покупателей при условии, что в начале интервала в магазине находится п покупателей, а число действующих контрольных
    прилавков равняется s. Обозначим через w издержки эксплуатации
    одного контрольного прилавка в течение одного отрезка времени.
    Заведующим проведена приблизительная оценка издержек, связанных с тем, что покупатели ожидают обслуживания у контрольных
    прилавков. Обозначим стоимость ожидания от начала до конца интервала t в расчете на одного покупателя через ht.
    а) Постройте модель динамического программирования, позволяющую определить оптимальную стратегию в период наплыва
    покупателей (пусть этот период состоит из Т интервалов).
    б) Покажите, как изменится только что построенная вами модель,
    если учесть, что открытие каждого дополнительного контрольного

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    133

    прилавка вызывает дополнительные издержки в размере К (т. е.
    если в течение одного интервала добавляется р таких прилавков, то
    суммарные издержки равняются рК).
    ДОПОЛНИТЕЛЬНЫЕ УПРАЖНЕНИЯ

    50. Фирма, выпускающая безалкогольные напитки, планирует
    начать производство нового прохладительного напитка под названием «Нектар». Если этот напиток будет пользоваться спросом у покупателей, то, согласно предварительным оценкам, фирма получит
    прибыль в размере R (этот показатель фактически представляет собой
    приведенное значение прибыли в пределах планового периода продолжительностью несколько лет). По мнению руководителя фирмы,
    вероятность указанного исхода равняется р. Если же «Нектар»
    не найдет спроса у покупателей, фирма потерпит убытки в размере L
    (связанные с расходами на оборудование, упаковку продукции
    и предварительную рекламу). Прежде чем затратить указанную выше
    сумму L, руководство фирмы может провести рыночный эксперимент
    с тем, чтобы составить более обоснованное представление о целесообразности выпуска нового продукта. Допустим для простоты, что
    имеется всего две зоны, где можно провести упомянутый выше рыночный эксперимент, и предположим, что фирме вовсе не обязательно
    экспериментировать во второй зоне, пока не будут известны результаты эксперимента в первой зоне. Если на «Нектар» имеется потенциальный спрос, то с вероятностью pt результат эксперимента в первой зоне окажется успешным (вероятность того, что эксперимент
    в первой зоне окажется безуспешным, обозначим через д^). Аналогично, если на «Нектар» имеется потенциальный спрос, это будет
    установлено с вероятностью ps2 B результате эксперимента в обеих
    зонах и с вероятностью р^ в результате эксперимента во второй
    зоне (при отрицательном результате в первой зоне). Если же на
    K
    «Нектар» нет потенциального спроса, то с вероятностью g^2 такому
    выводу приведет эксперимент в обеих зонах и с вероятностью g s 2 —
    эксперимент только во второй зоне (при положительном результате
    эксперимента в первой зоне). Пусть эксперимент в первой зоне сопряжен с затратами Cit а эксперимент во второй зоне — с затратами С^
    (при этом допустим, что данные показатели не зависят от результатов эксперимента).
    а) Нарисуйте для данной задачи дерево решений. (Примечание:
    руководитель фирмы может принять решение относительно того,
    выпускать или не выпускать «Нектар», в любой момент времени;
    при этом затраты в размере L производятся после принятия положительного решения.)
    б) Объясните, как может быть найдена оптимальная стратегия.
    Для иллюстрации метода определения оптимальной стратегии используйте следующие данные: R = 100, L = 50, Ci = 5, С2 = 10, pt =
    = 0,5, ?1 = 0,75, Ps2 = 0,8, р / 2 = 0,5, g /2 = 0,9, qs2 = 0,6.

    134

    ГЛАВА 17

    в) В какой степени упростится (если это вообще возможно) процедура решения, использованная вами при выполнении упражнения п. б), если psZ ~ Pfz и Qf2 ~ 9«2? Поясните два последних условия. Ответ проиллюстрируйте с помощью данных, приведенных
    в п. б), внеся в них лишь следующие изменения: pf2 = 0,8 (вместо
    0,5), qsz — 0,9 (вместо 0,6).
    51. Задача подбора кандидатуры на место секретаря (разд. 1.6).
    а) Запишите эту задачу в виде рекуррентного соотношения динамического программирования. Пусть администратор намерен провести собеседования не более чем с п кандидатками (в разд. 1.6 п =
    = 3). Покажите, как изменится модель, если предположить, что
    каждое собеседование обходится администратору с долл.
    б) Предположим, что администратор не ограничивает себя числом
    претенденток, которых он намерен проинтервьюировать. Какой бы
    стратегии вы посоветовали ему придерживаться, если с = О?
    в) Пусть администратор не ограничивает себя числом претенденток, которых он намерен проинтервьюировать, и предположим, что
    с > 0. Пусть, кроме того, используется однопериодный коэффициент
    дисконтирования а (0 ^ а ^ 1). Запишите систему предельных
    уравнений, позволяющих найти оптимальную стратегию. (Указание:
    состояния определяются числом баллов, получаемых претенденткой
    на секретарскую работу, а решение заключается в выборе варианта
    действий: «нанять» или «перейти к следующему собеседованию».)
    г) Запишите для условий, сформулированных в п. в), исходную
    и двойственную задачи линейного программирования.
    д) Используйте результат выполнения предыдущего упражнения
    для нахождения оптимального решения при условии, что имеют
    место данные, приведенные в разд. 1.6, с = 0,15, а а — 1.
    е) Предположим, что администратор имеет возможность «отсрочить» решение относительно найма, т. е. может провести собеседования с другими претендентками на место секретаря и лишь после
    этого выбрать либо последнюю из интервьюируемых, либо одну
    из претенденток, проинтервьюированных им ранее. При каких условиях администратор воспользуется этой возможностью? Как изменится формулировка п. в) с учетом этой дополнительной возможности? Выполните упражнения, приведенные в пп. г) и д ) , приняв
    во внимание дополнительные возможности администратора.
    52. Задача выбора места стоянки автомобиля. На собственном
    автомобиле вы прибыли на свидание с очаровательной девушкой.
    Ваша девушка изъявила желание посмотреть новый фильм, который
    идет в одном из кинотеатров города. Вы направляетесь в район этого
    кинотеатра и обдумываете оптимальную стратегию выбора места
    стоянки автомобиля. Автомобиль всегда, разумеется, можно оставить на платной стоянке, что обойдется вам в В центов. Вы можете
    попытаться «припарковаться» прямо на улице. Однако, если вы
    оставите автомобиль слишком далеко от кинотеатра, ваша девушка
    подумает, что вы «размазня» и, по-видимому, так же плохо решаете

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    135

    и другие проблемы. Пусть на улице по обе стороны от кинотеатра имеется ./V мест, где можно поставить автомобиль. Для удобства анализа занумеруем их следующим образом: —N, —N + 1,
    —N + 2, . . ., —1,0, 1, . . ., N — 2, N — 1, N. (Место с номером О
    находится напротив входа в кинотеатр и для стоянки не используется.) По вашей оценке коэффициент потери «личного престижа» (как
    водителя и как мужчины!) равняется | п |, где п есть номер стоянки,
    на которой вы хотите поставить автомобиль. Обозначим через
    рп (п = — N, —1, 1, . . ., N) вероятность того, что п-е место для
    стоянки окажется незанятым.
    а) Постройте модель динамического программирования, позволяющую определить оптимальную стратегию поиска места стоянки.
    Для простоты предположите, что свободные места для стоянки вы
    обнаруживаете поочередно. (Указание: состояние системы определяется набором характеристик «занято — свободно» для каждого п.)
    б) Постройте линейную оптимизационную модель, эквивалентную только-что полученной, а также сформулируйте соответствующую двойственную задачу. Рассмотрите случай, когда N = 3.
    53. Рассмотрим модель управления запасами при точном прогнозе флуктуации уровня спроса (см. упражнение 12). Предположим,
    что в результате прогнозирования удается точно определить как
    текущий уровень спроса, так и уровни спроса на последующих отрезках планового периода. Какую сумму была бы готова заплатить фирма за такого рода точный прогноз, если а) п = 2; б) п = 3? Будем
    считать, что в начале планового периода запасы отсутствуют.
    54. Задача о складах (см. упражнение 36 гл. 5 и упражнение 49
    гл. 8). Пусть фигурирующие в данной задаче цены и другие стоимостные показатели представляют собой случайные величины. В частности, рассмотрим случайную величину г, которая характеризуется
    на t-м отрезке планового периода распределением вероятностей
    qt (r) (t = 1, 2, . . ., 10). Допустим далее, что рыночная и закупочная цены на t-м отрезке являются известными функциями г; обозначим их соответственно через pt (r) и ct (r). Пусть значения этих
    функций в начале каждого t-то отрезка становятся известными до
    момента принятия решения относительно объемов поставок на рынок
    сбыта и объемов закупок. Постройте модель динамического программирования, с помощью которой можно определить стратегию, максимизирующую среднее значение прибыли.
    55. Задача космонавта. Не желая принимать опрометчивых решений, космонавт А обратился за помощью к методам исследования
    операций. По программе полета космонавт А должен сделать N
    витков вокруг Земли. В начале каждого нового витка необходимо
    определить, в каком «состоянии» находится космический корабль:
    в состоянии 1 (когда все системы функционируют нормально), в состоянии 2 (когда имеются незначительные неполадки) или в состоянии 3 (когда наблюдаются серьезные нарушения режима функционирования бортовых систем). Если космический корабль находится

    136

    ГЛАВА 17

    в состоянии 1, решение определяется однозначно —«продолжать
    полет» (если, разумеется, к этому моменту программа не оказалась
    полностью выполненной). В случае когда фиксируется состояние 3,
    полет должен быть прекращен. Если же наблюдается состояние 2 Т
    космонавт имеет право выбора: делать очередной виток или же прекратить полет. Обозначим через рп (j \ i) вероятность того, что если
    после завершения п-то витка космический корабль окажется в состоянии i (где i = l , 2), то после очередного витка будет наблюдаться состояние /', где / ^ i. Введем в рассмотрение состояние
    ; = 4, которое характеризует аварийную ситуацию, при которой
    полет должен быть прекращен немедленно; соответствующую данной
    ситуации вероятность обозначим через рп (4 | i) (i = 1, 2). Если
    космонавт заканчивает полет после успешного выполнения п витков, результаты полета оцениваются в vn долл. (vn > f n -i)- Если же
    полет прерывается на п-ы витке по причине возникновения аварийной ситуации, результаты полета оцениваются лишь в wn долл.
    (wn < У„).
    а) Постройте модель динамического программирования, позволяющую определить оптимальную стратегию космонавта А.
    б) Приведите подробную запись исходной и действенной модели
    линейного программирования для условий, сформулированных
    в п. а). Рассмотрите случай N = 4.
    56. Фирма X, желая принять на работу опытного руководителя,
    который смог бы возглавить недавно созданный отдел, обратилась
    за помощью к другой фирме (назовем ее фирмой Y), специализирующейся в подборе кадров административных работников. Фирма
    Y для каждого перспективного кандидата организует серию тестов
    и собеседований, которые позволяют выявить деловые качества.
    За проведение теста (или собеседования) / фирма Y взимает с фирмы X
    плату в размере с/. Прошлый опыт показывает, что испытуемый
    выдерживает тест с некоторой вероятностью PJ. (Для простоты будем
    считать, что процедуры тестирования разработаны настолько тонко,
    что исходы, связанные с различными видами тестов, являются полностью независимыми.) Фирма X согласна принять на работу только
    то лицо, которое выдержит все / испытаний; другими словами, если
    рассматриваемая кандидатура не выдержит хотя бы одно испытание,
    ее немедленно исключают из списка претендентов на должность руководителя нового отдела. Постройте метод определения последовательности тестов, при которой минимизируются ожидаемые суммарные
    затраты, связанные с испытанием одного претендента.
    57. Мистер Z, президент крупного банка, имеющего несколько
    самостоятельных отделений, по ошибке послал письмо сугубо конфиденциального характера одному из своих вице-президентов (допустим, что всего имеется N вице-президентов). К своему стыду, мистер
    Z не помнит, какому из вице-президентов было направлено упомянутое выше письмо, и хочет выяснить это по телефону. По оценке
    мистера Z вероятность того, что письмо получено ;-м вице-прези-

    ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    137

    дентом, равняется PJ. С вероятностью q} вице-президент / может
    не оказаться на месте, когда мистер Z будет ему звонить, и, таким
    образом, ему не удастся узнать, получено ли вице-президентом письмо или нет. Разработайте модель динамического программирования^
    с помощью которой можно определить стратегию мистера Z, минимизирующую ожидаемое число телефонных звонков, которые необходимы для отыскания письма, посланного не по адресу.
    58. Задача определения оптимального размера партии. Задачу
    фирмы «Вольтекс», приведенную в разд. 17.5, можно описать в терминах одношагового процесса. Задачи определения оптимального
    размера партии нередко возникают и в многошаговых процессах.
    Рассмотрим, например, производственный процесс, состоящий
    из четырех этапов (шагов). На первом этапе, как и в примере, приведенном в разд. 17.5, решение должно приниматься относительно
    первоначального размера партии х, позволяющего изготовить к концу последнего этапа п годных изделий. Однако некоторые из изделий, изготовленных на данном этапе, не отвечают техническим
    условиям и, следовательно, бракуются. Допустим, что каждое из
    числа изготовленных на первом этапе годных изделий используется
    затем на втором этапе технологического процесса. При этом число
    изделий, изготовляемых на втором этапе (ге°), не может превысить
    число годных изделий, изготовленных на первом этапе (п*). Однако
    при п* > п° возникают излишки, которые могут быть проданы.
    Только что описанная ситуация повторяется на третьем и на четвертом этапах. Если к концу четвертого этапа выпускается менее п
    годных изделий, весь процесс повторяется с самого начала с тем,
    чтобы обеспечить выпуск недостающего количества изделий п (как
    правило, п < п).
    Обозначим через ct (х) затраты, связанные с производством х
    изделий на этапе t (t = 1, 2, 3, 4). Пусть ptx (/) представляет собой
    вероятность того, что / из х компонентов не отвечают техническим
    условиям. Обозначим через st стоимость забракованного изделия,
    а через vt — стоимость годного изделия, оказавшегося в излишке(т. е. реализуемого по сниженной цене).
    а) Постройте для только что описанной ситуации модель динамического программирования.
    б) Пусть п = 2, и предположим, что размер партии на этапе 1
    не может превысить 3 изделий. Приведите для этого случая подробную запись соотношений, полученных в п. а). Постройте модель,
    линейного программирования, отвечающую полученным выше соотношениям и позволяющую определить оптимальную стратегию фирмы «Вольтекс». Постройте соответствующую двойственную модель.
    Чему равняется число уравнений и число переменных в упомянутых выше линейных моделях, если на этапе 1 предельный размер
    партии равняется 4 изделиям? Ответьте на поставленный выше вопРОС, предложив, что п = 3, а предельный размер партии на этапе 1
    равняется 4.

    ГЛАВА 18

    Динамическое программирование
    на марковских цепях

    18.1. ВВЕДЕНИЕ

    Все примеры, приведенные в предыдущей главе, можно рассматривать как частные случаи более общей модели, позволяющей описывать так называемые марковские процессы принятия решений.
    Такое обобщенное рассмотрение выгодно отличается тем, что позволяет выяснить ряд важных динамических свойств, которыми обладают все изученные модели. Так, например, будут установлены
    достаточные условия существования стационарной стратегии, оптимальной на бесконечном плановом периоде. Читатель сможет также
    узнать, когда рационально применять методы последовательного
    приближения и линейного программирования для отыскания числовых решений таких задач, в которых нельзя использовать ни одну
    из известных форм оптимальной стратегии.
    Материал этой главы основан на многих идеях, изложенных
    в гл. 11, 12 и 17. В частности, используются понятия:
    интегральный дисконтированный эффект *) (разд. 11.2);
    эквивалентный средний эффект (разд. 11.2);
    экстремальные уравнения (разд. 12.1 и 12.3);
    метод итераций по критерию (разд. 12.2);
    метод итераций по стратегии (разд. 12.2 и 12.3);
    правила принятия решений или стратегия (гл. 17).
    Хотя в последующем изложении дается исчерпывающее объяснение всех затрагиваемых вопросов, к обсуждению содержания перечисленных понятий, приведенных в предыдущих главах, когда они
    были введены впервые, мы больше не возвращаемся. Поэтому читателю рекомендуется потратить несколько минут, чтобы освежить
    в памяти эти понятия. Основное внимание в данной главе мы обращаем на то, каким образом меняются рассмотренные ранее постановки задач динамического программирования и методы их решения,
    если учесть введение вероятностных элементов. Поэтому при анализе
    содержательных сторон рассматриваемого предмета в данной главе
    мы сосредоточим наше внимание в основном на влиянии неопределенности.
    На протяжении всей главы мы будем предполагать, что рассматривается задача минимизации, причем целевая функция имеет
    смысл ожидаемого значения критерия. В зависимости от содержания
    г
    ) В дальнейшем применяется термин «дисконтированный эффект», причем
    вод «эффектом» часто подразумеваются затраты, что ясно из содержания соответствующих задач.— Прим. перев.

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    139

    примеров смысл целевой функции заключается в оптимизации затрат,
    дисконтированного или среднего эффекта. Однако следует еще раз
    обратить внимание на то, что во всех приводимых ниже постановках задач динамического программирования целью оптимизации
    является минимизация. Для рассмотрения задач максимизации требуется лишь несущественная модификация приведенных формул.
    (Разумеется, изменив знак целевой функции в задаче на максимум,
    можно найти оптимальное решение, пользуясь алгоритмом отыскания минимума целевой функции.)
    18.2. СТОХАСТИЧЕСКАЯ МОДЕЛЬ ЗАДАЧИ
    О КРАТЧАЙШЕМ МАРШРУТЕ

    При изучении детерминированных моделей динамического программирования в гл. 10 и 12 было показано, что такие модели удобно
    рассматривать в виде сетей. Напомним, что сеть, соответствующая
    общей задаче динамического программирования с конечным плановым периодом, состоит из узлов, отображающих систему в s состояниях на отрезках и, и дуг, определяющих результаты решений.
    Такая сеть является ациклической, а ее конечный узел отображает
    начальное состояние системы. Сеть, соответствующая общей задаче
    динамического программирования с бесконечным плановым периодом, строится аналогично, не считая того, что в обозначении узлов
    более не фигурирует номер отрезка, а определяется только состояние
    системы.
    Для случая с конечным плановым периодом рекуррентное соотношение, соответствующее оптимизационной задаче, имеет вид
    z/;=

    min
    (ayj + сц) при всех г Ф г и ут == О
    С
    1 ;)
    ° в оети '
    (конечный плановый период),

    (1)

    п

    где г — конечный узел, а величина а — коэффициент (норма) дисконтирования на одном интервале. При конечном плановом периоде
    значение а можно принять любым на отрезке 0 ^ а ^ 1.
    Точно так же стохастические модели динамического программирования с конечным плановым периодом и конечным числом состояний, подобные рассмотренным в гл. 13, можно представить в виде
    вероятностной модели задачи о кратчайшем маршруте. Для этого
    требуется сделать три непосредственных обобщения на основе результатов ранее изученных детерминированных задач о кратчайшем маршруте. Первое из этих обобщений учитывает то обстоятельство, что
    теперь решение d в узле i может привести к тому, что система перейдет в один из нескольких возможных узлов. Примем следующее допущение:
    р (j | i, d) есть условная вероятность того,
    что состояние системы будет определяться узлом / при условии,
    что в узле i принято решение d,
    (2)

    140

    ГЛАВА 18

    где при заданных i и d сумма р (j \ г, d) по всем допустимым j равна
    единице.
    В сущности (2) представляет собой не что иное, как так называемое допущение о марковском свойстве системы. В частности, постулируется, что любая вероятность перехода в (2) определяется только
    значениями i и d, а не предысторией системы (предыдущими состояниями и решениями), предшествующей ее переходу в узел i.
    Второе обобщение учитывает тот факт, что эффект или затраты,
    которые ставятся в соответствие текущему решению d в узле i,
    также могут быть случайными величинами. Примем, что
    cid есть ожидаемый средний эффект на рассматриваемом
    отрезке при решении d в узле i.

    (3)

    Если положить, что с (] \ i, d) означает фактический эффект
    на рассматриваемом отрезке, полученный в результате принятия
    решения d в узле i, вследствие чего система на следующем отрезке
    оказалась в состоянии, отвечающем узлу /, то
    Cid = S с (] \ i, d) P (i \ i, d),

    (4)

    i

    где сумма берется по всем возможным /.
    Третья модификация относится к обобщенному свойству ацикличности сети (отсутствие петель и контуров). Предположим, что узлы
    можно упорядочить таким образом, что для конечного узла выполняется условие г = 0, а для всех i, j т. d — условие
    р (i \ i, d) = 0, если / ^ i (условие ацикличности).

    (5)

    Иными словами, нельзя перейти из узла i в узел /, если номер узла /
    больше номера узла г. Следствием условия (5) является то обстоятельство, что в любой реализации движения системы ни в один узел
    нельзя попасть более одного раза, хотя имеются узлы (состояния),
    в которые система вообще не попадает. Как будет показано ниже,
    в задаче управления запасами свойство (5) часто непосредственно
    следует из структуры исследуемой конкретной задачи.
    Таким образом, стохастическое обобщение рекуррентного соотношения (1) имеет вид
    i-l

    z / j = m i n [2 P ( j \ i , d)ayi + cid]
    d£D(i) i=*0

    при всех г^=0

    и у0 === 0

    (6)

    (стохастическая задача о кратчайшем маршруте),
    где D (i) есть множество возможных решений в узле i. Следовательно, величина j/j определяет теперь минимальный ожидаемый
    дисконтированный эффект достижения узла 0 при выходе из узла i.
    Читателю следует сравнить выражения (6) и (1) и определить наиболее существенное различие между ними.

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    141

    Отметим, что значения выражения (6) можно вычислять в порядке
    Уз, • • •• Именно в силу допущения об ацикличности (5) всегда
    можно найти решение (6), начиная вычисления с узла, имеющего
    наименьший номер, и двигаясь от узла к узлу с последовательно возрастающими номерами. Вычислительный алгоритм почти полностью
    совпадает с алгоритмом отыскания кратчайшего маршрута в детерминированной ациклической сети (изложенным в разд. 7.7). Единственное различие заключается в необходимости вычисления значения суммы в правой части выражения (6).
    Модель управления запасами. Для демонстрации практического
    аспекта применения модели (6) рассмотрим вновь задачу фирмы
    «Надежный поставщик». Числовые данные стохастического варианта
    этой задачи (приведенной в гл. 17) имеют следующие значения:
    спрос: Р [D - 2] = V 2 , P W = 4] = V 2 ;
    ограничения: объем производства х ^ 5,
    конечный уровень запаса / ^ 4;
    затраты на производство и хранение С (х) + h-j,
    где объем производства х и конечный уровень запаса j являются
    неотрицательными целыми, причем

    С (0) = О, С (1) = 15, С (2) = 17,
    С (3) = 19, С (4) =21, С (5) = 23 и А = 1
    на всех отрезках.
    При этих исходных данных получено следующее рекуррентное
    соотношение (в разд. 17.4) для п = 2, 3, . . .:

    (7)

    где i = О, 1, . . ., 4 и минимизация производится только по неотрицательным целым значениям в диапазоне 4 — i ^ х ^ min (5, 6 — i).
    Соответствие между соотношением (7) и сетью такого вида, которая использовалась для (6), можно установить следующим образом.
    Пусть узел 5тг -f- i обозначает состояние системы, когда до конца
    планового периода осталось п отрезков п = 1, 2, . . ., а начальный
    уровень запаса в этом состоянии равен i, (i = О, 1, . . ., 4). Примем, что узел 0 определяет конечное состояние системы. (Обратите
    внимание на то, что номер каждого узла соответствует единственной
    паре значений п к i. Так, например, узел 36 соответствует п = 7
    и i = 1.)
    Предположим, что начальный уровень запаса в момент, когда
    До конца планового периода остается п отрезков, равен i и что принимается решение произвести х единиц. Тогда при оставшихся до
    конца планового периода п — 1 отрезках начальный уровень запаса

    142

    ГЛАВА 18

    будет либо i + х — 2 при спросе D = 2, либо i + х — 4 при спросе
    D = 4, причем каждый из указанных вариантов реализуется с вероятностью 1 / 2 . Следовательно, единственно возможные положительные вероятности перехода при п ^> 2 равны
    р [5 (п - 1) + i + х — 2 | 5га + г, ж] =
    = р [5 (п - 1) + i + г — 4 | 5n + i, z] = 1/2,

    (8)

    в чем читателю следует убедиться самостоятельно. При п = 1 оптимальное решение имеет вид
    откуда

    х = 4 - i,

    [0 | 5 + г, 4 — i] = 1 при всех г ^ 4 и ге = 1.

    (9)
    (10)

    Следует показать, что (8) и (10) удовлетворяют допущению ацикличности (5).
    Предположим, что в задаче о запасах а == 1. Как показывает (7),
    ожидаемое значение критерия при решении выпустить а изделий
    в случае, когда начальный уровень запаса при оставшихся до кон-

    1
    1
    8

    Число отрезков да конца планового периода
    Р и с . 18.1. Стохастическая сеть, отображающая задачу о запасах (стационарная стратегия).

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    143

    ца планового периода п отрезках равен г, определяется выражением
    В результате соответствие между (7) — (11) и решением рекуррентного уравнения (6) записывается в такой форме:
    z/5n+1 == /n (i) при и > 1 и 0 < i < 4
    (12)
    (Уо — О)- Таким образом, величины у}, j = 1, 2, . . ., можно определить с помощью точно таких же вычислений, как и fn (i), что отражено в таблице, приведенной на рис. 17.2
    На рис. 18.1 приведена схема, соответствующая стратегии (9)
    при п = 1 и стационарной стратегии производства:
    f 0,
    если i = 0,
    Объем производства х={ „ .
    . „ „ , при п^-2.
    *
    [ 6 —г, если i = l, 2, 3, 4, ^
    (13)
    Отметим, что решению относительно объема производства в каждом
    узле при п ^ 2 соответствуют две дуги, каждая из которых отвечает
    одной из вероятностей реализации.
    Постановка и решение задачи в терминах линейного программирования. С вычислительной точки зрения преобразование
    рекуррентного соотношения (6) в эквивалентную модель линейного
    программирования практически ничего не дает. Единственным
    достоинством такого преобразования является широкое распространение запрограммированных алгоритмов решения самых разнообразных задач линейного программирования на ЭВМ и предусмотренная этими алгоритмами возможность проверки чувствительности
    решения. Однако ознакомление с этим преобразованием является
    еще одним шагом в подготовке к анализу моделей с бесконечным
    плановым периодом, излагаемым в последующих трех разделах.
    Но самое главное заключается в том, что читатель может овладеть
    при этом техникой введения вероятностных ограничений.
    Предположим, что узлы пронумерованы числами О, 1, 2, . . ., Т.
    Оптимальное значение ут можно найти, решив задачу
    Максимизировать ут
    (I)
    при ограничениях
    i-l

    г/г — 2 P ( / M I d)ayj^.dd

    при каждом допустимом i и d,

    (II)

    3=1

    где все yt не ограничены по знаку, а величина у0 исключена, поскольку равна нулю.
    Соответствующая двойственная задача записывается так:
    т

    Минимизировать 2

    S ctdXu

    (III)

    144

    ГЛАВА 18

    при ограничениях
    т
    2 хи— S S p(j\i,d)axld = Ovpaj = l,2,...,T — l, (IV)

    l,

    (V)

    всеа^Х).
    (VI)
    Пример при Г = 3 и d = 1, 2 приведен в таблицах рис. 18.2.

    г

    .

    Прямая задача

    d У

    г/2

    yi

    УЗ

    S:

    1
    1

    S::

    1

    2

    2

    -р(1|2,2)а

    3

    1
    2

    — />(1|3, 1)а — р(2|3, 1)а 1
    -р(1|3,2)а -р(2|3,2)а 1

    1

    -^ ^31

    1 Максимизировать
    г/г не ограничены по знаку
    Двойственная задача

    «и .„

    «М

    '
    1
    2
    3

    1 1 -р(1|2,1)а -р(1|2,2)а -р(1|3, 1)а -р(1|3,2)а
    1
    1
    -р(2|3, 1)а -р(2|3,2)а
    1
    1
    C-jjCjo

    ^21

    ^"22

    ^"31

    ^"32

    =0
    =0

    =1

    Минимизироровать

    Р и с . 18.2. Постановка стохастической задачи о выборе кратчайшего маршрута
    в терминах линейного программирования (ациклическая модель).

    Можно доказать, что всегда существует оптимальное решение
    задачи (III) — (VI), такое, что не более чем одна величина xid положительна при всех значениях i. Такое решение соответствует опти-

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    145

    мальной стратегии, определяемой (6). Сумма в выражении (III)
    представляет собой соответствующие ожидаемые дисконтированные
    затраты на конечном плановом периоде, если начинать суммирование
    с узла Т и пользоваться оптимальной стратегией.
    При а = 1 величины xid можно интерпретировать как безусловные вероятности того, что при фактической реализации процесса
    принятия решений система окажется в состоянии, соответствующем
    узлу i, и в этом узле будет принято решение d. В этом случае в двойственной модели оптимизационная задача принятия решений рассматривается как задача определения вероятностей состояний системы. Значение 2 (xid) представляет собой вероятность того, что
    d£D(i)

    при фактической реализации процесса система достигнет узла L
    Если а = 1, то ввести вероятностные ограничения в задачу
    (III)—(VI) чрезвычайно просто. Так, например, если узел i* по какимлибо причинам нежелателен и этого нельзя адекватно отобразить
    значениями с г * й , то можно наложить вероятностное ограничение
    ~ «*'i*d
    r-*j ~^>
    ^/-'»
    n
    \/VTT1
    /
    где р — достаточно малая вероятность. Если введены вероятностные
    ограничения, то не всегда справедливо условие, что существует
    оптимальное решение, в котором лишь одна величина х^ положительна при всех значениях i. На самом деле такое решение обычно
    определяет случайную (рандомизированную) стратегию, в которой
    величины (xid-f Л xid) соответствуют условной вероятности принятия решения d' , если известно, что система попала в узел i (в предположении, что 2 Xid > 0).
    d

    Переменное время перехода. В разд. 12.1 упоминалось, что,
    не вводя существенных усложнений, детерминированную модель
    можно обобщить на случай, когда время перехода меняется от дуги
    к дуге. Аналогичный подход можно применить и к вероятностной
    модели. Пусть а,-;- (d) — коэффициент дисконтирования, соответствующий переходу системы в узел / при условии, что в узле i принято
    решение d. На самом деле величина а,-7- (d) может сама представлять
    собой математическое ожидание, т. е. ожидаемый коэффициент
    дисконтирования, если продолжительность перехода является случайной величиной. Единственная модификация, которую нужно при
    этом внести в (6), заключается в замене ос на а,7- (d). Точно такие же
    модификации справедливы и для приводимых ниже формул.
    18.3. БЕСКОНЕЧНЫЙ ПЛАНОВЫЙ ПЕРИОД
    С ДИСКОНТИРОВАНИЕМ (а < 1)

    Изложенная в предыдущем разделе вероятностная (стохастическая) модель выбора кратчайшего маршрута основана на ациклической структуре и является эффективным средством исследования

    146

    ГЛАВА 18

    вероятностных моделей динамического программирования с конечным числом состояний, отрезков времени и решений. В этом разделе
    рассматриваются более общие ситуации с бесконечным плановым
    периодом, но при конечном числе состояний и решений.
    Математическое описание рассматриваемой модели можно выразить достаточно просто: нужно решить экстремальные уравнения
    [ 2 Р ( Л * > d}ay} + c;d]
    ;£оети

    для каждого I,

    (1)

    где предполагается, что 0 ^ а, < 1 . Заметим, что в данном случае
    не постулируется свойство ацикличности [как это определялось
    условием (5) в предыдущем разделе] и теперь конечный узел в сети
    отсутствует. Значение у; представляет собой минимальный ожидаемый дисконтированный эффект, сопоставленный началу движения
    из узла i с последующим использованием оптимальной стратегии
    на бесконечном плановом периоде. Подчеркнем вновь допущение
    о том, что система обладает марковским свойством относительно
    вероятностей перехода, т. е. эти вероятности зависят только от i
    и d и не зависят от предшествующих состояний системы и принятых
    ранее решений.
    Выражение (1) достаточно универсально и описывает большинство моделей динамического программирования с конечным числом
    состояний и решений, бесконечным плановым периодом и стационарными вероятностями перехода.
    Можно вывести стохастический вариант в каноническом виде для
    описания дискретных моделей динамического программирования,
    аналогичный выражению (1) из раздела 12.1. Пусть S есть множество всех возможных состояний; D (s) — множество всех допустимых значений решения d при условии, что система находится в состоянии s; R (s, d) — непосредственно ожидаемый экономический
    эффект, обусловленный решением d, когда известно, что система
    находится в состоянии s; Т (s, d) — новое состояние системы на следующем отрезке, где р [Т (s, d)] есть вероятность того, что система
    достигнет состояния Т (s, d) на следующем отрезке при условии,
    что в состоянии s на текущем отрезке принимается решение d.
    При этих условиях стохастический вариант функционального
    уравнения можно записать следующим образом:

    / (s) = opt {R (s, d) + a 2 / (T (s, d)\p[T (s, d)]}
    Т

    для каждого s£S,

    (I)

    0
    где / (s) есть ожидаемый дисконтированный эффект, определяемый
    оптимальной стратегией на бесконечном плановом периоде при заданном текущем состоянии s.

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    147

    Пример задачи о запасах. Рассмотрим еще раз структуру стохастической модели управления запасами, приведенную в предыдущем
    разделе, предполагая на этот раз, что коэффициент дисконтирования
    равен а. В предыдущем разделе было показано, как строить эквивалентную сеть при конечном плановом периоде. В случае бесконечного планового периода номер отрезка уже не играет никакой роли,
    так что состояние системы можно поэтому определить просто значением начального уровня запаса i (i = О, 1, . . ., 4). (Напомним,
    что такое упрощение было возможно и в детерминированном случае
    при бесконечном плановом периоде, как было показано в разд. 12.5.)
    Соответствующее функциональное уравнение динамического программирования записывается в следующем виде:
    / ( i ) = m i n \C(x) + i [i + x—3]+a±[f(i + x—2)+
    ж

    ^

    I.

    + f(i + x — 4)]j

    при i = 0, 1, ..., 4, 0
    (2)
    где минимум отыскивается только по неотрицательным целочисленным значениям на отрезке 4 — s < а; < min (5,6 — г)Соответствующие обозначения для сетевой постановки задачи (1)
    имеют такую форму:
    Уг = f (0.
    cix s С (x) + 1 [i + x - 3],
    р [i + x — 2 | i, x] = p [i + x — 4 | i, x] = у,

    (3)
    (4)
    (5)

    где решение d = x есть количество выпускаемых изделий. Эти данные
    сведены в таблицу, приведенную на рис. 18.3.
    Предположим, что применяется следующая стационарная стратегия производства:

    {

    5,
    6 — i,
    О,

    если i = 0,
    если г = 1, 2, 3,
    если г = 4.

    (6)

    Тоща поведение системы можно описать в виде марковской цепи или
    матрицы вероятностей переходов
    Начальный уровень запаса
    на следующем отрезке
    /=01 2 3 4
    Начальный
    уро- г = О
    вень запаса на рас1
    сматриваемом от2
    резке
    3
    4

    о

    i/2 о i/2 о •

    О
    О

    0 1/2 О 1/2
    0 1/2 0 1/2

    О

    0

    1/2

    0

    0

    1/2

    О

    -]/2

    1/2
    О .

    (7)

    d€z>(0
    4
    0

    p a i г, <*)
    0

    1

    1

    1

    У

    1
    2

    1

    1
    2

    1

    т

    1

    1

    21

    1
    У

    1
    1

    2

    1

    1
    2

    У
    1

    Т

    26

    18

    24

    16

    1

    19

    1
    У

    1
    2
    1
    2

    23
    2

    1

    1
    2

    25

    20

    У

    3

    4

    1

    i

    2

    0

    т

    2

    4

    3

    22

    1
    У

    У

    3

    1

    id

    4

    1

    1

    IT

    5

    2

    c

    3

    1

    1
    2

    4

    2

    2

    Т

    2

    5

    3

    1

    22

    1

    1

    т

    17

    1

    У

    20

    О б о з н а ч е н и я : i — начальный уровень запаса на рассматриваемом отрезке;
    / — начальный уровень запаса на следующем
    отрезке;
    d — объем производства.
    Р и с . 18.3. Исходные данные для стохастической задачи о запасах.

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    149

    [Читателю следует использовать таблицу рис. 18.3, чтобы проверить элементы матрицы (7).] Точно так же любая стационарная стратегия производства приводит к марковской цепи, определяемой
    матрицей условных вероятностей.
    Обоснование экстремальных уравнений. Определим стратегию
    на бесконечном плановом периоде как исчерпывающее описание
    решений, принимаемых на каждом отрезке и в каждом состоянии.
    Такая стратегия не обязательно должна быть стационарной в том
    смысле, что правило принятия решений может изменяться от отрезка
    к отрезку. Такое определение соответствует понятию стратегии, подробно рассмотренному в гл. 16 и 17. Будем считать, что оптимальная,
    стратегия обеспечивает минимально достижимые ожидаемые дисконтированные затраты при всех возможных начальных состояниях
    системы. Такая стратегия также не обязательно должна быть стационарной. Однако в экстремальных уравнениях (1) в неявном виде
    подразумевается, что существует оптимальная детерминированная
    стационарная стратегия (одно и то же решение d следует принимать
    всякий раз, когда система оказывается в состоянии, определяемом
    узлом i), и существуют единственные значения г/,, удовлетворяющие уравнению (1) и отвечающие такой оптимальной стратегии.
    Справедливость этих двух допущений необходимо доказать, и действительно можно показать, что справедлива следующая теорема.
    Т е о р е м а о с т а ц и о н а р н о й с т р а т е г и и при
    О ^ а < 1. Всегда существуют единственные конечные значения г/ ; ,
    удовлетворяющие экстремальным уравнениям (1), и стационарная
    стратегия, соответствующая этим значениям yt и являющаяся оптимальной среди всех возможных стратегий.
    Эта важная теорема аналогична теореме, которая была приведена
    в разд. 12.1 для детерминированного случая. Поэтому почти все
    рассуждения, изложенные ранее, остаются справедливыми и сейчас.
    Эти рассуждения в целях экономии повторяются ниже в несколько
    сокращенном виде, причем особое внимание уделяется некоторым
    изменениям, обусловленным необходимостью учета вероятностей
    переходов.
    Не прибегая к подробному аналитическому доказательству теоремы о стационарной стратегии, можно указать основную линию рассуждений, используемую для получения окончательного результата.
    Обозначим общую стратегию (не обязательно стационарную)
    символом л, указывающим, какие действия следует предпринимать
    на текущем отрезке времени при известном фактическом состоянии
    системы и какие действия следует предпринимать на каждом отрезке
    п в
    будущем, где п = 2, 3, 4, . . ., при определенном состоянии
    системы на любом рассматриваемом отрезке. При заданной стратегии
    п
    рассмотрим комбинированную стратегию, включающую правило
    принятия решений в каждом из возможных состояний на начальном

    150

    ГЛАВА 18

    отрезке (обозначим это правило символом /), после чего начинает
    применяться стратегия л (иными словами, момент, когда вводится
    стратегия л, сдвинут на один интервал). Пусть (/л) обозначает такую
    комбинированную стратегию. Таким образом, действия, предпринимаемые на текущем отрезке, определяются правилом /. Правило,
    которое определяло бы действия на текущем отрезке при стратегии
    я, используется теперь на отрезке 2 при комбинированной стратегии
    (/л). Аналогично, правило, которое использовалось бы на отрезке п
    при стратегии л, при стратегии (/л) применяется на отрезке гс + 1.
    При этих условиях можно доказать, что:
    (I) Если при заданной общей стратегии я любая комбинированная стратегия (/л) приводит для каждого состояния к ожидаемому дисконтированному эффекту, который по крайней мере не
    меньше, чем соответствующий ожидаемый дисконтированный
    эффект при стратегии л, то стратегия л оптимальна.
    (II) Если общей стратегии л для любого состояния соответствует ожидаемый дисконтированный эффект, который в любом
    случае столь же велик, как и соответствующий ожидаемый дисконтированный эффект при комбинированной стратегии (/л), но
    строго больше по крайней мере для одного состояния, то стационарная стратегия, использующая только правило /, приводит1
    в каждом из состояний к такому ожидаемому дисконтированному
    эффекту, который не превышает аналогичный ожидаемый дисконтированный эффект при стратегии л, причем она характеризуется ожидаемым дисконтированным эффектом, строго меньшим
    /я-эффекта по крайней мере для одного состояния.
    Исходя из (I) и (II), можно алгоритмически показать, что существует оптимальная стратегия, которая стационарна. Рассмотрим
    любую пробную стратегию, являющуюся стационарной. Тогда
    в силу (I) эта стратегия оптимальна, если только не существует пра->
    вил принятия решений на начальном отрезке, обеспечивающих
    строгое улучшение значения целевой функции по крайней мере для
    одного состояния. Если же такие правила существуют, то в силу (II),
    используя их в качестве новой пробной стационарной стратегии,
    получаем улучшение. Поэтому последовательность улучшенных
    пробных стратегий можно ограничить таким образом, чтобы она
    включала только стационарные стратегии. Поскольку число состояний и решений конечно, существует лишь конечное число стационарных стратегий. Следовательно, процесс получения улучшенных
    пробных решений сходится за конечное число шагов, т. е. за конечное число попыток получаем стационарную стратегию, которая
    является оптимальной.
    Теперь можно показать, что упомянутые выше ожидаемые дисконтированные значения целевой функции удовлетворяют экстремальным уравнениям (1), что доказывает существование решения
    этих уравнений. Однозначность решения следует из анализа алгебраической структуры уравнений (1).

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ

    НА МАРКОВСКИХ ЦЕПЯХ

    151

    Последовательные приближения. Решение экстремальных уравнений (1) можно получить методом последовательных приближений
    в функциональном пространстве. Выберем у° произвольным образом и применим метод итераций по критерию
    1

    z / « + i = m i n [ S Р(И > d)ay? + ad]

    для каждого i

    (8)

    d£D(i-> jecera
    (итерация по критерию).
    Каждая величина у? всегда будет сходиться к пределу, удовлетворяющему экстремальным уравнениям (1), но в общем случае эта
    сходимость не является конечной. Если все величины cid~^0, а все
    у° = О, то значения г/f возрастают монотонно. Приняв все у\ = О,
    получаем процесс решения, аналогичный решению некоторых задач
    с конечным плановым периодом. В частности, у? определяет ожидаемое дисконтированное значение целевой функции, соответствующей
    оптимальному маршруту, который начинается в узле i и проходит
    через п дуг.
    При любом cid можно добиться сходимости следующим образом.
    Выберем пробную стационарную стратегию, в которой для сокращения объема записей обозначим любое из решений символом d',
    Решим далее систему однородных линейных уравнений.
    J/J — S P ( J \ i , d')ayj = dd- для каждого i
    (9)
    г'есети
    (определение значения критерия)
    при начальных значениях у° = г/;, которые будут использованы
    в алгоритме (8). Если на произвольно выбранной итерации т прекратить вычисления и использовать непосредственно следующую
    из (8) оптимальную стратегию в качестве стационарной стратегии
    для модели с бесконечным плановым периодом, то соответствующие
    ожидаемые дисконтированные значения целевой функции не будут
    превосходить значения j/f в (8).
    Пример применения алгоритма итераций по критерию приведен
    в таблицах на рис. 18.4 и 18.5. Этот пример относится к стохастической модели управления запасами, представленной на рис. 18.3.
    Отметим, что сходимость к оптимальной стационарной стратегии
    является очень быстрой: на итерации п = 3 (рис. 18.4) и на итерации
    п = 2 (рис. 18.5). На итерации п = 40 значения zy? при начальных
    значениях у° — 0 лежат в пределах 1% минимальных значений г/ г -.
    Начальные значения у\, приведенные в таблице на рис. 18.5, находятся путем решения уравнений, определяющих значения критерия
    (9), и имеют в данном случае следующий вид:
    + (l-0,5a)2/ 0
    -0,5ш/2
    = 22,
    — 0,5аг/0 + 1;/1
    —0,5аг/2
    =20,
    -0,5аг/0
    +(1-0,5а)у 2
    =18,
    (10)
    — 0(5ш/0
    —0,5аг/2 + 1г/3
    =16,
    —0,5ау„
    — 0,5ш/2
    +iyt = i.,
    где а = 0,9, что дает
    г/о = 202, 1/J = 200, г/ 2 = 189, у3 = 196, г/ 4 = 181. (11)

    (« = 0,9)
    Наге=1
    чальный
    уровень
    v\
    запа- хЩ)
    са i

    ге = 2

    *«(Ц

    у?

    /г = 3

    yf

    УГ
    *3(i)

    у?

    Бесконечный плановый период

    У'1

    *«(0

    VI

    0

    4

    22

    4

    40

    5

    54,29 122,89 163,82 178,09

    5

    185,73

    1

    3

    20

    5

    34,55

    5

    49,19 117,75 158,68 172,95

    5

    180,59

    2

    2

    18

    4

    32,55

    4

    47,19 115,75 156,68 170,95

    4

    178,59

    3

    1

    16

    3

    30,55

    3

    45,19 113,75 154,68 168,95

    3

    176,59

    4

    0

    1

    0

    19

    0

    33,64 102,11 143,03 157,30

    0

    164,94

    Начальная итерация: г/° = 0 для каждого i.
    Р и с . 18.4. Пример стохастической задачи о запасах. (Итерации по критерию
    производятся снизу.)
    (а = 0,9)

    На-

    п=0

    чаль-

    Бесконеч-

    п =2

    п =1

    ный

    уровень
    запаса i

    X

    01(1)
    Л

    о

    Уг

    j/..

    U)

    j
    У\

    2/ ч

    z Ш

    2

    »г

    «Г

    У\а

    ный

    УГ

    плано-

    вый

    период
    Уг

    0

    4

    202

    4

    202

    5

    200,09 191,94 187,89 186,48 185,73

    1

    3

    200

    5

    196,55

    5

    195

    186,80 182,75 181,34 180,59

    2

    2

    189

    4

    194,55

    4

    193

    184,80 180,75 179,34 178,59

    3

    1

    196

    3

    192,55

    3

    191

    182,80 178,75 177,34 176,59

    4

    0

    181

    0

    181

    0

    179,44 171,15 167,11 165,70 164,94

    Значения у? вычислены из уравнения, определяющего значения критерия (9), с использованием стратегии, приведенной выше в столбце аА,.
    Р и с . 18.5. Пример стохастической задачи о запасах. (Итерации по критерию
    в функциональном пространстве производятся сверху.)

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    а = 0,9

    Начальный
    уровень
    запаса i

    *»(0

    г/г

    *»(')

    г/г

    *00 (0

    г/г

    0

    5

    185,73

    4

    97,2

    4

    42

    1

    5

    180,59

    5

    92,8

    3

    40

    2

    4

    178,59

    4

    90,8

    2

    38

    3

    3

    176,59

    3

    88,8

    1

    36

    4

    0

    164,94

    0

    76,2

    0

    21

    а = 0,8

    153

    а = 0,5

    Р и с . 18.6. Пример стохастической задачи о запасах.
    (Оптимальные решения при бесконечном плановом
    периоде.)

    Читателю следует записать уравнения (9) для оптимальной стратегии и показать, что минимальные значения yt действительно равны:
    значениям, приведенным в таблице на рис. 18.4.] Заметим, что сходимость к г/; является более быстрой при начальных значениях /у",
    соответствующих стационарной стратегии (6), чем в случае, когда
    все у\ принимаются равными нулю. Читателю надлежит объяснить,
    почему при i = l, 2, 3 значения у? и гу(- в таблицах на рис. 18.4
    и 18.5 различаются на величину 2. Отметим, что из таблицы
    на рис. 18.6 наглядно видно, как изменяются оптимальная стратегия
    и значения yt при различных значениях а. Читателю следует такжеобъяснить, почему величины хж (f) уменьшаются при уменьшении:
    значения а.
    Решить уравнения (1) можно также методом последовательных
    приближений в пространстве стратегий, т. е. с помощью алгоритма
    итераций по стратегиям, имеющего следующую структуру: .
    Шаг 1. Выбрать произвольную начальную стратегию и принять
    п = 0.
    Шаг 2. При заданной пробной стратегии вычислить значения z/f
    по уравнениям, определяющим значения критерия
    3£сети

    Для каждого i

    (12>

    (алгоритм определения значений критерия),
    где d' обозначает решение, принимаемое в узле i и определяемое конкретной стратегией, оценка которой производится на данном шаге~

    154

    ГЛАВА 18

    Шаг 3. Проверить, улучшается ли стратегия, вычислив
    minimum [ 2
    d£D(i)

    jgcera

    P ( l \ i > d) а.у^ + ал] = У? для каждого г

    (13)

    (оценка качества стратегии).
    Шаг 4. Прекратить вычисления, если У™ = у? при всех i. В противном случае изменить стратегию в каждом узле /с, где У£ < у£,
    используя решение, дающее У£ в (13). Перейти от п до и+1 и вернуться к шагу 2, используя новую пробную стратегию.
    Алгоритм итераций по стратегии обладает следующими свойствами:
    (I) 2/Г1 < г/Г в любом узле i и г/Г1 < г/£, если YKyl(II) Алгоритм сходится за конечное число итераций.
    (III) При остановке алгоритма стратегия, дающая У™, является
    оптимальной.
    В случае применения алгоритма итераций по стратегии к решению стохастической задачи о запасах, приведенной в таблице
    на рис. 18.3, последовательность стационарных стратегий совпадает
    с последовательностью, указанной в таблице на рис. 18.5. Однако
    значения г/?, вычисленные по линейным уравнениям (12), являются
    минимальными значениями гу г , и поэтому алгоритм останавливается
    при п = 2. [Читателю рекомендуется показать, что алгоритм останавливается при использовании для проверки (13) значений yf,
    определяемых значениями у г , которые приведены в таблице
    на рис. 18.4.]
    Метод линейного программирования, используемый для отыскания оптимальной стратегии, излагается в разд. 18.5.
    18.4.»ЭКВИВАЛЕНТНЫЙ СРЕДНИЙ ЭФФЕКТ (а = 1)

    Напомним, что при рассмотрении детерминированных моделей
    в гл. 13 в случае, когда а = 1, возникли определенные трудности
    содержательного и вычислительного характера. В частности, в экстремальных уравнениях (1), приведенных в предыдущем разделе,
    недопустимо просто принимать а = 1. Если пойти по этому пути,
    то получим систему функциональных уравнений, которая либо вообще не имеет решений, либо имеет неопределенное решение.
    Для анализа этого случая выделим три момента. Во-первых,
    определим критерий оптимальности стратегии при а = 1. Далее
    сформулируем утверждение, что всегда существует стационарная
    стратегия, которая является оптимальной. И наконец, используем
    соответствующие экстремальные уравнения и метод последовательных приближений для отыскания стационарной стратегии, оптимизирующей целевую функцию. Первые два момента не требуют какихлибо дополнительных предположений относительно структуры моде.ли, помимо допущений, принятых в предыдущем разделе. Однако

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    155

    при изложении третьего момента, связанного с алгоритмом, для
    упрощения вводятся некоторые слабые дополнительные ограничения.
    Рассмотрим стратегию заданной формы (не стационарную),
    обозначаемую символом л*. Допустим, что стратегия я* включает рандомизирующие правила такого типа: «при попадании в узел i
    выбирается решение d{ с вероятностью р и решение d2 с вероятностью
    1 — р». Пусть при любом заданном значении а, 0 < а < 1, у* (а)
    обозначает ожидаемый дисконтированный эффект, если система
    начинает движение из узла i и применяется заданная стратегия я*.
    {Если стратегия я* стационарна и нерандомизирована, то при фиксированном значении а можно вычислить числовые значения у* (а),
    используя алгоритм определения значения критерия (12), приведенный в предыдущем разделе. В противном случае у* (а) можно
    вычислить непосредственно, правда, с помощью довольно длительного
    цикла вычислений.] Как и прежде, обозначим минимальный ожидаемый дисконтированный эффект в начале движения системы из узла i
    через г/; (а). Отметим, что на этот раз символ ее фигурирует в явном
    виде и что при фиксированном а величины i/j (а) являются решением
    экстремального уравнения (1), приведенного в разд. 18.3.
    Стратегия я* определяется как оптимальная при а = 1, если
    у* (а) = yi (а) при каждом i (оптимальная стратегия)
    (1)
    при всех а, достаточно близких к 1. Иными словами, стратегия я*
    оптимальна, если существует такое число а* <С 1> что при всех а,
    лежащих на отрезке а* < а < 1, ожидаемый дисконтированный
    эффект при выборе стратегии я* равен минимально возможному
    ожидаемому эффекту. Важный результат, который здесь можно доказать, выражается следующей теоремой.
    Т е о р е м а о с т а ц и о н а р н о й с т р а т е г и и при
    а = 1. Всегда существует стационарная стратегия, являющаяся
    оптимальной. Кроме того, всегда существует стратегия, не включающая рандомизации.
    Хотя эти утверждения представляются весьма правдоподобными,
    их доказательство далеко не тривиально. На самом деле утверждения не верны, если число состояний не ограничено, поскольку при
    этих условиях может не быть оптимальной стратегии, являющейся
    одновременно стационарной и детерминированной.
    Структура марковской цепи. Прежде чем вывести соответствующие экстремальные уравнения и изложить алгоритм их решения,
    рассмотрим более детально вероятностную структуру модели при
    использовании стационарной стратегии. Введем в выражение (3),
    приведенное ниже, допущение, которое исключает некоторые особые
    случаи, представляющие интерес для узких специалистов. Это допущение существенно упрощает рассуждения, не сужая в то же время
    практической применимости рассматриваемого аппарата. В дальнейшем дается нестрогое описание поведения марковской цепи. Если

    156

    ГЛАВА 18

    читатель уже знаком с теорией марковских процессов, то он можег
    лишь бегло просмотреть или совсем опустить эти примеры.
    Для упрощения изложения будем в дальнейшем предполагать,
    что состояния системы пронумерованы числами О, 1, . . ., Т. Рассмотрим произвольную стационарную стратегию и с целью сокращения записей обозначим каждое из определяемых этой стратегией
    решений символом d'. Тогда закон движения системы полностью
    определяется соответствующей квадратной матрицей вероятностей
    перехода из состояния i на одном отрезке в состояние / на следующем
    отрезке времени:


    р

    р

    (0 0, d')
    d')
    (0
    (0

    d') . . . р а 0, d') . . .
    1, d')... р а. 1, d').. .

    1.

    Р (1 10,
    Р (1

    i, d')

    Р (1

    *, d')... р

    Р (1

    г,

    .р (0 т,

    d')

    d')...

    (7

    р0

    р (Т \ О, d') ч
    p(T\i, d')
    р(Т

    Т, d') . . . р (Т | Т, d')
    (2)

    Такая система, полностью определяемая своими вероятностями
    перехода для одного отрезка, получила название марковской цепи.
    [Читатель уже ознакомился с примером матрицы вероятностей перехода, описывающей модель управления запасами (7) в разд. 18.3.}
    Следуя общепринятым канонам, марковские цепи описываются
    далее в терминах состояний, а не в терминах узлов сети. При рассмотрении алгоритмов решения задач вновь используется «сетевой
    язык».
    Прежде чем записать экстремальные уравнения при а = 1, предположим теперь, что существует оптимальная стационарная стратегия с решениями d*, имеющими стационарные вероятности QJ, j =
    = О, 1, . . ., Т, которые однозначно определяются Г - f l линейными
    уравнениями
    Ч}=

    1=0

    при у =

    (постулат об однозначности стационарных
    вероятностей)
    (3)

    и ограничением 2 марковских цепей, но справедливо для большинства случаев, представляющих практический интерес. Излагаемые ниже теоретические
    соображения и вычислительные приемы можно соответственно модифицировать при рассмотрении случаев, когда допущение, принятое
    в (3), неоправдано.
    Выражению (3) можно дать следующую интерпретацию. Предположим, что каждая величина qj есть вероятность того, что на рассматриваемом отрезке система находится в состоянии j. Тогда пра-

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    157

    вая часть (3) представляет собой не что иное, как вероятность того,
    что система будет находиться в том же состоянии / на следующем
    отрезке. В соответствии с (3) значения q, таковы, что обе эти вероятности равны между собой. Таким образом, рассуждая аналогично,
    приходим к выводу, что если величины д7- удовлетворяют уравнению (3) и действительно являются вероятностями того, что система
    на начальном отрезке находится в состоянии j, то эти величины
    представляют собой также вероятности того, что система будет находиться в состоянии / на любом последующем отрезке.
    Другая интерпретация величин д^, справедливая в большинстве
    реальных случаев, сводится к тому, что значения этих величин определяют предельные вероятности того, что система будет находиться
    в состоянии / на отрезке, значительно удаленном от текущего момента времени, т. е. тогда, когда система приближается к состоянию статистического равновесия. Третья интерпретация, неточная, но интуитивно ясная, заключается в том, что каждая величина q, представляет
    собой установившуюся относительную частоту пребывания системы
    в состоянии /.
    Стационарные вероятности играют важную роль, так как они
    отражают основную информацию, необходимую для расчета рабочих
    характеристик системы. Так, например, ниже [выражение (5)] будет
    показано, как использовать значение д;- для вычисления ожидаемого
    эффекта от использования системы в течение каждого отрезка времени. Из последующих глав читатель узнает, каким образом особая
    структура определенных моделей марковского типа позволяет
    в явном виде записывать выражения для QJ.
    Примеры стационарных вероятностей. Нижеследующие примеры
    поясняют понятие стационарных вероятностей.
    Случай 1. Пусть матрица вероятностей перехода имеет вид
    1/

    2/

    V2

    Va

    Поскольку g0 + g 4 = 1, из (3) при / = 0 получаем уравнение:
    откуда

    до = до (V 3 ) + (1 - д„) (V 2 ),
    до = 3/7,

    9l

    = 4/7.

    .

    (П)
    (Ill)

    Обозначим через QJ (п) вероятность того, что система находится
    в состоянии / в начале отрезка п, где QJ (1) = qs есть некоторая
    'заданная вероятность пребывания системы в состоянии / на начальном отрезке. Тогда по аналогии с (3) легко показать, что

    i=0

    158

    ГЛАВА 18

    Если Т — 1, то можно доказать, что выражение (IV) записывается
    в следующем виде:
    qj (п + 1) =gi + [qj - gj] [1 - р (1 | 0, d*) -

    -р(0 И, <**)]" при ; = 0, 1.

    (V>

    Член в правой части (V), следующий за знаком сложения, называется переходной коррекцией, поскольку он отображает разницу
    [?j (п + 1) — <Ы> характеризующую функционирование системы
    лишь на конечном плановом периоде. Вопрос читателю: каков диапазон возможных значений [1 — р (1 | 0, и*) — р (0 | 1,^*)]?
    В случае (I), поскольку (1 —2 / 3 —1/г)" — (1/6)" стремится к О
    при возрастании п до произвольно большой величины, значения
    qj(n-\-i) в пределе стремятся к q}. Таким образом, значения в (III) можно интерпретировать и как предельные вероятности пребывания системы в состоянии у, и как установившиеся относительные частоты.
    Случай 2. При заданной матрице марковской цепи
    1/3

    2

    имеем

    qa = 1/3,

    ?i

    = 2/3.

    (VII)

    Во всех случаях, когда строки марковской матрицы идентичны, стационарные вероятности равны элементам таких строк. Читателюследует вычислить д;(п-|-1), воспользовавшись выражением (V).
    Случай 3. При заданной матрице вероятностей перехода
    !



    V,

    можно показать, что стационарные вероятности равны
    ?0

    = 1/2, ?i = 1/2.

    (IX)

    Во всех случаях, когда сумма элементов каждого столбца матрицы
    марковской цепи равна 1, все величины qj равны между собой (т. е.
    qj = 1/Г+1). Такая матрица называется дважды стохастической.
    Случай 4. Нужно показать, что при матрице вероятностей перехода

    'i' 'о)
    стационарные вероятности равны
    до = 3/5, дч = 2/5.

    <х>
    (XI)

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    159

    Случай 5. Предположим, что матрица марковской цепи имеет
    следующий вид:

    V3

    2

    о

    Отметим, что, когда система достигает состояния 1, она навсегда
    остается в этом состоянии. Состояние 0 носит название переходного
    состояния. Соответствующие стационарные вероятности равны
    д0 = 0, д 4 = 1.
    (XIII)
    Если система находится в состоянии 0 на начальном отрезке, то
    можно, используя (V), показать, что она все еще будет находиться
    в этом состоянии в начале отрезка п с вероятностью (1/3)п. Таким
    образом, при произвольно большом п вероятность пребывания в состоянии 0 становится пренебрежимо малой и в пределе равна 0. Следовательно, результат (XIII) соответствует интерпретации QJ как
    предельных вероятностей, так и установившихся относительных
    частот.
    Случай 6. Предположим, что вероятности перехода имеют следующие значения:
    /О 1\



    (i о)'

    т. е. система переходит из состояния 0 в состояние 1 и обратно, или,
    иными словами, совершает колебания между этими состояниями.
    Для этого случая можно показать, что

    до = 1/2,

    qi

    = 1/2.

    (XV)

    Хотя интерпретация значений (XV) как установившихся относительных частот является интуитивной, заметим, что из (V) следует
    QJ
    , L — QJ

    при п четном,
    при п нечетном.

    (XVI)

    Следовательно, значение д 7 -(ге-)-1) при условии, что д ^ 1/2, зависит от того, является ли п четным или нечетным, и не стремится
    к пределу при возрастании п до произвольно большой величины.
    Поэтому в таком случае интерпретация значений (XV) как предельных вероятностей того, что система находится в состоянии /, является
    неверной. Этот случай представляет собой пример так называемой
    циклической цепи.
    Случай 7. Рассмотрим в заключение систему, описываемую следующей матрицей вероятностей перехода:

    1
    О

    0\
    1 '

    < XVII >

    160

    ГЛАВА 18

    Отметим, что если система в начальный момент находится в состоянии ;', то она остается в этом состоянии навсегда. В этом случае
    уравнения (3) не имеют единственного решения. Любые вероятности
    qj удовлетворяют уравнениям (3). Система (XVII) представляет собой
    пример системы, иногда называемой множественной цепью. Это означает, что систему можно разбить на подсистемы, каждую из которых
    можно анализировать независимо.
    Таким образом, предположение, что уравнения (3) имеют единственное решение, соответствующее оптимальной стационарной стратегии, исключает системы с оптимальными стратегиями, соответствующими множественным цепям. На самом деле нетрудно найти
    оптимальные стратегии и для множественных цепей, но эти случаи
    здесь не будут рассматриваться.
    Экстремальные уравнения. Предположим, что детерминированная стационарная стратегия л* является оптимальной. Тогда по определению при значении а, достаточно близком к 1, имеем
    т
    yi = minimum [ 2 p ( / | i > d) ayj + ctd] =
    d£D(i)
    j=0
    т
    = S P (/' [ z> d*) ay; + cid* для каждого г,
    (4)
    7=0

    где d* обозначает решение в узле t, определяемое стратегией л*.
    Примем далее условие
    т

    c* = i=0
    S qfcid*,

    (5)

    где q* — стационарные вероятности, рассчитанные по уравнениям (3) для стратегии я*. Интуитивной интерпретацией величины с*
    является рассмотрение этой величины как ожидаемого установившегося эффекта от использования системы в течение одного интервала (который может иметь так же смысл затрат). Хотя такая трактовка несколько неточна, в дальнейшем величина с* рассматривается
    именно в этом смысле.
    В разд. 12.3 для вывода приближенных экстремальных уравнений в случае а = 1 применялся эвристический подход. Точно такой
    же метод используется и на этот раз. Однако стоит вновь предупредить читателя, что весь ход рассуждений направлен лишь на то, чтобы получить окончательное выражение для экстремальных уравнений, которое может показаться несколько неожиданным. Вывод этих
    уравнений не является строгим в математическом отношении с точки
    зрения теории функциональных уравнений. Иной эвристический
    подход излагается далее.
    Рассмотрим ожидаемый эквивалентный эффект (1 — а) г/ г и определим величину Wi с помощью тождества
    (1 — ее) yt = (1 — a) W j + c* для каждого i.
    (6)

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    161

    Теперь можно переписать функциональные уравнения (4) в виде
    т
    с
    Wi + ,
    = minimum Г Y р (/ | i, d) a. ( Wj + , ° } + cid] для (7)
    1

    ~~

    а

    Поскольку

    d£D(i)

    ~^

    каждого г.
    т
    =
    и
    2 Р (i М> ^)
    1 величина с* постоянна, член, вклю-

    j=0

    чающий с*, можно перенести из правой части выражения (7) в левую.
    Легко показать, что, выполнив это преобразование и положив
    а = 1, мы получаем экстремальные уравнения
    т
    wi -\-с* = minimum [ 2 Р (Л i, d) Wj + ad] для каждого i
    (8)
    d£D(i)

    j=0

    (экстремальные уравнения при а = 1).
    Разность wt — Wj можно рассматривать как приращение ожидаемого
    эффекта, если начать движение из узла i, а не узла /. (Формально разность Wi — Wj есть предельное значение разности yt — uj, когда а
    стремится к. 1.)
    [Как было указано в гл. 12, для того чтобы этот вывод был точным, нужно использовать в (6) и (7) обозначения yt (а) и wt (а) и определить wi в (8) как предельное значение wt (а) при стремлении а к 1 снизу.]
    Следует показать, что если множество величин и;; удовлетворяют
    (8), то этим уравнениям удовлетворяют и множество величин (и;,- +
    + К), где К — произвольная постоянная. Поэтому необходимо
    ввести нормирующее ограничение. Удобным является ограничение
    w0 = 0 (нормирование).
    (9)
    Используя такие же рассуждения применительно ко второму равенству в (4), получаем следующие уравнения определения значения
    критерия для стратегии я*:
    г
    wijrc*= ^ j p ( j \ i , d*)wj-{-Cid* для каждого i
    (10)
    j=0

    (алгоритм определения значения критерия).
    Система (9) и (10) состоит из Т + 2 линейных уравнений, содержащих
    Т -\- 2 неизвестных w0, w1: . . ., WT и с*. Из постулата (3) о существовании единственных стационарных вероятностей следует существование единственного решения уравнений (9) и (10). Кроме того,
    получаемое значение с* оказывается на самом деле равным значению,
    определяемому с помощью выражения (5). Чтобы убедиться в этом,
    умножим сначала каждое соотношение в (10) па q*. а затем просуммируем полученные результаты по i, в результате чего получим
    2 qf (wt + с*) = 2 3? S Р (i I i, d*) Wj + S g?cid*.

    t=0

    '

    i=0

    j=0

    i=0

    (1 1)

    162

    ГЛАВА 18

    Далее нужно использовать (3), чтобы показать, что уравнение (11)
    можно упростить, сведя его к уравнению (5).
    Сформулируем теперь основной вывод, следующий из анализа
    экстремальных уравнений.
    Необходимые
    условия
    оптимальности,
    а) При заданной детерминированной стационарной стратегии я*
    в случае, когда стратегия я* оптимальна, решение (9) и (10) удовлетворяет экстремальным уравнениям (8) и (9). б) Обратно, если решение (9) и (10) не удовлетворяет экстремальным уравнениям (8) и (9),
    то стратегия я* не оптимальна.
    Поскольку всегда существует стационарная стратегия, являющаяся оптимальной, всегда существует и решение экстремальных
    уравнений (8) и (9).
    Необходимое условие оптимальности содержит утверждение, что
    оптимальная стационарная стратегия дает решение экстремальных
    уравнений. Покажем теперь, что стационарная стратегия, дающая
    решение экстремальных уравнений, является оптимальной.
    Рассмотрим стационарную стратегию я', включающую решения
    d'. Пусть w\ и с' являются соответственно решениями уравнений

    и>; = о,
    т
    wl + с' = S p ( j \ i, d') w] + си-

    (12)
    для каждого i.

    (13)

    ;=0

    Тогда можно доказать следующее утверждение.
    Достаточные условия минимума ожидаем о г о э ф ф е к т а н а о т р е з к е , а ) П р и заданной детерминированной стационарной стратегии я' в случае, когда соответствующие величины w'j и с' из (12) и (13) удовлетворяют экстремальным
    уравнениям (8) и (9), величина с' является наименьшей по всем стратегиям, б) Обратно, если величина с' не является наименьшей, то
    решение (12) и (13) не удовлетворяет экстремальным уравнениям
    (8) и (9).
    Следовательно, стационарная стратегия дает решение экстремальных уравнений только тогда, когда соответствующая величина
    с' имеет такое же значение, как и при оптимальной стратегии. Заметим, однако, что такая стратегия п' может оказаться неоптимальной
    с точки зрения частного определения оптимальной стратегии в (1),
    т. е. я' может быть и неоптимальной для каждого узла г, когда значение а близко к 1. Тем не менее в целом ряде практических случаев
    вполне возможен выбор стратегии, обеспечивающей минимальный
    достижимый ожидаемый эффект в течение каждого отрезка. Кроме
    того, возможно обобщение, при котором используются вычислительные методы отыскания оптимальной стратегии, отвечающей определению (1). Эти вопросы представляют интерес для специальных
    исследований и здесь более не рассматриваются.

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    163

    Справедливость сформулированного достаточного условия можно
    показать следующим образом. Пусть, как и прежде, d* обозначает
    некоторое решение, принадлежащее оптимальной стационарной стратегии п*. Поскольку стратегия я' дает при использовании (12) и (13)
    решение экстремальных уравнений, отсюда следует, что
    т
    w\-\-c'^C 2 P ( j \ i i d*)w'i + dd* для каждого i.
    (I)
    3=0

    Применяя соотношение (10), можно записать (I) в следующем виде:
    т
    т
    w'i + c'— S P(i\i, d*)w-<.Wi + c*— 2 P ( j \ i , d*)wj.
    (II)
    з=о
    3=0
    Умножив (II) на стационарные вероятности gf, определяемые стратегией я*, и просуммировав по i, получим
    с' < с*.
    (III)
    Поскольку, согласно принятому допущению, значение величины с*
    минимально, с' = с*, что и требовалось показать.
    Когда модель является фактически детерминированной, экстремальные уравнения (8) сводятся к уравнениям, приведенным в гл. 12,
    а именно к уравнениям (6) из разд. 12.3. Примеры 3 и 6 в разд. 12.4
    показывают, как стационарная стратегия может давать решение
    экстремальных уравнений, которое не является оптимальным в смысле приведенного выше в этой главе определения 1.
    Итеративный процесс в пространстве стратегий. С помощью
    непосредственного обобщения алгоритма поиска в пространстве
    стратегий, рассмотренного в разд. 12.3, можно получить стратегию
    л', обладающую минимальным значением с'. Для упрощения изложения этого метода принимается дополнительное допущение, которое выполняется в большинстве реальных ситуаций. Предположим,
    что для каждой пробной стратегии я', оцениваемой на шаге 2 приводимого ниже алгоритма, существуют единственные стационарные
    вероятности. (Алгоритм можно легко модифицировать с целью его
    использования в случае, когда это допущение не выполняется.)
    Алгоритм поиска в пространстве стратегий состоит из следующих
    шагов:
    Шаг 1. Выбрать произвольную исходную стационарную стратегию и положить п = 0.
    Шаг 2. При заданной пробной стратегии я' на итерации п решить
    Уравнения, определяющие значения критерия:
    ц>« = 0 (алгоритм определения значения критерия),
    т
    п
    и?Г + с = S P(i\i, d ' ) w f3 + cid' для каждого i,
    з=о
    где d' есть решение в узле i, определяемое конкретной стратегией,
    которая подвергается оценке.

    164

    ГЛАВА 18

    Шаг 3. Вычислить
    т
    minimum [ 2 Р (/ I г '

    c;d] = И7™ для каждого г.

    j=0

    (15)

    Шаг 4. Прекратить вычисления, если W? = wfjrcn при любом
    i; при этом значение с™ минимально. В противном случае изменить
    стратегию в каждом узле /с, где W% < w%-\-c , используя решение,
    дающее W% по уравнению (15). Перейти от п к re-f-l и вернуться
    к шагу 2 при новой пробной стратегии.
    Алгоритм итераций по стратегии сходится за конечное число
    итераций.
    В таблице на рис. 18.7 приведен пример применения алгоритма
    к решению стохастической задачи о запасах, условия которой даны

    Начальный
    уровень
    запаса i

    0

    ге = 0

    *0(i)

    «-•?

    4

    0

    1

    3

    -2

    2

    2

    -4

    3

    1

    -6

    4

    0

    -21

    с

    п

    20

    п =1

    W\

    *i(0

    20

    4

    4
    4
    9i
    2

    -1

    «4

    ге = 2

    W\

    г

    а(0

    *1

    Щ

    0



    •4

    5

    5

    -4 4

    5

    4

    -4 4

    4



    Ч

    3

    ->4 4

    3

    э!
    7

    4

    0

    -21

    -4

    0

    0

    «4

    -4 4
    3

    а

    -20
    20?2

    -4

    •4

    Р и с . 18 7. Пример стохастической задачи о запасах. (Итерации по стратегии.)

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    165

    в таблице на рис. 18.3. Используя на шаге 1 стратегию выпуска
    партий наименьшего допустимого объема, получаем, что алгоритм
    сходится на итерации п — 2.
    Рассмотрим вновь пример фирмы «Надежный поставщик». Рекуррентное соотношение при 0 ^ а < 1 приведено в разд. 18.3 [соотношение (2)]. Если для рассмотрения этого соотношения воспользоваться теми же эвристическими рассуждениями, к которым мы прибегали для получения экстремальных уравнений (8), то получим
    соответствующие функциональные уравнения

    (I)
    Это рекуррентное соотношение можно вывести также с помощью
    иных эвристических соображений, которые позволяют уточнить
    смысл величин it>;. Прежде чем изложить эти соображения, приведем
    из таблицы на рис. 18.7 решение экстремальных уравнений (I)

    с* = 17 А

    !»!=—б4=—5,43,

    w0 = 0,

    w2=— 7-f = — 7,43,

    3

    ш 3 =-94=-9,43,
    2

    (П)

    u; 4 =—20-f=—20,29.

    Рассмотрим теперь рекуррентное соотношение (7) для конечного
    планового периода из разд. 18.1. Вполне разумно предположить, что
    при достаточно большом значении п значение функции /n (i) будет
    приблизительно в п раз больше ожидаемых затрат на отрезке с*
    плюс некоторая поправка, учитывающая начальное условие, что
    исходный уровень запаса равен г, т. е.

    /„ (г) « пс* + щ,

    (III)

    где ivi обозначает на сей раз поправочный коэффициент. Покажите,
    что в результате подстановки правой части (III) в рекуррентное соотношение (7) из разд. 18.1 и последующих упрощений также получается приведенная выше система экстремальных уравнений (1).
    Используя условие нормировки w0 = 0, получаем из (III)
    Л, (0 - /* (0) &wt-w0 = Wi.
    (IV)
    При п = 5 и значениях соответствующих величин, взятых из таблицы на рис. 17.2, приходим к следующим результатам:
    /п (1) - /п (0) = -5,57, fn (3) - /„ (0) = -9,57,
    /п (2) - /„ (0) = -7,57, /„ (4) - /„ (0) = -20,38,
    что уже хорошо согласуется с результатами (II).

    v ;

    18.5. ПОДХОД, ОСНОВАННЫЙ НА ИСПОЛЬЗОВАНИИ
    АППАРАТА ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ

    Численные решения экстремальных уравнений, рассмотренных
    Двух предшествующих разделах, можно получить также с помощью
    методов линейного программирования. Этот подход аналогичен
    в

    166

    ГЛАВА 18

    подходу, изложенному в разд. 12.6 для детерминированной модели
    выбора кратчайшего маршрута.
    Рассмотрим прежде всего случай, когда 0 ^ а < 1. В этом случае экстремальные уравнения (1) из разд. 18.3 приводят к линейным
    неравенствам
    г/г — 2
    ;£сети

    Для любых i

    P ( J \ i i d)ayi^.Cid

    и

    d,

    (1)

    где величины yt не ограничены по знаку. Все минимальные значения
    yt можно найти исходя из максимизации целевой функции
    S rjyj,

    (2)

    }£сети

    где любая величина г,- представляет собой произвольное, но строго
    положительное число. [Если 2 О ~ 1> то величины г} можно рассматривать в качестве вероятностей того, что на начальном интервале система находится в состоянии, соответствующем узлу у, а значение (2) можно интерпретировать как соответствующее ожидаемое
    дисконтированное значение эффекта.]
    Соответствующая двойственная задача записывается следующим
    образом:
    МиНИМИЗИрОВатЬ

    J
    S CidZid
    ;£сети d£D(t)

    (3)

    при ограничениях
    X}d— 2

    S P (i I i. d) aa;id = Гу для каждого у £ сети,

    (4)

    i£cera d£B(i)

    xid > 0 при любых значениях t и d

    (5)

    Можно показать, что оптимальное базисное решение содержит
    одну величину xid^>Q для каждого г, которая соответствует оптимальной стратегии.
    Рассмотрим теперь случай, когда а = 1, введя те же допущения,
    что и для алгоритма итераций по стратегии в разд. 18.4. (В случаях когда такие допущения неоправданы, можно построить модифицированные модели линейного программирования большей размерности.)
    Соответствующая прямая модель линейного программирования
    записывается следующим образом:
    Максимизировать с
    при ограничениях
    т
    Wt—2 Р (i \ i , d) Wj-\-c^Cid
    ;=0

    где wi и с не ограничены по знаку.

    для любых i и d,

    (6)

    (1)

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    167

    Двойственная модель имеет при этом вид
    Минимизировать

    2

    S ctdVtd (ожидаемые затраты на отрезке)

    г£Сети d£D(i)

    при ограничениях
    3 tyd— S

    (8)
    S / > ( / ! * - d)y i d = 0 Д ля каждого ; 6 сети

    г£сети d£D(i)

    d£D(.7)

    («сохранение» вероятностей),
    S

    S у гсг = 1 (нормирующее ограничение),

    г£сети d£D(i)

    i>i d ^ О при любых значениях i и d.

    (9)
    (10)
    (11)

    Величину У; d можно рассматривать как совместную вероятность
    того, что система находится в состоянии, соответствующему узлу i,
    и что при этом принимается решение d. Таким образом, в двойственной модели оптимизация сводится к определению вероятностей
    каждой возможной пары (i, d). Ограничение (9) можно интерпретировать как уравнение «сохранения» вероятностей. Иными словами,
    общая вероятность выхода из узла / равна общей вероятности
    попадания в этот же узел /. Ограничение (10) отражает условие, что
    сумма совместных вероятностей должна быть равна единице. Можно
    доказать, что всегда существует оптимальное решение задачи
    (8) — (11), такое, что значение не более одной величины vid>0
    при любом i. Это решение соответствует стратегии, дающей минимальное значение с в задаче (6) — (7).
    Поскольку двойственная модель описывается в терминах вероятностей, она является удобным средством постановки задач в условиях, когда нужно ввести стохастические ограничения. Однако
    в общем случае при введении таких ограничений в оптимальной стратегии должны, как правило, содержаться элементы рандомизации,
    т. е. оптимальная стратегия может включать более одной строго поло
    жительной величины vid.
    В таком случае отношение uid в состоянии, соответствующем узлу i.
    Пример задачи о запасах. Двойственная модель стохастической
    задачи о запасах (фирма «Надежный поставщик») приведена в таблице на рис. 18.8. Оптимальным является решение

    Соответствующие ожидаемые затраты на отрезке равны
    А. 25 + ^- 26 + А.24 + -1-. 22 + ^.1^174.

    (13)

    168

    /
    0

    ГЛАВА 18

    У

    04

    3

    4

    05

    1 '
    1
    2

    1

    2

    У

    1

    ^13

    "14

    1
    ~2

    V

    22

    V

    "24

    23

    У

    31

    У

    32

    V

    33

    У

    40

    1

    1

    1

    1

    2

    2

    ~~2

    2

    1
    2

    1
    2

    1

    ' i '
    1
    2

    ~~т

    "15


    1

    Т

    11

    '

    7 '

    2

    1
    ~~2

    1



    ^42

    =0

    1

    1
    ~2

    1

    1
    2

    1

    41



    Т ~Т

    !

    У

    1

    2

    =0

    1

    1

    2

    2
    1
    ~~2~

    '

    ' т

    =0

    =0

    =0

    Нормирующее ограничение
    по всем i, ж
    МиНИМИЗИрОВаТЬ 22 ^
    по всем i, x

    — 3]}

    Р и с . 18.8. Двойственная задача линейного программирования для стохастической модели управления запасами.

    При детерминированном спросе (D = 3) на каждом отрезке эта
    4
    величина равна 15 / 6 .
    Кроме того, в детерминированном случае объем производства
    2
    составляет 0 изделий в течение / 5 отрезков и 5 изделий в течение
    3
    /5 отрезков. В стохастическом варианте вероятности (12) показывают, что объем производства изделий равен 0 в течение 4 / 1 4 отрезков,
    1
    3
    и объемам в 3, 4 и 5 изделий в течение /i 4 , "/14 и /i 4 отрезков соответственно. Таким образом, ожидаемое производство на отрезке
    составляет
    6

    что отвечает допущению о полном удовлетворении спроса.

    (14)

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    169

    18.6. ВЫЧИСЛИТЕЛЬНЫЕ АСПЕКТЫ

    При оценке вычислительных трудностей, связанных с получением численных решений задач динамического программирования
    на марковских цепях, нужно учитывать два момента. Первый относится к общей вычислительной реализуемости применяемого алгоритма, второй — к относительной эффективности каждого вычислительного процесса, изложенного в разд. 18.2—18.5.
    Если обозначить через NI число различных решений, которые
    можно принять в узле i, где i = О, 1, . . ., Т, то структуру сетевой
    модели можно приближенно рассматривать в виде прямоугольной
    матрицы размерностью 2 Nt на Т + 1. На рис. 18.3 приведена такая
    матрица, описывающая модель задачи о запасах, фигурирующей
    в данной главе. Отметим, что матрица имеет примерно такую же
    размерность, как и задача линейного программирования, изложенная в предыдущем разделе. Даже в случае простейшей задачи значения 27Vj и Т + 1 могут быть достаточно велики. В силу этого
    существенно найти вычислительные приемы, которые позволяли бы
    выгодно использовать частные особенности оптимальной стратегии
    в каждом конкретном случае. Приводимый в следующем разделе
    пример наглядно иллюстрирует это положение. Иногда модель
    задается в виде марковской цепи, чтобы отобразить форму оптимальной стратегии. Часто задание модели в таком виде приводит
    к некоторому увеличению числа состояний, однако при этом резко
    уменьшается число возможных решений в большинстве состояний
    (см. упражнения 50 и 51).
    Что же касается относительной эффективности каждого алгоритмического процесса, то замечания, приведенные в гл. 12, в равной
    степени справедливы и на этот раз. В частности, при а < 1 метод
    итераций по критерию обладает преимуществом, связанным с простотой численных приемов, но в то же время страдает таким недостатком, как отсутствие конечной сходимости. Достоинством метода
    итераций по стратегии является сходимость за конечное число итераций, однако объем вычислений на каждой итерации возрастает,
    поскольку приходится решать полную систему однородных линейных уравнений. (Довольно просто можно объединить эти две схемы
    в единый комбинированный алгоритм.) Преимущество применения
    метода линейного программирования заключается в том, что можно
    воспользоваться широко распространенными сложными программами решения задач линейного программирования на ЭВМ, не говоря уже о том, что использование симплексного метода решения двойственных задач, приведенных в разд. 18.5, тесно связано с методом
    итераций по стратегии. В частности каждая итерация симплексного
    метода соответствует улучшению стратегии только в единственном
    состоянии, а не во всех состояниях, где в принципе возможно какоелибо улучшение.

    170

    ГЛАВА 18

    18.7. МОДЕЛЬ ЗАМЕНЫ ОБОРУДОВАНИЯ
    В ВИДЕ МАРКОВСКОЙ ЦЕПИ

    Вспомним стохастическую модель замены оборудования, рассмотренную в разд. 17.7. В этой модели приняты следующие обозначения:
    k — плановый период замены;
    PJ — вероятность того, что оборудование впервые выйдет
    из строя в течение ;-го отрезка эксплуатации;
    TJ — стоимость эксплуатации оборудования в течение /-го
    отрезка при условии, что оно исправно работает на этом
    отрезке;
    (г; "т~ sj) — штрафные потери, обусловленные эксплуатацией оборудования в случае, когда оно выходит из строя в течение /-го отрезка эксплуатации при ;' < k.
    Если на отрезке восстановления t плановая замена предусматривается в периоде k, но оборудование выходит из строя в конце отрезка t -f- /, где ; <С k, то оборудование заменяется в начале отрезка
    t + j + i.
    При коэффициенте дисконтирования а = 1 оптимальное значение k находится как решение уравнения
    h

    g= minimum I• f
    h=i, 2

    N \

    Л

    ft

    ),

    U I J'

    (1)

    где fih есть ожидаемый эффект, а Е [/ | k] — ожидаемое число отрезков безотказной работы каждой единицы оборудования при условии,
    что плановый период замены равен k. Вывод столь простого решения
    основан на том, что оптимальная стратегия принадлежит к типу
    стратегии восстановления.
    Покажем теперь, как можно поставить и решить эту же самую
    задачу с помощью аппарата марковских цепей. Рассмотрение этого
    вопроса служит двум целям. Во-первых, демонстрируется, что стохастическая модель замены оборудования является частным случаем модели, приведенной в разд. 18.4. Во-вторых, показывается,
    что «прямолинейная» марковская постановка задачи слишком громоздка в сравнении с более тонким подходом, учитывающим вид
    оптимального решения (см. упражнение 50, п. е), где дана такая
    постановка.
    Пусть узел j соответствует возрасту оборудования в начале рассматриваемого отрезка, т. е. сразу же после принятия решения
    о сохранении или замене оборудования. Таким образом, / = О означает, что закуплена новая единица оборудования, а / = 1, 2, . . .
    указывает, что продолжает работать старое оборудование.

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    171

    Примем следующие обозначения:
    di — решение заменить оборудование в начале следующего
    отрезка;
    dz — решение не заменять оборудования в начале следующего
    отрезка при условии, что оно не вышло из строя в течение
    рассматриваемого отрезка.
    Тогда для всех г справедливы соотношения

    Р (О | г, d^ = 1,

    (2)

    = l-p(0|i, cZ2),

    (3)

    h=i
    r

    Cidi — i

    И

    p (0 | i, d2) st.

    °idz —

    (4)

    Отметим, что величина р (0 | i, d2) представляет собой вероятность того, что закуплена новая единица оборудования вследствие
    выхода из строя старого оборудования до истечения планового периода замены.
    i

    P (I \ i. d)

    d

    0
    1
    1

    0

    1

    Т
    ^

    2

    "d

    3
    4

    i
    i
    Т
    i
    0

    ^l
    di

    2

    «id

    3

    4

    i

    100

    *

    3
    4

    100 + 4- -20
    4

    4

    l
    0

    ^

    i

    2

    1

    20
    2
    3

    20 + 4-180
    О

    1

    20
    20 + 0-0
    56

    Р и с . 18.9. Марковская постановка задачи замены.

    Постановка задачи, приведенной на рис. 17.6 (стр. 113), в виде
    марковской цепи дана в таблице на рис. 18.9.

    172

    ГЛАВА 18

    Оптимальной является

    следующая

    стратегия:

    di при i ^ 2 и d2 в противном случае.

    (5)

    Легко показать, что экстремальным уравнениям (8) и (9) из
    разд. 18.4 в соответствии со стратегией (5) удовлетворяют следующие значения неизвестных:
    wn = 0, ц>! = -220/3, wz = —30, ws = —30, u;4 = 6, с* = 50 (6)
    и что соответствующие стационарные вероятности равны
    до = 4/Ю,

    ?1

    = д 2 = 3/10.

    (7)

    4

    Поскольку в течение /ю рассматриваемого периода система находится в узле 0, т. е. только что закуплена новая единица оборудования, то ожидаемая продолжительность отрезка между двумя
    последовательными закупками составляет f l '•тг] = '^~^\ отрезка, что
    согласуется со значением Е [j \ 3] на рис. 17.6 (стр. ИЗ).
    Решение этой задачи методом линейного программирования или
    методом последовательных приближений в пространстве стратегий
    требует выполнения вычислений, связанных с операциями над матрицей размерностью 9 x 5 , как это показано на рис. 18.9. Применение этих методов в случае такой «прямолинейной» постановки
    задачи неэффективно в сравнении с использованием простого метода
    оптимизации (1).
    КОНТРОЛЬНЫЕ УПРАЖНЕНИЯ

    1. Рассмотрим стохастическую модель выбора кратчайшего
    маршрута, приведенную в разд. 18.2.
    а) Предположим, что с ( j | i, d) обозначает фактический эффект
    на текущем отрезке, получаемый за счет принятия решения d в узле
    i, в результате которого состояние системы на следующем отрезке
    будет соответствовать узлу /. Выполните промежуточные преобразования, приводящие к рекуррентному соотношению (6) в случае,
    когда величина cid вычисляется по формуле (4).
    б) Покажите справедливость соотношения (6) и сравните (6)
    с его детерминистским аналогом (1). Покажите также, каким
    образом используется допущение об ацикличности при записи выражения (6).
    в) Объясните, как при отыскании числового решения (6) определяется оптимальная стратегия. Укажите, как применить такую
    стратегию.
    2. Рассмотрите пример задачи о запасах из разд. 18.2.
    а) Предположите, что производственное ограничение составляет
    максимум 6 изделий вместо 5. Как это изменение влияет на сетевое
    описание модели?

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    173

    б) Предположите, что ограничение на конечный уровень запаса
    составляет максимум 5 изделий вместо 4. Как следует пронумеровать
    узлы в соответствующей сетевой постановке задачи?
    в) Покажите, что единственными положительными вероятностями
    перехода являются величины, определяемые выражением (8). Покажите также, что (8) и (10) согласуются с допущением (5) об ацикличности.
    г) Объясните смысл равенства (11). Является ли величина
    C
    5n+t,x математическим ожиданием? Дайте необходимые пояснения.
    д) Постройте сеть, аналогичную сети на рис. 18.1, для стратегии,
    формулируемой следующим образом: объем производства при п ^ 2
    равен 3, если i = О, 1, 2, 3, и равен 0 в противном случае.
    3. Рассмотрим стохастическую модель выбора кратчайшего маршрута в терминах линейного программирования, которая описана
    в разд. 18.2.
    а) Выполните промежуточные алгебраические преобразования,
    позволяющие перейти от рекуррентного соотношения (6) к ограничениям (II).
    б) Покажите, что (III) — (VI) являются постановкой задачи,
    двойственной к (I) — (II).
    в) Запишите прямую и двойственную задачи линейного программирования при 71 = 4 и й = 1,2, Зв форме, аналогичной таблицам
    на рис. 18.2.
    г) Какое влияние оказывает допущение об ацикличности на вид
    прямой и двойственной задач, подобных приведенным в таблицах
    на рис. 18.2?
    д) Предположим, что а = 1. Дайте интерпретацию всех линейных ограничений двойственной задачи.
    е) Сколько переменных и ограничений в прямой и двойственной
    задачах о запасах в предположении, что плановый период состоит
    из трех отрезков, как это показано на рис. 18.1?
    ж) Дайте ответ на вопрос п. е), предположив, что ограничение
    на максимальный объем производства составляет не 5 изделий, а 6.
    з) Дайте ответ на вопрос п. е), предположив, что ограничение
    на максимальный конечный уровень запаса составляет не 4 изделия, а 5.
    и) Рассмотрите пример, приведенный в виде таблиц рис. 18.2,
    и положите ос = 1. Покажите, какое ограничение нужно ввести
    в двойственную задачу, чтобы вероятность «попадания» системы
    в узел 2 была не менее V 4 и не более 3 / 5 . Покажите также, как обеспечить в двойственной задаче выполнение следующего условия: если
    система попадает в узел 2, то d = 1 выбирается с вероятностью,
    не превышающей 1 /з4. Модель оптимального размера партии (разд. 17.5). Предположим, что для работы требуется три изделия, а у поставщика можно
    заказать единовременно не более пяти изделий.

    174

    ГЛАВА 18

    а) Покажите, как можно представить эту задачу в виде стохастической задачи выбора кратчайшего маршрута. Обязательно определите узлы сети и укажите их число. Поясните связь между такой
    постановкой и рекуррентным соотношением (2) разд. 17.5.
    б) Постройте сеть, отображающую стратегию, при которой всегда
    заказывается на два изделия больше, чем требуется. (Указание:
    используйте фиктивный узел, отображающий условие, что в полученном заказе указано достаточное число изделий для удовлетворения существующих потребностей.)
    в) Запишите в явном виде формулы для каждого ожидаемого
    эффекта.
    г) Запишите в явном виде условные вероятности р Q \ i, d). (Указание: рассмотрите вероятности рх (/')/[! — рх (х}} при / = О, 1, . . .
    . . ., х — 1 и дайте их интерпретацию.)
    д) Какие трудности возникают при постановке стохастической
    задачи о выборе кратчайшего маршрута в терминах рекуррентного
    соотношения (1), приведенного в разд. 18.2?
    5. Покажите справедливость следующего утверждения: если
    модель, описываемая экстремальными уравнениями (1) из разд. 18.3,
    является на самом деле детерминированной, уравнение (1) упрощается до соответствующего рекуррентного соотношения из гл. 12.
    6. В каждом из указанных ниже пунктов приведено некоторое
    изменение допущений, положенных в основу стохастической модели
    управления запасами, описанной в разд. 18.3. Объясните подробно,
    какие изменения нужно внести в таблицу на рис. 18.3 в соответствии
    с каждой конкретной модификацией.
    а) Функция затрат па содержание запаса имеет вид 1 -(i -f- x —
    — D)2, где D обозначает уровень спроса.
    б) Вероятность того, что уровень спроса равен 2, 3 или 4, составляет */з для каждого значения спроса.
    в) Максимальный объем производства равен 6, где С (6) = 25.
    г) Максимальный начальный уровень запаса равен не 4, а 5.
    д) Предположите, что максимальный начальный уровень запаса
    равен не 4, а 5 и что в стратегии (6) принято: х = О, если i = 5.
    Запишите матрицу вероятностей перехода, аналогичную (7). Сделайте то же самое для следующей стратегии: объем производства
    равен 3, если i = О, 1, 2, 3, и равен 0 в остальных случаях.
    7. Рассмотрите стохастическую модель управления запасами,
    описанную в разд. 18.3.
    а) Выполните шаги алгоритма итераций по критерию и проверьте значения величин, стоящих в таблице на рис. 18.4, при п = 1,
    п = 2 и п = 3.
    б) Запишите уравнения (9) для оптимальной стратегии при бесконечном плановом периоде, когда а = 0,9, и проверьте минимальные значения величин yt, приведенные в таблице на рис. 18.4.
    в) Объясните, почему при i = 1, 2, 3 значения г/™ и yt в таблицах
    на рис. 18.4 и 18.5 различаются на 2.

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    175

    г) Вычислите дисконтированные значения критерия при использовании стратегии, показанной в таблице на рис. 18.5 при п = 1
    и бесконечном плановом периоде.
    д) Дайте правдоподобное объяснение, почему значения величин
    ха (i) уменьшаются при уменьшении значения а, как это показано
    в таблице на рис. 18.6.
    е) Запишите уравнения (9) для оптимальной стратегии при бесконечном плановом периоде ос = 0,5 и проверьте минимальные значения г/;, приведенные в таблице рис. 18.6.
    ж) Предположите, что в результате применения алгоритма итераций по стратегии при п = 2 значения у\ равны оптимальным значениям г/;, указанным в таблице на рис. 18.4. Выполните проверку (13),
    чтобы показать, что алгоритм останавливается.
    8. Рассмотрите применение алгоритма итераций по критерию,
    описываемого выражением (8) из разд. 18.3. Предположите, что
    начальные значения у\ получены путем выбора стационарной пробной стратегии и решения уравнения (9). В тексте указано, что если
    остановиться на итерации т и применить оптимальную стратегию,
    непосредственно вытекающую из (8) для модели с бесконечным плановым периодом, то соответствующие ожидаемые значения yi не будут превосходить у™ в (8). Покажите, что этот вывод следует из рассуждений, приведенных в разд. 18.3, где дается обоснование теоремы
    о стационарной стратегии.
    9. а) Сравните алгоритм итераций по критерию, использованный
    для решения стохастической задачи выбора кратчайшего маршрута
    в разд. 18.3 с аналогичным алгоритмом решения детерминированной
    задачи, приведенным в гл. 12. В чем эти алгоритмы совпадают?
    В чем они отличаются друг от друга? Сравните объем вычислений
    и свойства сходимости.
    б) Дайте ответы на вопросы п. а) для случая алгоритма итераций
    по стратегии.
    10. Интерпретируйте определение оптимальной стратегии при
    а = 1, выраженной равенством (1) из разд. 18.4. (Указание: вспомните, что величины у* (а) вычисляются при заданной стратегии я*.)
    Напомним также, что в гл. 12 показано, что при а = 1 несколько
    различных стратегий могут приводить к одинаковому среднему
    эффекту на отрезке при бесконечном плановом периоде, но эти стратегии могут отличаться поведением в «переходном режиме». (Так,
    например, два денежных потока 100, 1, 1, 1, . . . и 10, 1,1, 1, . . .
    характеризуются одинаковым средним эффектом на отрезке, равном 1.) Как в определении (1) учитывается такое влияние переходных процессов?
    11. В каждом из указанных ниже пунктов определите, существуют ли стационарные вероятности, и в случае положительного
    ответа на этот вопрос вычислите их значения.
    а) Случаи 2 и 3 из разд. 18.4.
    б) Случай 4 из разд. 18.4.

    176

    ГЛАВА 18

    в) Случай 6 из разд. 18.4.

    гN

    /

    1/4



    ,,
    Va V a / '

    Л/4

    ж)|

    V/.
    °
    к)

    Л/4
    3/
    1 /4
    \1

    3

    /4

    V*
    0

    3

    3/
    |f °/4

    Д

    0 ,

    /4\

    , ,

    -

    3)

    ,
    ^/4
    -

    Л)

    з/ \

    v
    3

    /4

    V6

    3

    0

    Va V a

    0

    I/a V a /

    /5

    \

    3/

    /4 /4 I
    11 3/ 1
    /4 / 4 '

    0
    0

    с)

    (



    \0

    3
    ;

    3

    0'

    3
    /4

    0 1/4

    и)

    м)

    .

    /4/

    3

    /4

    /4

    '/ А

    /4 0 •V 4
    \0 0 1

    / 0 0 IX
    п) 1 0 0
    \0 1 0/

    У

    .

    .

    0 Va Va\

    1 0 0

    !


    x/

    Л/4 0

    V 41

    0

    0

    Л/4

    /4\

    \1 0 0/



    /4

    3/ ч



    1/

    0 1/4 3 / 4

    13/

    04

    *V O 1 оУ
    1
    °\
    0
    0
    о)

    /Va '/2 0 0 х
    1 V, х / « 0 0 1

    0
    \0

    1/

    \0

    /4/

    / V 4 3/4 0 \
    \

    Г0Л

    Г

    Р)

    е)



    1 3 /4

    /4

    0 3 /4\
    0 1/ 4
    0 оУ

    \0 0

    3

    / V4

    "' \ 3 /4 V 4 /

    °\

    3

    V,i

    н)

    ч

    Va Va
    Va Va

    l/ 2 l/ 2 \

    0
    0

    0 Г
    0/

    т)

    /2/

    (;

    х)

    12. Формулы (IV) и (V) из разд. 18.4 показывают, как вычислять
    вероятность ду- (п) того, что система находится в состоянии / на отрезке п при заданных вероятностях ^-состояний системы на начальном
    отрезке. В каждом из указанных ниже пунктов вычислите п = 2, 3, 4, предполагая, что q0 = i (система в начальный момент
    находится в первом состоянии).
    а)Рассмотрите следующие пункты упражнения 11: а), б), г), д),
    к), м), н), о), т), у), ф), х).
    б) Дайте ответы на вопросы пунктов, указанных в п. а), положив < ? ! = ! .
    в) Среди приведенных выше в данном упражнении задач укажите, в каких из них д7- (п) не стремится к пределу при произвольно
    большом возрастании п.

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    177

    13. а) Рассмотрите экстремальные уравнения (8) из разд. 18.4.
    Приведите промежуточные выкладки, обосновывающие переход
    от (7) к (8).
    б) Рассмотрите эвристические доводы, приводящие к (8). Объясните, где в рассуждениях используется допущение о существовании
    оптимальной стационарной стратегии, обладающей стационарными
    вероятностями, однозначно определяемыми (3).
    в) Покажите, что если wt удовлетворяют (8), то этому уравнению удовлетворяют и величины wt + К, где К — произвольная
    константа.
    г) Произведите алгебраические преобразования, приводящие
    к (И), и используйте (3), чтобы показать, каким образом можно
    упростить (И), сведя его к виду выражения (5).
    14. а) Рассмотрите необходимое условие оптимальности, сформулированное в разд. 18.4. Объясните, почему части а) и б) этого
    условия эквивалентны. Почему оно называется необходимым?
    б) Рассмотрите достаточное условие минимума ожидаемого эффекта, сформулированное в разд. 18.4. Объясните, почему части а) и б)
    этого условия эквивалентны. Почему оно называется достаточным ?
    15. Сравните алгоритм итераций по стратегии при а = 1, изложенный в разд. 18.4, с аналогичным методом решения детерминированных задач, приведенным в гл. 12. В чем эти алгоритмы совпадают?
    Чем они отличаются друг от друга? Сравните объемы вычислений
    и свойства сходимости для этих алгоритмов.
    16. а) Таблица на рис. 18.7 иллюстрирует применение алгоритма
    итераций по стратегии для решения стохастической задачи управления запасами, приведенной в таблице на рис. 18.3. Проверьте значения всех величин в таблице на рис. 18.7.
    б) Примените этот алгоритм, начав на шаге 1 со следующей стратегии: объем производства равен 3, если i = О, 1, 2, 3, и равен О
    во всех остальных случаях.
    17. Рассмотрите пример фирмы «Надежный поставщик», изложенный в конце разд. 18.5.
    а) Покажите, как вывести (I) из рекуррентного соотношения (2)
    из разд. 18.3.
    б) Покажите, что значения величин, определяемые (II), удовлетворяют экстремальным уравнениям (I).
    в) Покажите, что подстановка правой части (III) в рекуррентное
    соотношение (7) из разд. 18.1 и последующее упрощение также
    приводят к системе экстремальных уравнений (I).
    18. Рассмотрите каноническую форму дискретных моделей динамического программирования, определяемую выражением (I), котоРое приведено в начале разд. 18.3.
    а) Используйте эвристические рассуждения из разд. 18.5 для
    в
    ывода функционального уравнения при а = 1, приняв обозначения
    w
    (s) и с*.

    178

    ГЛАВА 18

    б) Запишите аналогичным образом уравнение для случая конечного планового периода, используя обозначение /n (s). Далее положите /n (s) » пс* -г w (s) и выведите функциональное уравнение
    с помощью метода, изложенного в конце разд. 18.4, при условии
    а = 1.
    19. Рассмотрите прямую и двойственную задачи линейного программирования, изложенные в разд. 18.5.
    а) Подробно запишите выражения (1) — (5) для сети, содержащей узлы О, 1, 2, 3, в которой в каждом узле можно принять два решения: d — 1 и d = 2.
    б) При условии, что каждая величина г;- является строго положительной, докажите, что базисное решение двойственной задачи (3) —
    (5) содержит в точности одну величину xid > 0 для каждого узла i.
    в) Выполните задание п. а) для случая (6) — (11).
    г) Покажите, какое ограничение нужно ввести в двойственную
    задачу пункта в), чтобы вероятность перехода системы в узел 2
    была не менее 1 / 4 , но не более 3/5. Покажите также, какое нужно
    ввести дополнительное условие, чтобы после перехода системы
    в узел 2 решение d = 1 выбиралось с вероятностью, не превышающей V 3 .
    20. а) Покажите, что решение (12) задачи о запасах, приведенное
    в разд. 18.5, является допустимым и оптимальным для двойственной
    задачи линейного программирования, отраженной в таблице на
    рис. 18.8. Преобразуйте решение (12) в правило принятия решений.
    б) Какими должны быть коэффициенты в таблице на рис. 18.8,
    если вероятность того, что спрос составляет 2, 3 или 4 единицы,
    равна V 3 ?
    в) Найдите оптимальную стратегию при условиях опросов, указанных в п. б).
    21. Рассмотрите прямую задачу (1) — (2) из разд. 18.3. Предположите, что имеется два узла (i = О, 1) и в каждом из них возможны
    три решения (d = 1,2, 3). Примите далее, что вероятности р (/ | i, d)
    равны
    3
    р (0 | 0,1) = V 4 , р (О | 0,2) = / 4 , р (0 | 0,3) = V 2 ,
    3
    р (1 | 0,1) = / 4 , р (1 | 0,2) = V 4 , Р (1 I 0,3) = V 2 ,
    р ( 0 | 1 , 1 ) = 1 / з , Р (0 | 1,2) = V 2 , p ( 0 | l , 3 ) = V 3 ,
    /7(1 |1,1) = 2 / 3 , р (1 | 1,2) = V 2 , р (1 | 1,3) = V 3 ,
    а затраты составляют
    с01 = 24, с 02 = 60,

    с 03 = 48,

    са = 36, с12 = 24, с13 = 45.

    Положите, кроме того, что а = Vs. Запишите подробно все уравнения. Постройте график в пространстве решений и покажите, что
    оптимальное решение получается при любых положительных г 0 и rj
    в подлежащей максимизации целевой функции г0уа

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    179

    22. Рассмотрите стохастическую модель замены оборудования
    из разд. 18.7.
    а) Дайте обоснование метода определения вероятностей переходов (2) и (3), а также ожидаемых затрат (4).
    б) Покажите, что оптимальная стратегия определяется выражением (5). Используйте для этого экстремальные уравнения (8) и (9)
    разд. 18.4 и значения величин (6).
    23. Объясните, как вы понимаете следующие термины:
    марковский процесс принятия
    решений;
    стационарная стратеги
    детерминированная стратегия;
    стохастическая модель выбора
    кратчайшего маршрута;
    марковское свойство;
    экстремальные уравнения;
    алгоритм итераций по крите,
    рию (алгоритм последовательных приближений в функциональном пространстве);
    алгоритм определения значения
    критерия;
    алгоритм итераций по стратеги(алгоритм последовательных
    приближений в пространстве
    стратегий);

    закон движения для системы;
    марковская цепь;
    стационарные вероятности;
    предельные вероятности;
    статистическое равновесие;
    рабочие характеристики;
    переходная коррекция;
    дважды стохастическая матрица;
    переходное состояние;
    циклическая цепь;
    множественная цепь;
    ограничения сохранения вероятностей;
    нормирующее ограничение.

    УПРАЖНЕНИЯ НА ПОСТРОЕНИЕ МОДЕЛЕЙ
    И РАЗВИТИЕ ВЫЧИСЛИТЕЛЬНЫХ НАВЫКОВ

    Во многих приводимых ниже упражнениях читатель должен
    построить модели, описываемые рекуррентными соотношениями
    динамического программирования. При этом очень важно точно
    определить смысл каждого используемого обозначения.
    24. Покажите для перечисленных ниже упражнений гл. 17, как
    ставятся соответствующие задачи в виде стохастической задачи
    выбора кратчайшего маршрута, аналогичной задаче управления
    запасами, описанной в конце разд. 18.2.
    а) Упражнение 23.
    з) Упражнение 47, п. б),
    б) Упражнение 38, п. б).
    и) Упражнение 49, п. а),
    в) Упражнение 39.
    к) Упражнение 51, п. а),
    л) Упражнение 52, п. а),
    г) Упражнение 41, п. а).
    м) Упражнение 53, п. а),
    д) Упражнение 42, п. а).
    н) Упражнение 56.
    е) Упражнение 42, п. б).
    ж) Упражнение 47, п. а).

    180

    ГЛАВА 18

    25. Рассмотрите экстремальные уравнения (1) из разд. 18.3.
    Предположите, что имеются нижняя и верхняя оценки Z/, и Ut соответственно по каждому неизвестному, т. е. //,- ^ г/; ^ U ;. Покажите, что нм га/ж каких условиях выбор решения d' £ D (i) не может
    быть оптимальным, если

    2 p(j\ i, d') aLj + cid< > min [ 2

    P (1 1 i, d) U} + ad] .

    Предположите, как можно использовать это неравенство для ускорения сходимости алгоритмов последовательного приближения.
    26. Рассмотрите модель управления запасами с неопределенными
    производственными затратами (упражнение 38, п. б), гл. 17). Примите а = 1 и найдите оптимальную стратегию при бесконечном плановом периоде.
    27. Рассмотрите пример стохастической задачи управления запасами, приведенный в таблице на рис. 18.3. Предположите, что максимальный объем производства составляет 6 и что С (6) = 28,5,
    а ее = 1.
    а) Примените алгоритм итераций по стратегии для отыскания
    оптимальной стратегии. (Указание: выберите исходную пробную
    стратегию на основе анализа таблиц на рис. 8.17 и 8.18.)
    б) Как было показано в конце разд. 18.4, разность /„ (i) —
    — /л (0) равна примерно wt. Определите, насколько точным является
    это приближение для каждого i и п = 3, 4, 5, используя значения
    «?;, найденные в п. а), и /n (i), взятые из рис. 8.17.
    28. Рассмотрите стохастическую модель управления запасами,
    приведенную в упражнении 40 гл. 17, п. б). Примите а — 1 и найдите оптимальную стратегию при бесконечном плановом периоде,
    используя алгоритм итераций по стратегии.
    29. Рассмотрите пример задачи управления запасами, приведенный в разд. 18.3. Предположите, что распределение спроса меняется
    от отрезка к отрезку следующим образом:
    £>[D = 2] = 4£- >

    Р[£> = 4 ] = —
    &

    (отрезок t),

    P I D = 1 ] = ~- ,

    P[D = 4]=*~

    (отрезок t + i).

    а) Покажите, как нужно изменить при этих условиях рекуррентное соотношение (2).
    б) Примите а = 1 и напишите соответствующие экстремальные
    уравнения.
    в) Найдите оптимальную стратегию при условиях, указанных
    в п. б).
    30. В каждом из указанных ниже пунктов найдите оптимальную
    стратегию пополнения запасов при бесконечном плановом периоде
    и а = 1, используя алгоритм итер'аций по стратегии.

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    181

    а) Упражнение 41, п. а), гл. 17.
    б) Упражнение 41, п. б), гл. 17.
    31. Рассмотрите стохастическую задачу управления запасами,
    приведенную в разд. 18.2. Предположите, что спрос на продукцию
    имеет место не на каждом отрезке. В частности, примем, что при
    наличии спроса на отрезке t спрос на продукцию возникает на отрезке t + s, где s = 1, 2, 3, с вероятностью qs = 1 / 3 .
    а) Измените соответствующим образом рекуррентное соотношение (7). (Заметим, что если в конце отрезка t уровень запаса равен /,
    а в следующий раз спрос возникает на отрезке t + s, то затраты
    на хранение / изделий увеличиваются в s раз.)
    б) Предположите, что плановый период бесконечен и что коэффициент дисконтирования равен а, где 0 ^ а < 1. Покажите, как
    следует при этих условиях изменить экстремальные уравнения (2)
    из разд. 18.3.
    в) Предположите, что плановый период бесконечен. Выведите
    соответствующие экстремальные уравнения при а = 1.
    г) Найдите оптимальную стратегию, используя результат, полученный в п. в).
    32. Студентка-общественница Н,, которая учится в колледже,
    расположенном за городом, и живет там в общежитии, субботние
    вечера проводит в городе, принимая участие в собраниях. Считая,
    что на собрания ее должен сопровождать мужчина, она каждую
    неделю обращается с этой просьбой к одному из трех своих приятелей-студентов В., Г. и Д. Для упрощения рассуждений предположим,
    что в случае отказа приятеля, к которому она обратилась, студентка
    отправляется в город одна. Предположим далее, что условные вероятности согласия сопровождать Н. зависят от того, к кому она обращалась с этой просьбой на предыдущей неделе и определяются следующей таблицей.
    а) Предположите, что до летних каникул осталось п недель.
    Постройте модель динамического программирования, с помощью
    которой можно отыскать стратегию, максимизирующую ожидаемое

    Условия поездки на
    предыдущей неделе

    Вероятность удовлетворения просьбы

    В.
    Без сопровождения
    Вместе с В.
    Вместе с Г,
    Вместе с Д.

    1/2

    д.

    Г.

    1/2

    3

    /4

    1/3

    1/4

    1/4

    2

    Vs

    3

    2

    1/2

    /5



    /5

    V5

    ГЛАВА 18

    182

    число случаев, когда студентка получает согласие любого из приятелей сопровождать ее в город.
    б) Предположите, что «плановый период» студентки не ограничен
    и что учитывается коэффициент дисконтирования а = 1. Запишите
    соответствующие экстремальные уравнения. Исходя из приведенных
    в таблице данных и указанных допущений, найдите оптимальную
    стратегию.
    в) Предположите, что при условиях, приведенных в п. б), студентка хочет максимизировать «ожидаемое число спутников в неделю». Выведите соответствующие экстремальные уравнения и найдите
    оптимальное решение.
    33. Директору одного универмага нужно принять решение о том,
    какого вида рекламное объяснение целесообразно поместить в местной воскресной газете. В частности, он может выбрать краткую
    рекламу (L) и подробную рекламу (Н). Еженедельные объемы продаж
    директор разделяет на три группы: средний объем (А), выше среднего (АА) и ниже среднего (ВА), считая, что объем продаж рассматриваемой недели зависит в вероятностном смысле как от объема продаж предыдущей недели, так и от категории рекламы. Он пользуется
    следующими данными, приведенными в таблице:
    Краткая реклама (L)
    Объем продаж
    предыдущей
    недели

    АА
    А
    ВА

    Подробная реклама (Н)

    Объем продаж текущей Объем продаж текущей
    недели
    недели
    АА
    А
    ВА
    АА
    А
    ВА

    0,2
    0
    0

    0,5
    0,6
    0,3

    0,3
    0,4
    0,7

    0,6
    0,4
    0,2

    0,3
    0,5
    0,7

    ОД
    0,1
    0,1

    Так, например, если объем продаж предыдущей недели относится
    к группе А, а уровень рекламы принадлежит к группе Н, то с вероятностью 0,4 объем продаж текущей недели составит АА, с вероятностью 0,5 составит А и с вероятностью 0,1 составит ВА. Предположите, что краткая реклама L стоит 100 долл., а подробная Н — 300 долл.
    и что недельная прибыль (без учета затрат на рекламу) при объеме
    продаж АА равна 1200 долл., при объеме А — 1000 долл. и при
    объеме В А — 800 долл.
    а) Примените алгоритм итераций по стратегии для отыскания
    стратегии рекламы, максимизирующей чистую еженедельную прибыль (с учетом затрат на рекламу) на бесконечном плановом
    периоде.

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    183

    б) В каком диапазоне изменения затрат на рекламу типа L остается оптимальной стратегия, найденная в п. а)?
    Тот же вопрос относительно затрат на рекламу типа Н.
    в) В каком диапазоне изменения недельной прибыли при объеме
    продаж А А остается оптимальной стратегия, найденная в п. а).
    Тот же вопрос при объеме продаж А, ВА и применительно к пп. г)
    и д) этого упражнения.
    г) Пусть Pi обозначает вероятность того, что объем продаж
    текущей недели составлял АА, а р2 — вероятность того, что он
    составлял А при условии, что объем продаж предыдущей недели
    равнялся А и уровень рекламы на той же неделе составлял Н, где
    Pi ~г Р2 — 0,9. Каков диапазон изменения p t , в пределах которого
    стратегия, найденная в п. а), остается оптимальной?
    д) Сформулируйте постановки прямой и двойственной задач
    линейного программирования и найдите оптимальное решение двойственной задачи. Разъясните смысл этого решения.
    34. Крупная фирма, производящая моющие средства и пользующаяся широкой известностью в связи с успехами в исследованиях
    по созданию новых продуктов и их рекламированию, выпустила
    на рынок новый высококачественный стиральный порошок, названный LYE. Руководитель, возглавляющий производство этого продукта, совместно с отделом рекламы разрабатывает специальную
    рекламную кампанию по сбыту порошка, для которой принят девиз
    «Порошок LYE нужен всем!» Как и все продукты фирмы, новый
    продукт в течение первого полугодия будет иметь высокий уровень
    сбыта. Руководитель полагает, что с вероятностью 0,8 этот уровень
    сбыта сохранится и в последующем полугодии при условии проведения особой рекламной кампании и что эта вероятность составит
    всего 0,5, если такую кампанию не проводить. В случае, если уровень сбыта снизится до среднего, у руководителя имеются две возможности. Он может дать указание о проведении исследований
    с целью улучшения качества продукта. При этом условии с вероятностью 0,7 уровень сбыта к началу следующего полугодия повысится
    до первоначального высокого значения. С другой стороны, можно
    ничего не предпринимать в отношении улучшения качества продукта. Тогда с вероятностью 0,6 в начале последующего полугодия уровень сбыта останется средним, однако вследствие изменений потребительских вкусов он может вновь подняться до высокого значения
    лишь с вероятностью 0,4.
    Если сбыт нового стирального порошка начинается на высоком
    уровне при обычной рекламе, то прибыли в течение полугодия равны
    19 единицам в случае, когда этот уровень сохраняется, и равны 13,
    если уровень сбыта падает. При проведении специальной рекламной
    кампании соответствующие показатели равны 4,5 и 2 единицам. Если
    начальный уровень сбыта окажется средним и при этом проводятся
    исследования с целью улучшения качества продукции, то прибыли
    составят 11 единиц в случае, когда уровень сбыта поднимается

    184

    ГЛАВА 18

    до высокого, и 9 единиц в противном случае. При сохранении
    продукта в неизменном виде соответствующие прибыли равны 13
    и 3 единицам. Предположим, что одна и та же проблема принятия
    решений относительно сбыта стирального порошка LYE повторяется
    через каждые полгода в течение бесконечного планового периода.
    а) Запишите необходимые экстремальные уравнения динамического программирования для случаев 0 ^ а < 1 и а = 1. (Примечание: оптимизация имеет смысл максимизации.)
    б) Запишите при условии использования результатов, полученных в п. а), прямую и двойственную задачи линейного программирования.
    в) Решите задачу для случая а = 1 с помощью алгоритма итераций по критерию.
    35. Задача управления денежным потоком. Предположим, что
    в примере упражнения 55 гл. 17 период планирования бесконечен
    и что распределение вероятностей ежедневных колебаний является
    стационарным. Запишите соответствующие экстремальные урвнения
    для случаев 0 ^ а < 1 и а = 1.
    36. Задача фирмы «Самосад» (разд. 11.3). Предположим, что
    в конце каждого отрезка весь лес полностью сгорает с вероятностью 1 — р.
    а) Сформулируйте постановку оптимизационной задачи для случая принятия единичного решения, предполагая, что сгоревший
    лес не имеет стоимости и что лесной пожар не может уничтожить
    спиленные деревья.
    б) Выполните то же задание при условии бесконечного планового
    периода, предполагая, что если лес сгорает до отрезка, на котором
    запланирована валка, то на следующем отрезке производится
    посадка нового леса. Приведите формулы определения оптимального числа k отрезков от посадки леса до валки для случаев
    0 < а < 1 и а = 1.
    37. Гидротехническая система состоит из плотины, а также приплотинного и вспомогательного водохранилищ. Емкость приплотинного водохранилища составляет К единиц. На каждом отрезке
    поступление воды в это водохранилище составляет S единиц, где
    фактическое количество S на отрезке t характеризуется распределением вероятностей pt (S). Если количество воды в водохранилище
    плюс величина S превышают К, то избыток сбрасывается. Пусть
    потребность в воде на отрезок t составляет Dt, причем эта потребность может удовлетворяться за счет воды из приплотинного либо
    из вспомогательного водохранилища, но не за счет слива. (Для простоты предположим, что в приплотинное водохранилище вода поступает до того, как определяется потребный расход.) Обозначим стоимость единицы количества воды, забираемой из приплотинного водохранилища на отрезке t, через с1(, а стоимость единицы воды из вспомогательного водохранилища —- через c 2 j, где cit < c 2 (. С практической точки зрения можно считать, что вспомогательное водохрани-

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    185

    лищс имеет неограниченную емкость, в связи с чем всегда существует
    реализуемая стратегия удовлетворения спроса на воду.
    а) Постройте модель динамического программирования для отыскания стратегии определения количеств воды, забираемых из приплотинного и вспомогательного водохранилищ, причем такой, которая минимизирует ожидаемые дисконтированные затраты в течение
    планового периода, состоящего из Т отрезков. (Пусть а обозначает
    при этом коэффициент дисконтирования на одном отрезке, где 0 ^
    <а<1.)
    б) Покажите, как нужно изменить постановку задачи п. а), если
    уровень спроса Dt определяется распределением вероятностей
    It (Dt).
    в) Покажите, как следует изменить постановки задач пп. а)
    и б), если распределение вероятностей St зависит от 5j_i, что обозначается pt (S | St_i). Дайте ответ на тот же вопрос в случае, когда
    распределение вероятностей St зависит от Si + S2 -f- . . . + St-\,
    t-i
    что обозначается pt (S \ 2 Sj)5=1
    г) Определите, становится ли проблема принятия решения проще
    или сложнее, если в пп. а) и б) все распределения вероятностей
    и затраты стационарны во времени и плановый период бесконечен.
    д) Предположите, что единица любого сбрасываемого избытка
    воды на отрезке t стоит vt. (Так, например, этот избыток может быть
    использован для орошения или направлен в другое водохранилище.)
    Покажите, как при этом условии нужно применить постановку п. а).
    38. Задача полицейского управления города
    Шумгам-сити
    (упражнение 25 гл. 2). Пусть pt (rt) — распределение вероятностей
    минимальной потребности в полицейских на отрезке t.
    Предположим, что точное значение г, известно до того, как принимается решение xt о выделении числа полицейских, назначаемых
    на дежурство.
    а) Примите, что коэффициент дисконтирования на одном отрезке
    равен а, где 0 ^ а < 1, а плановый период бесконечен. Постройте
    соответствующую модель динамического программирования.
    б) Покажите, упрощается ли модель п. а), если все распределения
    вероятностей идентичны, т. е. pt (г) = /? (г).
    в) Выведите экстремальные уравнения, которые должны удовлетворяться в пп. а) и б) при а = 1.
    39. В больнице города Шумгам-сити принят четкий порядок комплектования отделения неотложной помощи студентами-медиками.
    Однако иногда наблюдается поступление больных, превышающее
    среднюю норму. В связи с этим приходится привлекать к работе
    в отделении дополнительное число студентов. Больнице нужно выработать рациональную стратегию, позволяющую определять, когда
    следует привлекать к работе дополнительный контингент студентов,
    а также численность этого сверхнормативного штата. Предположим,
    что каждому дополнительно привлеченному студенту приписывается

    180

    ГЛАВА 18

    коэффициент затрат с, относимый к одному отрезку времени
    (15 мин.) Пусть w обозначает коэффициент затрат, определяемый
    временем, в течение которого больной ожидает медицинскую помощь
    (значение этого коэффициента оценивается в начале каждого отрезка). Состояние системы определяется числом больных, ожидающих
    оказания медицинской помощи. Исходя из этих соображений, администрация больницы принимает решение о привлечении дополнительного числа студентов s, которое требуется для неотложки. Предположим, что р (j \ г, s) есть вероятность того, что / больных будут
    •ожидать оказания помощи в начале следующего отрезка при условии, что i больных ожидали помощи в начале текущего отрезка
    и привлечено дополнительно s студентов. Накопленный опыт показывает, что число ожидающих больных ни разу не превысило 10.
    а) Напишите систему экстремальных уравнений, определяющих
    стратегию, которая минимизирует ожидаемые затраты на отрезке.
    б) Поясните, какие трудности возникают при оценке параметров
    модели.
    в) Объясните, как нужно изменить постановку задачи п. а),
    «ели в связи с изменением числа дополнительно привлекаемых студентов на отрезках t — 1 и t приходится нести затраты k (s f _i, st).
    40. Капитан Р., служащий в одной судоходной компании, командует судном, совершающим регулярные рейсы между двумя портами
    А и В. Предположим, что продолжительность рейса составляет
    1 сутки. Каждое утро капитан должен решить, стоит ли ему загружать судно имеющимся в наличии грузом и отправляться в порт
    назначения или обождать сутки в надежде, что на следующий день
    может подвернуться более выгодный груз. Пусть затраты на один
    рейс составляют c t , а затраты, связанные с суточным простоем судна
    в порту, составляют с 2 , где cd > с2. Предположим, что в порту А
    имеется два вида грузов, стоимостью ai и а а , где а 4 > я 2 - Обозначим вероятность того, что груз вида at имеется в наличии, символом
    Ра. (откуда 1 — ра есть вероятность того, что имеется только груз
    вида а2). Предположим также, что наличие груза в рассматриваемый
    день не зависит от его наличия в предыдущие дни (таким образом,
    •если капитан не уходит в рейс, то все равно сохраняется вероятность ра получения груза al на следующий день). Аналогично пусть
    стоимость грузов в порту В составляет & t и Й 2 , где & 4 > & 2 , и пусть
    рь — вероятность наличия груза bj.
    а) Постройте модель динамического программирования при
    -бесконечном плановом периоде. Рассмотрите случаи 0 ^ а < 1
    и а = 1.
    б) Запишите прямую и двойственную задачи линейного программирования, соответствующую модели п. а).
    в) Укажите, как нужно изменить модель п. а), если продолжительность рейса между портами составляет 3 суток. Тот же вопрос
    для случая, когда рейс из А в В занимает 3 суток, а из В в А —
    2 суток.

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    187

    г) Поясните, как нужно изменить модель п. а), если продолжительность каждого рейса t представляет собой случайную величину
    с распределением вероятностей р (t).
    41. Ежедневно утром производится проверка дорогостоящей
    машины с целью выявления, находится ли она в исправном состоянии, требует мелкого ремонта или нуждается в серьезном ремонте.
    Обозначим эти состояния О, 1, 2 соответственно. Если машина находится в совершенно исправном состоянии, то вероятность того, что
    она останется в таком же состоянии на начало следующего дня,
    равна р (0 | 0). вероятность того, что потребуется мелкий ремонт,
    равна р (1 | 0) и вероятность того, что возникает необходимость
    серьезного ремонта, равна р (2 | 0). В случае когда машина требует
    ремонта, фирма может прибегнуть к услугам двух ремонтных фирм,
    одна из которых (фирма F, гарантирующая качество ремонта) взимает плату М за мелкий ремонт и плату R за крупный. Вторая
    (фирма Т, не гарантирующая качества ремонта) взымает соответственно плату т и г, где т < М и г < R. Легко себе представить,
    что качество работ, производимых фирмой F, выше, чем у фирмы Т,
    что отражается значением вероятности полностью исправного состояния машины на начало следующего за ремонтом дня. Пусть решение
    d= 1 определяет выбор фирмы F и решение d= 2 — выбор фирмы Т.
    Обозначим через р (j \ i, d) вероятность перехода машины в состояние j на следующем отрезке (/ = О, 1, 2) при условии, что она находится в состоянии i на текущем отрезке (i = 1, 2) и принимается
    решение d (d = 1, 2).
    а) Запишите экстремальные уравнения динамического программирования при 0 ^ а < 1 и а = 1, которые определяют оптимальную стратегию на бесконечном плановом периоде и позволяют
    решить, какую фирму целесообразно привлечь для ремонта при
    известном состоянии машины.
    б) Запишите соответствующие прямую и двойственную задачи
    линейного программирования по аналогии с разд. 18.5.
    в) Примем а = 1 и предположим, что
    р (0 | 0)
    р (0 | 1,1)
    р (0 | 1,2)
    р (0 | 2,1)
    р (0 | 2,2)

    = 0,6,
    = 0,9,
    = 0,7,
    = 0,6,
    = 0,5,

    р (1 | 0) = 0,3,
    р (1 | 1,1) = 0,1,
    р (1 | 1,2) = 0,2,
    р (1 | 2,1) = 0,3,
    р (1 1 2,2) = 0,4,

    р (2 [ 0) = 0,1,
    р (2 | 1,1) = О, М = 14,
    р (2 1 1,2) = 0,1, т = 12,
    р (2 | 2,1) = 0,1, R = 21,
    р (2 | 2,2) = 0,1, г = 19.

    Найдите оптимальную стратегию и минимальные затраты на отрезке. (Используйте алгоритм итераций по стратегии.) Покажите
    соответствующее оптимальное решение двойственной задачи линейного программирования, поставленной в п. б).
    г) Предположите, что фирме F для выполнения крупного ремонта
    требуется 1 полный рабочий день, а фирме Т — 2 полных рабочих

    188

    ГЛАВА 18

    дня. Считайте далее, что фирма — владелец машины несет потери
    в размере с единиц за каждый день ее простоя. Покажите, как при
    этих условиях нужно изменить уравнения п. а). (Указание: определите
    два новых состояния — «первый день простоя», «второй день простоя».)
    д) Найдите оптимальную стратегию для п. г), используя данные,
    приведенные в п. в), и приняв с — 2.
    42. Задача об оптимальной замене оборудования. Фирма «Твердая память», выпускающая полупроводниковые запоминающие
    устройства, обслуживает несколько вычислительных комплексов
    на мысе Кеннеди. Один из таких дорогостоящих комплексов ежедневно по утрам подвергается проверке в рабочем режиме, после
    чего оценивается его состояние /, где / = 1, 2, . . ., /. Состояние
    j = / означает, что запоминающее устройство вышло из строя
    и должно быть заменено. Оценки результатов испытаний ранжированы таким образом, что состояние j лучше состояния ; + 1. Если
    в результате испытаний установлено, что запоминающее устройство
    находится в состоянии i (i < /), то фирма может принять решение
    о продолжении его эксплуатации и в течение рассматриваемого дня.
    Обозначим это решение через d — 1 и вероятность того, что устройство будет в состоянии j на следующее утро,— через р (/ | s, 1).
    Фирма может также принять решение о замене этого устройства, что
    обозначается как d = 2. Соответствующая вероятность перехода
    равна просто р (j | 2) и не зависит от текущего состояния i. Эксплуатационные затраты по комплексу, находящемуся в состоянии /,
    составляют Cj в расчете на один отрезок времени. При замене запоминающего устройства возникают затраты, равные с 0 . Если его состояние ухудшается до / к началу следующего отрезка, то необходимы дополнительные затраты с3.
    а) Запишите соответствующие экстремальные уравнения при
    условиях 0 ^ с с < 1 и а = 1 для бесконечного планового периода,
    позволяющие определять состояние, при котором целесообразна
    замена запоминающего устройства.
    б) Покажите, как нужно изменить уравнения п. а), если на замену запоминающего устройства требуется 1 или 2 рабочих дня. Пусть
    величина v0 определяет затраты, которые обусловлены простоем
    комплекса, связанным с заменой запоминающего устройства. (Указание: введите два новых состояния «замена в течение 1 дня», «замена
    в течение 2 дней).
    в) Рассмотрите задачу со следующими данными: / = 3, с 0 =
    = 100, q = 5, с 2 = 10, с 3 = 75 и
    р(1 |1,1) =0,7,
    р (2 | 1,1) = 0,2,
    р ( 3 |1,1) =0,1,
    р ( 1 |2,1) = 0,1,
    р (2 I 2,1) - 0,7,
    р (3 |2,1) = 0,2,
    р (1 | 2) = 0,8,
    р (2 \ 2) = 0,1,
    р (3 1 2) = 0,1.
    Запишите подробно уравнения п. а) при этих исходных данных
    и найдите оптимальное решение, используя алгоритм итераций
    по стратегии.

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    189

    г) Запишите прямую и двойственную задачи линейного программирования по аналогии с разд. 18.5 для примера, указанного в п. в),
    лри 0 д) Определите число переменных и уравнений в прямой и двойственной задачах линейного программирования, соответствующих
    п. а), при а < 1.
    е) Предположил!, что запоминающее устройство выпускается
    по специальному заказу для комплекса, установленного на мысе
    Кеннеди, и что с (х) — затраты на производство х единиц, где
    с (х) — нелинейная функция. Фирма «Твердая память» стремится
    найти оптимальную стратегию, которая включает как производственные решения, определяющие количество выпускаемых изделий,
    так и решения о замене. Объясните, почему эти решения взаимосвязаны с точки зрения затрат. Постройте модель динамического программирования, оптимизирующую одновременно решения обоих
    видов.
    Предположим, что величина h определяет издержки хранения
    в течение отрезка каждого изделия, находящегося в запасе к концу
    отрезка. (С целью упрощения примем, что 0 ^ а < 1.) Предположим
    далее, что максимальный объем партии изделий составляет X. Определите число переменных и уравнений в прямой и двойственной
    задачах линейного программирования, описывающих рассматриваемую ситуацию.
    43. Подразделение береговой охраны имеет в своем распоряжении корабль, выполняющий метеорологические и навигационные
    наблюдения в Северной Атлантике. На корабле используется два
    дорогостоящих электронных прибора, которые могут выходить
    из строя. Корабль может выполнять возложенные на него задачи
    лри отказе одного из приборов, однако качество решения при этом
    снижается. Если же выходят из строя оба прибора, то для доставки
    на корабль замены используется авиатранспорт. Имеется, однако,
    возможность отправки нового прибора морским путем в случае отказа одного из приборов.
    Предположим, что в качестве отрезка времени выбрана неделя.
    Пусть состояние 0 означает, что исправно работают оба прибора,
    состояние 1 соответствует отказу прибора 1, состояние 2 —- отказу
    прибора 2 и состояние 12 — отказу обоих приборов. Затраты, отвечающие состояниям 1, 2 и 12, равны соответственно FI, Рг и Fi 2 .
    Состоянию 0 отвечают нулевые затраты. Пусть далее решение d = О
    означает, что никакой замены не производится, d = 1 отвечает решению о замене прибора 1, отправляемого морским путем при затратах
    &!• d = 2 — решению о замене прибора 2, отправляемого также
    морским путем при затратах k2, d ~ 12 — решению о замене обоих
    приборов, доставляемых на корабль авиатранспортом при затратах
    & 12 . Заметим что d = 0 возможно при состояниях О, 1, 2, d = 1
    может относиться только к состоянию 1, d = 2 — только к состоя-

    190

    ГЛАВА 18

    ник» 2 и d = 12 — только к состоянию 12. Пусть соответственно
    р (] | i, d) обозначает вероятность того, что система находится в состоянии / на следующей неделе при условии, что ее состояние на текущей неделе равно i, и принимается решение d.
    а) Перечислите все возможные стратегии и опишите каждую
    из них. Объясните, почему в силу вероятностных и экономических
    допущений нет смысла заменять прибор, пока он находится в рабочем состоянии. Поясните, почему вероятность р (12 | 1,0) может
    оказаться не равной р (12 | 2, 0) и почему то же самое возможно для
    вероятностей р (12 | 0,0) и р (12 | 1,0) -р (12 | 2,0).
    б) Постройте модель динамического программирования для бесконечного планового периода, используя критерий минимизации
    ожидаемых затрат за неделю, и покажите, при каких условиях удовлетворяются экстремальные уравнения.
    в) Сформулируйте соответствующие прямую и двойственную задачи
    линейного программирования по аналогии с задачами из разд. 18.5.
    Укажите в явном виде те из величин р (j \ i, d), которые равны нулю.
    ДОПОЛНИТЕЛЬНЫЕ

    УПРАЖНЕНИЯ

    44. Рассмотрим стохастическую модель выбора кратчайшего маршрута из разд. 18.2. Предположим, что если принять решение d
    на отрезке t, когда система находится в состоянии, соответствующем
    узлу i, то система перейдет в узел / на отрезке t + hjj (d) с вероятностью р (] | i, d), где hij (d) — неотрицательное целое. Пусть
    а — коэффициент дисконтирования
    на
    одном
    отрезке,
    где
    О < с с < 1.
    а) Покажите, как при этих условиях изменится выражение (6)
    из разд. 18.2.
    б) Укажите, как обобщается этот пример на случай бесконечного
    планового периода при 0 ^ а < 1. Покажите, как для этого нужно
    изменить выражение (1) из разд. 18.3.
    в) Укажите, как обобщается этот пример на случай бесконечного планового периода при а = 1. Покажите, как нужно изменить
    выражение (8) из разд. 18.3. (Указание: обратитесь к детерминированному случаю, приведенному в конце разд. 12.3.)
    г) Предположите, что htj (d) — случайная величина. Обозначьте
    через q (h \ i, j, d) вероятность того, что величина Ъц (d) равна h.
    Покажите, как при этом следует изменить задачу п. б). [Примечание: применяя эту модель, нужно вычислять значение cid, чтобы
    учесть случайные изменения htj (d).]
    д) Покажите, как нужно изменить задачу п. в) при условиях,
    указанных в п. г).
    45. Покажите, что алгоритм итераций по критерию (8) из
    разд. 18.3 обеспечивает по крайней мере геометрическую сходип
    мость, т. е. что | у? — yi | 5$ а К при любом i и соответствующем
    выборе константы К.

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    191

    46. В разд. 18.4 утверждается, что теорема о стационарной стратегии не справедлива, если число возможных состояний бесконечно.
    Ниже иллюстрируется это утверждение.
    а) Рассмотрим сеть, содержащую узлы 1, 2, 3, . . . (рис. 18.10),
    Обратим внимание на то, что в каждом нечетном узле принимаются
    два решения (из узла выходят две дуги), каждому из которых отвечают затраты 1, а в каждом четном узле принимается одно решение,
    причем ему отвечают затраты 1 /и. Предположим, что процесс начинается в узле 1 и критерием являются минимальные затраты на отрезке при бесконечном плановом периоде. Покажите, что не существует

    Р и с . 18.10.

    какой-либо стратегии, дающей нулевые затраты на отрезке при бесконечном плановом периоде. Покажите далее, что при любой заданной стратегии существует другая стратегия, которой соответствуют
    строго меньшие (но положительные) затраты на отрезке. Следовательно, не существует оптимальной стратегии. (Указание: покажите,

    _
    2

    _
    3

    Ь

    "1
    5

    S

    Р и с . 18.11.
    как при заданном произвольно малом, но положительном числе е
    находится стратегия, обеспечивающая затраты, равные или меньшие е.)
    б) Рассмотрим сеть, содержащую узлы 1, 2, 3, . . . (рис. 18.11).
    Пусть действие 1 означает переход из узла i в узел i -\- 1, а действие
    2 — переход из узла i обратно в этот же узел. Предположим, что
    процесс начинается в узле 1 и критерием является минимум ожидаемых затрат на отрезке при бесконечном плановом периоде. Покажите, что любой стационарной стратегии без рандомизации соответствуют строго положительные затраты на отрезке. Покажите также,
    что существует нестационарная стратегия без рандомизации, которой соответствуют нулевые затраты на отрезке. (Указание: рассмотрите, что произойдет, если после того, как система впервые оказалась в состоянии i, предпринимается действие 2 в течение i последующих отрезков, а затем предпринимается действие 1.) Покажите
    далее, что существует стационарная рандомизированная стратегия,

    192

    ГЛАВА 18

    при которой ожидаемые затраты на отрезке равны нулю. (Указание:
    рассмотрите, что произойдет, если в каждом узле i выбирается действие 1 с вероятностью Hi. Запишите марковскую цепь при этой стратегии и выясните, существуют ли стационарные вероятности.)
    47. Рассмотрите теорему о стационарной стратегии из разд. 18.4
    при а = 1. Докажите предложение, что всегда существует оптимдльная стратегия без рандомизации.
    48. Рассмотрим экстремальные уравнения (10) из разд. 18.4 при
    а == 1. Предположим, что используется стратегия d*. Для упрощения обозначений символ d* при определяемых ниже величинах М;0
    и С{0 опущен. Пусть Mio обозначает ожидаемое число отрезков,
    за которое система переходит в состоянии 0 при начале движения
    из состояния i (иногда эту величину называют математическим
    ожиданием продолжительности первого перехода). Величину М 0 о
    можно назвать ожидаемой продолжительностью цикла для состояния 0. Аналогично обозначим через С,о ожидаемые затраты (доход)
    за то же число отрезков. Величину С00 можно назвать ожидаемыми
    затратами цикла для состояния 0.
    а) Покажите, что величины Мю и Cio можно вычислить с помощью линейных уравнений
    т
    j=i
    т
    .,

    I

    X1

    п (1 I i

    iO — ^id* "т" / i /^ V/ I >
    3=1

    rl*\ f

    /^JO'

    i

    Л

    ^ — ^i

    4

    Т

    •*• ? . . . , . / .

    (Указание: переход из состояния i в состояние 0 происходит по крайней мере в течение одного отрезка. Если первый переход происходит
    в состояние /, j =/= 0, то ожидаемое дополнительное число отрезков
    таково, что можно считать будто система начинает движение
    из состояния ;'. Аналогично cj d * есть ожидаемые затраты на первом
    отрезке. Если первый переход совершается в состояние /, где / =/= О,
    то ожидаемые дополнительные затраты таковы, что можно считать
    за начало движения системы состояние /•)
    б) Рассмотрите следующие величины в качестве решения экстремальных уравнений (10)

    *^^w
    M
    w

    c

    wl = Cio—c*Mio.

    Интерпретируйте эти величины. Докажите, что соответствующее
    значение w0 равно 0. Используйте формулы п. а), чтобы показать,
    что эти величины действительно удовлетворяют уравнениям (10).
    в) Вычислите значения Mio и Cio при i = О, 1, . . ., 4 для примера задачи о запасах, приведенной в таблице на рис. 18.3, используя при этом оптимальную стратегию, указанную в таблице на
    рис. 18.7 (п = 2).

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    193

    г) Вычислите значения всех величин Mio и С г о Д л я оптимальной
    стратегии, найденной в упражнении 26. Вычислите также значения
    с* и Wi в соответствии с условиями п. б).
    49. Одна машиностроительная фирма эксплуатирует сложный
    станок, который иногда работает вполне исправно, а иногда нет.
    Обозначим через ;' = 0 состояние исправно работающего станка,
    а через / = 1 состояние, когда станок нуждается в ремонте. Если
    станок используется в случае, когда он абсолютно исправен, то ежедневные производственные затраты составляют с0. В случае же,
    когда станок используется, находясь в неисправном состоянии, ежедневные производственные затраты равны с1; где ci > c0. Определить истинное состояние станка можно лишь с помощью дорогостоящих испытаний деталей, обработанных на нем в течение дня.
    Обозначим через / затраты на проведение таких испытаний. В результате ремонта станок с гарантией переводится в полностью исправное
    состояние, причем стоимость ремонта составляет R единиц.
    Обозначим через р вероятность того, что станок находится в абсолютно исправном состоянии в начале следующего отрезка при условии, что он находился в таком состоянии в течение текущего отрезка,
    где за длину отрезка принят один рабочий день. Предположим, что
    если станок находится в состоянии, требующем ремонта, то он остается в этом состоянии и в дальнейшем.
    Обозначим через Р вероятность того, что станок находится в абсолютно исправном состоянии на начало некоторого отрезка. Объясните, почему значение Р можно использовать для представления состояния производственной системы. Приведите рекуррентное соотношение динамического программирования при бесконечном плановом
    периоде (приняв 0 ^ а < 1), определяющее, что целесообразно
    делать: использовать станок в течение рабочего дня без проведения
    испытаний продукции, провести такие испытания или провести
    ремонт при заданном текущем значении Р. (Указание: покажите, что
    вероятность того, что станок абсолютно исправен на начало следующего отрезка без проведения испытаний и ремонта, равна Pp.)
    Многие важные примеры моделей, рассмотренных в данной главе,
    отличаются особой структурой, которую можно использовать для
    упрощения постановки задач в терминах марковских цепей, а также
    для отыскания оптимального решения. В двух заключительных
    упражнениях дается представление о некоторых методах использования особенностей структуры моделей.
    50. Сепарабельные марковские задачи принятия
    решений.
    Рассмотрите стохастическую модель выбора кратчайшего маршрута
    при бесконечном плановом периоде, аналогичную модели, рассмотренной в разд. 18.3. Предположим первоначально, что имеются узлы
    (или состояния) i = l, 2, . . . , Т и что в каждом состоянии
    возможно принять К различных решений. Особая структура этих
    К решений определяется экстремальными уравнениями, которые

    lf)4

    ГЛАВА 18

    должны ими удовлетворяться. Вот эти уравнения:
    т
    т
    yi = min { 2 р (i \ 1) cez/j- + сц + Ьь . . . , 2 Р О' 1 •&)
    5= 1

    3 =1

    Т

    min [ S j p ( / | { , d)a^ + c id ]}.

    i = l, 2, . .., Т1,

    где 0 ^ a < 1.
    а) Интерпретируйте экономические и структурные допущения
    относительно К различных решений. Пусть NI есть число решений
    в подмножестве D (i). Определите число ограничений и переменных
    в соответствующих прямой и двойственной задачах линейного программирования, аналогичных (1) и (2) из разд. 18.5.
    б) Покажите, что, введя дополнительный узел 0, можно получить решение приведенных выше экстремальных уравнений, решив
    вместо них уравнения
    т
    т
    г/о = min [ 2 /> (Л 1) «!/; + &ь •••. ^£iP (j \K)ayj+bK],
    г=1
    ?=1
    т

    г/г = min {г/о + яг,

    min [ 2 Р (j \ i, d) ayj + cid]},

    i = 1, 2, . . ., Т.

    в) Запишите прямую и двойственную задачи линейного программирования, аналогичные (1) и (2) из разд. 18.5, и соответствующие
    экстремальным уравнениям п. б). Определите число переменных
    и ограничений в этих задачах.
    г) Примите 2 г = а, -\- у0 — yt, i = 1, 2, . . ., Т та покажите, как
    исключить Т линейных ограничений п. в) путем такой замены переменных. (Указание', вспомните, что величины гу г не ограничены по знаку.) Объясните, как следует изменить постановку задачи, если К
    различных решений можно принять только в узлах i = 1, 2, . . ., t,
    где t < Т.
    д) Выведите соответствующие экстремальные уравнения при ос =
    = 1, аналогичные уравнениям п. б), и приведите упрощенную прямую
    задачу линейного программирования, аналогичную задаче п. г).
    е) Примените полученные в предыдущих пунктах результаты
    для построения модели замены оборудования, подобной моделям
    из разд. 17.7 и 18.7 [Указание: можно принять, что узел i отражает
    возраст оборудования на начало рассматриваемого отрезка до того,
    как принимается решение заменять его или нет. Запишите подробно
    упрощенную модель линейного программирования, соответствующую п. г).]
    ж) Продолжая рассмотрение вопросов, содержащихся в п. е),
    запишите подробно модель линейного программирования, соответствующую п. д), используя данные примера, который приведен
    в таблицах на рис. 17.6 и 18.9. Найдите соответствующее оптимальное решение.

    ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ

    195

    з) Примените полученные выше результаты для построения модели контроля качества в упражнении п. а). Подробно запишите упрощенную модель линейного программирования, соответствующую п. г).
    51. Сепарабельные марковские задачи принятия решений
    (продолжение). Рассмотрим стохастическую модель выбора кратчайшего маршрута с бесконечным плановым периодом, подобную
    модели из разд. 18.3. Прежде всего предположим, что в модели
    имеются узлы (или состояния) i = 1, 2, . . ., Т и что в каждом
    состоянии можно принять К различных решений. Особая структура
    этих К решений определяется экстремальными уравнениями, которые должны ими удовлетворяться. Вот эти уравнения:

    т
    min [ S Р (i \ i, d) ayt + cid] } ,
    z/i= min

    3=1

    i = 1 , 2, . . . , t ,

    /

    где 0 ^ а < 1 и ^ Г ^ < ^ Г — К. (Предположим, что значения всех
    величин а г , Ъ^жс^ гарантируют существование однозначного конечного решения.)
    а) Интерпретируйте экономические и структурные допущения
    относительно К различных решений. Пусть Nt есть число решений
    в подмножестве D (г). Определите число ограничений и переменных
    в соответствующей прямой модели линейного программирования,
    аналогичной модели (1) — (2) из разд. 18.5.
    б) Покажите, что, введя дополнительный узел 0, можно получить решение приведенных выше экстремальных уравнений, решив
    вместо них уравнения

    yt+K
    т
    min [ 2 Р (Л i, d)ctyj + cid]} , 1 = 1 , 2 , . . . , * ,

    = min [ 2 p ( j \ i , d) ay j -\-dd],

    i = t + l, - . . , T.

    в) Запишите прямую задачу линейного программирования, аналогичную (1) и (2) из разд. 18.5 и соответствующую экстремальным
    уравнениям п. б). Определите число ограничений и переменных
    в этой задаче.
    г) Покажите, как исключить Т линейных ограничений в задаче
    п. в) путем замены переменных

    Zi = Яг + г/о — Уп

    i = 1, 2, . . ., t.

    196

    ГЛАВА 18

    Покажите, как можно исключить еще К линейных ограничений,
    вторично заменив переменные следующим образом:
    Zt+h = at+k+bh — z i+ft , k = 1, 2, . . ., К.
    д) Выведите соответствующие экстремальные уравнения при
    а = 1, аналогичные уравнениям п. б), и запишите упрощенную прямую задачу линейного программирования, подобную задаче п. г).
    е) Рассмотрим стохастическую модель управления запасами,
    в которой р (q) обозначает вероятность того, что спрос равен q (спрос
    имеет независимое и одинаковое распределение на различных отрезках), S + сх [х = 1, 2, . . ., где S > 0] — покупную цену изделий,
    Н (I — д) — функцию издержек хранения и штрафа, где I — уровень
    запаса после размещения заказа (в предположении, что поставки
    осуществляются немедленно), но до момента возникновения спроса.
    Допустим, что при превышении спроса q над уровнем I избыточный
    спрос теряется.
    Допустим, что стремятся найти стратегию следующего вида.
    Если начальный уровень запаса превышает 10, то заказ на пополнение не размещается. Если начальный уровень запаса меньше или
    равен 10, то заказ на пополнение может быть размещен (но не в обязательном порядке). Уровень запаса после размещения заказа, но
    до момента возникновения спроса не может превышать 15. (Примем,
    что в начале планового периода уровень запаса равен 0.)
    Постройте модель, описываемую системой экстремальных уравнений, аналогичных уравнениям п. а). Определите число ограничений и переменных в соответствующей прямой модели линейного программирования. Покажите, как свести задачу к модификации
    п. б), и вновь определите число ограничений и переменных в соответствующей прямой задаче линейного программирования. Используйте результаты п. г) и запишите подробно соответствующую модель
    линейного программирования. [Указание: примите at = —ci и bh~
    = S + (k + 10) с + 2 H (k + 10 - q) p (q).]
    q

    ж) Рассмотрите пример п. е). Покажите, что задачу можно также описать экстремальными уравнениями упражнения 50 [пп. а)
    и б)]. Определите число ограничений и переменных, соответствующих
    прямым задачам линейного программирования. Запишите полностью соответствующую упрощенную модель линейного программирования для г). Является ли такая модификация более выгодной, чем
    в п. е)? Дайте необходимые пояснения.

    ГЛАВА 19

    Стохастические модели управления запасами

    19.1. НОВЫЙ ПОДХОД

    В предыдущих главах основное внимание уделялось вопросам
    построения наиболее распространенных математических моделей
    и описанию алгоритмов, позволяющих находить для них оптимальные решения. Так, например, в гл. 2, 6, 8, 10 и 11 рассматривались
    модели линейного программирования, сетевые модели и модели
    многошаговой структуры; изложению методов нахождения численных решений для такого рода моделей посвящены гл. 4, 7 и 12. Все
    модели и алгоритмы сопровождались конкретными примерами, позволяющими составить определенное представление о реальных ситуациях, в которых задачи организационного управления решаются
    с помощью методов исследования операций.
    В гл. 19 и 20, а также в приложениях II и III вместо подхода
    «от модели — к ее приложению» принят противоположный подход.
    Здесь рассматриваются конкретные классы задач организационного
    управления, при решении которых оказалось целесообразным использовать методы исследования операций. К этим задачам относятся управление запасами и проектирование систем массового обслуживания. При этом математические модели и алгоритмы строятся
    применительно к условиям, характерным для этих вполне конкретных задач, а получаемые в результате решения, как правило, представляют собой не просто плановые «ориентиры», а определяют
    оптимальную стратегию «поведения» в реальной обстановке.
    Со строго формальной точки зрения каждую из получаемых ниже
    моделей и каждый из используемых алгоритмов можно, разумеется,
    поставить в соответствие определенному классу моделей и алгоритмов, рассмотренных нами в предыдущих главах. Тем не менее возникают новые аспекты проблемы, которые выявляются лишь путем
    анализа физической природы модели и не определяются самим фактом ее принадлежности к той или иной категории (например, к категории линейных, нелинейных или динамических оптимизационных
    моделей). Далее нам придется полностью использовать специфические структурные характеристики рассматриваемых моделей.
    Перемещение акцента в этом направлении требует от нас соответствующего пересмотра самого подхода к процессу исследования.
    Нам следует теперь стремиться к выявлению тех фундаментальных
    понятий, которые лежат в основе анализа большинства задач, относящихся к вполне конкретной сфере организационного управления.

    198

    ГЛАВА 19

    Поскольку множество ситуаций, возникающих в практике организационного управления в любой сфере деятельности, неисчерпаемо,
    представить все модели, требующиеся для описания всех возможных
    стечений обстоятельств, не удалось бы ни в одной книге (не говоря
    уже о книге, претендующей лишь на изложение основ исследования
    операций). Однако читатель сможет ознакомиться с основными идеями, формирующими остов моделей упомянутого выше типа; изложению этих идей посвящена настоящая и следующая главы, а также
    приложения II и III.
    При изучении указанного материала читатель должен помнить
    о необходимости ответить на следующие вопросы:
    1. Принятие каких управляющих решений рассматривается
    в данной главе? Какая задача организационного управления при
    этом исследуется?
    2. В силу каких причин реальная организационно-управленческая ситуация оказывается настолько сложной, что для принятия
    управляющих решений приходится прибегать к помощи операционной модели? Какие элементы этой ситуации учитываются в модели?
    Как наличие этих элементов сказывается на решении? Какие элементы задачи моделью не учитываются?
    3. Чем отличается управляющее решение высокого качества от
    плохого управляющего решения?
    4. Как бы вы использовали результаты анализа, если вы оказались на месте руководителя? Каким образом вы хотели бы (или были вынуждены) «подправить» полученный результат, принимая во
    внимание то обстоятельство, что ряд факторов моделью в явном виде
    не учитывается?
    Следует иметь в виду, что ответы на эти вопросы должны отражать «динамический» характер рассматриваемых ниже организационно-управленческих задач, поскольку условия в них меняются
    с течением времени.
    19.2. НАУЧНЫЙ ПОДХОД К РЕШЕНИЮ ЗАДАЧИ
    УПРАВЛЕНИЯ ЗАПАСАМИ

    Читатель, привыкший видеть запасы повсюду и постоянно, возможно, не задумывается над тем, что все эти запасы являются непосредственным результатом принятия управляющих решений. Он,
    по-видимому, вспоминает об этом лишь в тех случаях, когда, зайдя
    в магазин или в лавчонку, внезапно обнаруживает, что требуемые
    ему продукты или изделия отсутствуют. Тогда он, вероятно, с раздражением говорит: «Кто-то допустил просчет». Если отсутствующим
    товаром оказалась новогодняя поздравительная открытка и этот
    печальный факт обнаруживается 31 декабря, то не исключено, что
    лицом, допустившим просчет, является сам разочарованный покупатель. Вряд ли мы увидим в книжной лавке большой запас такого товара, прогнозируемый спрос на который пренебрежимо мал.

    СТОХАСТИЧЕСКИЕ МОД ЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    199

    Разумеется, сам факт возникновения задач регулирования запасов буквально во всех отраслях промышленности еще не является
    достаточным доказательством необходимости применения методов
    исследования операций для решения этих задач. Чтобы промышленная фирма согласилась пойти на этот шаг, требуется выполнение по
    по крайней мере одного дополнительного условия: как вероятность
    неправильного решения вопросов, связанных с управлением запасами, так и отрицательные экономические последствия такого решения должны быть достаточно ощутимыми, чтобы появились основания для проведения научного анализа проблемы. Например, для
    большого магазина канцелярских товаров может оказаться весьма
    выгодной разработка, скажем, оптимальной стратегии регулирования
    запасов карандашей, тогда как намерение построить оптимальную
    стратегию управления запасом карандашей в чьем-либо письменном столе было бы довольно глупой затеей. Обоснование этого
    утверждения, по-видимому, не вызовет у читателя никаких затруднений.
    Чтобы не создать у читателя ложной картины слишком большим
    числом примеров из области розничной торговли, сразу же отметим, что наиболее распространенные приложения моделей управления запасами относятся к сфере промышленного производства
    и оптовой торговли, хотя сложившиеся ранее традиции начинают
    быстро изменяться. Встречаются, в частности, научно обоснованные системы управления запасами, используемые на крупных промышленных предприятиях в связи с регулированием процедур складирования сотен, а порой даже тысяч различных видов сырья, полуфабрикатов и готовой продукции. В такого рода системах принятие
    всех управляющих решений относительно пополнения запасов возлагается, как правило, на очень ограниченное число людей. Читателя, вероятно, заинтересует, каким образом выведенная математическим методом стратегия управления запасами может улучшить
    решения, принимаемые опытными руководителями. Ответ на этот
    вопрос приводится ниже.
    Комплексный подход. Во многих случаях при решении вопроса
    относительно пополнения запасов того или иного вида сырья или
    готовой продукции руководителю действительно удается превзойти
    возможности, заложенные в математической формуле. Однако для
    этого он должен дать точный прогноз потребностей в рассматриваемом виде сырья (или готовой продукции) и в любой момент времени
    знать, какое время необходимо для реализации заказа на пополнение
    запаса. Если речь идет о таком виде сырья, полуфабриката или готовой продукции, который представляет для фирмы значительный
    интерес (либо потому, что он относится к числу дорогостоящих, либо
    в силу того, что он играет существенную роль в производственном
    процессе), то наилучшей из всех стратегий управления может оказаться непосредственный контроль за уровнем соответствующих
    запасов со стороны руководителя. Но число товаров, которое

    200

    ГЛАВА 19

    может держать под постоянным прицелом один человек, весьма ограничено. Поскольку большинство фирм держит запасы огромного
    количества различных видов сырья, полуфабрикатов или готовой
    продукции, многие из них с неизбежностью регулируются либо стереотипным путем, либо наобум. Для такого рода мулътиноменклатурных складских систем исследование операций позволяет
    выработать способы управления запасами, являющиеся рациональными с экономической точки зрения.
    Устанавливая продуманные в методическом плане процедуры
    пополнения большинства складируемых изделий, научный подход
    к решению проблемы управления запасами освобождает руководителя от необходимости заниматься такого рода вопросами и дает ему
    возможность приложить свои способности к анализу особых ситуаций, где его опыт исключительно ценен. Таким образом, эффективно
    функционирующая научная система управления запасами предполагает непременное гармоническое сочетание суждений, генерируемых человеком, и математических формул.
    Простота операционной модели. Модели управления запасами
    относятся к числу весьма редко встречающихся операционных моделей, для которых результирующие оптимальные решения могут быть
    реализованы в режиме быстрой смены ситуаций (когда, например,
    условия меняются ежедневно). Это объясняется тем, что применительно к управлению запасами суть оптимального решения состоит
    в том, чтобы сформулировать два следующих правила:
    1) Правило, позволяющее определить, когда (т. е. при наличии
    каких условий) запасы подлежат пополнению.
    2) Правило, позволяющее определить объем пополнения запасов.
    Другими словами, эта стратегия дает возможность рассчитывать
    время и объем каждого очередного пополнения запасов, т. е. основные параметры управляющего решения. Независимо от степени
    сложности математической модели и алгоритма решения задачи,
    с помощью которых отыскивается такого рода стратегия, ее формулировку в виде правил указанного выше типа всегда легко интерпретировать. В ряде случаев формирующие стратегию правила задаются
    в виде таблиц, и от руководителя требуется лишь простановка значений различного рода показателей, таких, как стоимость единицы
    складируемой продукции или средний уровень спроса. Нередко же
    система является полностью автоматизированной; в этих случаях
    ЭВМ постоянно следит за текущим уровнем запасов и в надлежащее
    время заполняет бланк заказа на поставку требуемой продукции
    с указанием точных количественных параметров.
    Хотя модели управления запасами и получили достаточно
    широкое распространение, все еще встречаются многочисленные ситуации, в которых управляющие решения по вопросам складирования
    товаров принимаются волевым порядком, несмотря на то что отрицательные экономические последствия ошибок могут оказаться весьма существенными. Основная причина того, что в ряде организаций

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    201

    запасами продолжают распоряжаться наобум, заключается в том,
    что условия функционирования такого рода организаций еще недостаточно усиленно анализируются специалистами в области исследования операций. Если же и удавалось в некоторых случаях
    добиться решения задачи, то оно выглядело гораздо более сложным по
    сравнению с решениями, содержащими в себе лишь два указанных
    выше правила. Следовательно, практическое приложение такого
    рода решения сталкивалось соответственно с большими трудностями.
    Задача, как правило, чрезвычайно усложняется тогда, когда наблюдается существенная взаимозависимость между уровнями потребностей в товарах различных наименований (когда, например, имеет
    место взаимозаменяемость изделий различных видов), а также при
    наличии нескольких мест складирования одного и того же вида изделий (когда, например, имеется большой районный склад и несколько складских помещений непосредственно при торговых точках).
    Со временем исследование операций успешно справится с решением
    и такого рода сложных задач.
    Цель изучения. В оставшейся части данной главы, а также в приложении II будет предложено несколько форм записи для моделей
    управления запасами. Каждая из рассмотренных ниже формулировок
    является прототипом структуры целого класса моделей, исследованием которых занимались многие операционисты-теоретики. Разобравшись в основных подходах к построению такого типа моделей,
    читатель получит достаточно полное представление о наиболее
    существенных положениях теории управления запасами вообще.
    Это означает, что ему удастся освоить все то, что в совершенстве
    следует знать руководителю, а именно цели, возможности и пределы
    возможностей научного подхода к управлению запасами. Более
    того, после проработки представленного здесь материала читатель
    сможет при желании заняться изучением более серьезных работ,
    посвященных операционным моделям управления запасами.
    19.3. ОСНОВНЫЕ ФАКТОРЫ, УЧИТЫВАЕМЫЕ ПРИ АНАЛИЗЕ
    СИСТЕМ УПРАВЛЕНИЯ ЗАПАСАМИ

    Какие соображения являются существенными для принятия решения относительно того, когда и в каком объеме складировать тот или
    иной товар? Факторы, играющие в этой связи наиболее важную
    роль, распадаются на три основные группы. Здесь эти факторы
    обсуждаются с общих позиций; в последующих разделах они уточняются в рамках конкретных математических моделей. Чтобы
    добиться большей ясности изложения, рассмотрим фирму «Блеск»,
    ведущую оптовую торговлю различного рода металлоизделиями
    (алюминиевыми стержнями, спиралями, листами, пластинами
    и т. д.), которые она приобретает у выпускающей алюминиевые изделия фирмы-поставщика. Если читатель захочет вместо фирмы «Блеск»
    рассмотреть какую-либо другую фирму, которой приходится решать

    202

    ГЛАВА 19

    проблемы регулирования запасов, то при установлении соответствующих аналогий у него не должно возникнуть никаких трудностей.
    Спрос и предложение. Фирме, занимающейся оптовой торговлей,
    естественно, требуется тем или иным способом прогнозировать
    потребности своих собственных клиентов в каждом конкретном виде
    изделий. Такого рода прогноз непосредственно отражается на объемах оформляемых фирмой заказов; результат прогнозирования чаще
    всего удается представить в виде некоторого распределения
    вероятностей. На протяжении всей этой главы предполагается, что
    уровни спроса на различные виды товаров взаимно независимы.
    Даже в тех случаях, когда это допущение строго не выполняется,
    оно является вполне адекватным приближением к реальности и может служить основой для разработки стратегии управления запасами. Более того, распределение вероятностей для уровней спроса
    предполагается независимым от характера правил пополнения запасов, а также от всех прочих управленческих действий. С помощью
    более утонченных математических методов анализа удается строить
    оптимальные стратегии управления запасами, полностью абстрагируясь от приближенного характера принимаемых допущений.
    Использование аппарата теории вероятностей для описания прогнозируемых уровней спроса — удобный способ интегрального представления (в виде единой формулы) как частичных сведений об исследуемом процессе, так и частичных пробелов в наших знаниях
    о нем. Устанавливая вид и задавая параметры распределения
    вероятностей (такие, как среднее значение для пуассоновского распределения или среднее значение и дисперсию для биномиального
    распределения), мы тем самым утверждаем, что нам известны относительные вероятности уровней спроса. Таким образом, формулируя тот или иной закон вероятностного распределения, мы даем компактное представление той степени неопределенности относительно
    будущих уровней спроса, в условиях которой нам приходится действовать.
    Торговой фирме-оптовику требуется также знать срок запаздывания поставки, т. е. то время, которое проходит с начала операции
    пополнения запасов до того момента, когда заказанная продукция
    оказывается в наличии и может быть использована для удовлетворения потребительского спроса. Соответствующий интервал, разумеется, включает все то время, которое требуется фирме-поставщику
    для выполнения операций, связанных с исполнением полученного
    заказа, включая время отгрузки и транспортировки заказанных изделий; в этот интервал входит также время, которое тратится самой
    фирмой «Блеск» на оформление заказа на поставку, а также на прием
    и распаковку прибывших изделий. Продолжительность срока
    запаздывания поставки может быть определена в зависимости от конкретных обстоятельств либо полностью детерминированным образом, либо в вероятностном смысле.

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    203

    В ряде случаев может иметь место расхождение между числом товарных единиц, указанным в заявке, и числом фактически полученных единиц. Так, например, для некоторых производственных процессов существенное значение имеют потери от брака и фирме-поставщику может понадобиться доставлять в пункты назначения
    определенный резерв сверх заказанного числа изделий. Такого
    рода ситуации в этой главе не рассматриваются. Для их исследования
    требуется применение более сложных методов анализа.
    Экономические показатели, учитываемые при управлении запасами. Если обратиться к крупномасштабным системам управления
    запасами, то нетрудно убедиться в том, что большими партиями
    на склады завозятся обычно те изделия, потребность в которых возникает довольно часто. Это объясняется целым рядом причин.
    Наиболее важная из них заключается в том, что при малых объемах
    поставок наблюдалось бы возрастание их частоты и, следовательно,
    возросли бы накладные расходы, связанные с составлением и пересылкой заказов (т. е. так называемые организационные расходы, или
    затраты на оформление заказов). Вторая (менее очевидная) причина
    состоит в том, что при больших объемах заказов фирме удается устранить частое возникновение такой ситуации, когда ее запасы оказываются полностью исчерпанными. В ряде случаев являются существенными и другие соображения, которые не учитываются в рамках
    моделей, рассматриваемых в данной главе. К их числу относятся
    ситуации, когда фирма-поставщик делает скидку цены в зависимости от объема заказа или лимитирует нижний предел объема
    поставки. Возможны также и такие случаи, когда прогнозируется
    повышение цен на товары, приобретаемые у данной фирмы-ноставщика.
    Какие соображения заставляют ограничивать объем заказа на
    поставку? Основным фактором являются затраты на содержание
    запасов. Сосредоточение изделий на складах сопряжено с отрицательными экономическими последствиями в силу того, что в этом
    случае происходит «замораживание» капитала, которому можно было
    бы найти выгодное применение. Кроме того, это влечет за собой затраты на хранение, страхование и т. д. К числу других лимитирующих элементов, которые учитываются в реальных условиях (но не
    фигурируют в рассматриваемых ниже моделях), относится возможная порча товаров, хранящихся на складах, их устаревание, ограниченность бюджета фирмы, недостаток в складских помещениях
    и т. п.
    Пока мы не касались вопроса о том, какие виды товаров (сырья,
    полуфабрикатов или готовой продукции) целесообразно иметь на
    складах торговой фирме-оптовику. Совершенно очевидно, что даже
    универсальные магазины держат на своих складах далеко не все,
    что может найти спрос у покупателей. При этом, по-видимому, в каждом случае, когда фирма не имеет в наличии запрошенного клиентом товара, можно говорить о потере прибыли или о своего рода
    штрафе за неудовлетворение спроса. Несостоявшийся акт продажи

    20/i

    ГЛАВА 19

    того или иного товара реальному покупателю, естественно, равносилен снижению доходов торговой фирмы. Но фирма терпит экономический ущерб даже тогда, когда покупатель готов ждать исполнения своего заказа, поскольку в этом случае торговая фирма оказывается вынужденной идти на некоторые дополнительные издержки,
    связанные с учетом неудовлетворенных заказов и их удовлетворением при оформлении последующих заявок на пополнение запасов.
    Поэтому она содержит запасы тех товаров, отсутствие которых на
    складе может принести ей серьезный ущерб; этому выводу (формулировка которого носит пока чисто качественный характер) в каждом из рассмотренных ниже примеров придается вполне конкретное
    содержание.
    В соответствии со сложившимися традициями критерием оптимальности для моделей управления запасами считается не ожидаемая прибыль, а ожидаемые затраты. Поскольку в большинстве такого рода моделей цены, по которым продаются фигурирующие
    в задаче товары, предполагаются фиксированными, такой выбор
    критерия оптимальности вполне правомерен, правда, при условии,
    что при этом уделяется должное внимание определению издержек
    «штрафного» характера, когда имеет место потеря прибыли или происходит отсрочка в ее получении (из-за невозможности удовлетворить
    спрос или в случае разрешенной задержки выполнения заказа).
    Другой довод в пользу упомянутого выше критерия заключается
    в следующем: модели управления запасами часто используются применительно к таким видам складируемой продукции, которые потребляются только самой фирмой и, следовательно, не подлежат
    реализации с получением прибыли в истинном смысле этого слова.
    Применительно к товару, подлежащему хранению, оптимальной
    является такая стратегия управления запасами, которая позволяет
    надлежащим образом сбалансировать затраты на обеспечение поставок, расходы, связанные с содержанием изделий на складе, и экономические потери от неудовлетворенного (или несвоевременно удовлетворенного) спроса. Как будет показано ниже, каждый из этих
    трех экономических показателей оказывает влияние как на выбор
    объема пополнения запасов, так и на определение сроков оформления соответствующей заявки. Решение относительно сроков пополнения запасов обычно равносильно определению некоторого критического уровня: всякий раз, когда объем запасов падает ниже этого
    уровня, фирма принимает меры для пополнения своих запасов. Чем
    выше критический уровень, тем надежнее гарантия того, что не
    возникнет нехватки товара, запрашиваемого клиентурой. Итак,
    изменение количественного показателя, характеризующего критический уровень запасов, непосредственно сказывается на взаимозависимости затрат на содержание запасов и потерь от неудовлетворенного спроса. Следует, между прочим, заметить, что если объемы
    пополнения запасов достаточно велики и фирма в значительной степени гарантирована от полного исчерпания складских запасов соот-

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    205

    ветствующих изделий, а заказчики допускают задержку в выполнении своих заказов, то оптимальным может оказаться решение делать
    заявку на пополнение запасов лишь тогда, когда накапливается
    значительный портфель невыполненных заказов. Такого рода случай рассматривается в разд. 19.5.
    Анализ, проведенный в предыдущих главах, показывает, что
    в тех случаях, когда функция критерия эффективности выражается
    через приведенное ожидаемое значение соответствующего экономического показателя, в процессе оптимизации должен учитываться
    фактор взаимозависимости между доходами, получаемыми немедленно, и уровнями доходов в будущем. Так, например, при увеличении процентной ставки оптимальная стратегия сведется к уменьшению объема заказа в текущий период, поскольку отсрочка в накоплении большего количества товаров обходится фирме дешевле,
    если экономический эффект оценивать с учетом коэффициента дисконтирования.
    Важно иметь в виду, что в процессе практического применения
    моделей управления запасами оценка затрат, связанных с реализацией заказов на товарные поставки, а также расходов на хранение
    и убытков в «штрафных» ситуациях представляет собой совсем не
    легкую задачу. Тем не менее трудности, возникающие при решении этой задачи, отнюдь не относятся к числу непреодолимых; это
    подтверждается хотя бы тем фактом, что такого рода модели уже
    нашли весьма широкое практическое применение. Пока мы затрагиваем лишь проблему выработки процедур приближенных и достаточно удовлетворительных оценок стоимостных показателей, связанных с хранением и накоплением складских запасов. Вопросы практического применения операционных систем управления запасами
    более подробно обсуждаются в разд. 19.7.
    Индивидуальные особенности операционной системы. К третьей
    группе факторов, влияющих на выбор стратегии пополнения запасов,
    относится разнообразие условий и обстоятельств, из которых лишь
    некоторые поддаются контролю со стороны руководителя.
    Одна из характеристик операционной системы определяет режим
    слежения за уровнем имеющихся в наличии запасов: текущий объем
    заскладированных товаров может контролироваться либо непрерывно, либо периодически (дискретно). При непрерывном контроле
    заказ на поставку оформляется сразу же, как только запас того или
    иного вида изделия опускается до уровня, лежащего ниже критического. В случае когда такого рода контроль осуществляется
    периодически, «положение дел» на складах проверяется только по
    истечении некоторых, заранее заданных интервалов времени (например, каждый понедельник). При этом пополнение запасов происходит лишь через определенные интервалы, несмотря на то что
    уровень запасов может оказаться ниже критического в более ранние
    моменты
    времени (до истечения текущего интервала). Анализ модели с непрерывным слежением за уровнем запасов при стоха-

    206

    ГЛАВА 19

    стическом характере спроса приведен в разд. 19.6. Случай дискретного контроля рассмотрен в приложении П.
    Как и все прочие математические модели, исследуемые нами
    модели управления запасами позволяют описывать реальные процессы лишь приближенно. Поэтому при решении практических задач
    выбор непрерывного или дискретного режима слежения за состоянием запасов зависит от того, какой из упомянутых вариантов
    позволяет точнее отражать реальное положение дел. Для более
    подробного ознакомления с критериями выбора режима слежения за
    текущим уровнем запасов читателю рекомендуется обратиться к специальной литературе, посвященной вопросам управления запасами.
    Вместе с тем каждый из желающих изучить материалы, приведенные
    в приложении II, должен уделить серьезное внимание сравнению
    упомянутых выше типов моделей и лежащих в их основе предположений с тем, чтобы увидеть признаки их различия.
    К разряду специфических характеристик относятся также ограничения на объемы заказываемых партий изделий. Иногда бывает
    необходимо или желательно заказывать изделия в количествах,
    которые можно выразить лишь целым числом некоторых общепринятых единиц измерения, например целым числом дюжин. (Заметим,
    что в таких случаях переход к другой шкале измерения, вообще говоря, не допускается, так как потребности покупателей в новых единицах измерения могут и не найти правильного отражения.) В ряде
    случаев объем заказа лимитируется по той причине, что фирма имеет
    лишь ограниченное количество мест в располагаемых ею складских
    помещениях. Методика учета такого типа ограничений обстоятельно
    анализируется во многих работах по исследованию операций. Здесь
    же эти вопросы подробно не обсуждаются.
    Следует, наконец, отметить, что на выбор стратегии пополнения
    запасов могут повлиять факторы комплексного характера. Так,
    например, возможна ситуация, когда фирме «Блеск» не удастся в нужное время получить требуемые ей объемы товаров с заводов фирмыпоставщика из-за нехватки грузоподъемных или транспортных
    средств. Следовательно, объемы заказов на те или иные виды изделий должны определяться и с учетом такого рода внешних ограничений. К тому же не исключено, что какой-нибудь из приобретаемых
    фирмой изделий размещается на нескольких отдельных складах,
    разбросанных по разным местам, и, следовательно, при разработке
    плана действий фирма окажется вынужденной рассматривать сразу
    несколько уровней запасов. В целях упрощения анализа построения оптимизационных моделей управления запасами подобные ограничения нами также не учитываются, хотя специалистами
    в области исследования операций успешно решаются и такого рода
    усложненные задачи.
    Выводы и взгляд вперед. Попытаемся дать общую характеристику используемых нами методов анализа. Прежде всего отметим,
    что в моделях, рассматриваемых в данной главе и приложении II,

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    207

    каждый вид складируемых изделий рассматривается отдельно.
    В этих моделях считаются заданными такие характеристики системы, как режим контроля за уровнем запасов [непрерывный или
    периодический (дискретный)], продолжительность планового периода,
    срок запаздывания поставок (по отношению к моменту оформления
    соответствующих заказов), прогнозируемые уровни спроса, покупная цена изделий, накладные расходы, затраты на содержание каждого изделия и коэффициент дисконтирования. Никаких дополнительных ограничений при этом не накладывается. При ознакомлении с рассматриваемыми ниже моделями читатель должен подумать о том, как повлиял бы на выбор оптимальной стратегии учет
    индивидуальных особенностей и внешних условий функционирования той или иной системы управления запасами.
    Несмотря на то, что в данной главе основной целью является
    анализ моделей, в которых одновременно предполагается как стохастический характер спроса, так и динамическая (рекуррентная)
    структура самой задачи управления запасами, читатель найдет
    полезным рассмотреть каждый из этих элементов отдельно. Так,
    например, в разд. 19.4 обсуждается метод определения оптимальной
    стратегии управления запасами в том случае, когда спрос носит
    вероятностный характер, а управляющее решение относительно
    объема заказываемых изделий принимается только один раз.
    В разд. 19.5 рассматривается ситуация, когда задача организационного управления является динамической, но уровни спроса
    предполагаются точно прогнозируемыми (по средним значениям).
    В разд. 19.6 и приложении II упомянутые выше ситуации анализируются в комплексе, чтобы более четко выявить взаимосвязь
    между характеризующими их факторами.
    В каждом из рассмотренных случаев задача заключается в том,
    чтобы дать исчерпывающее описание оптимальной стратегии,
    используя только два показателя: критический уровень запасов (точка
    заказа) и объем заказа на дополнительную поставку того или иного
    изделия. В результате для нахождения оптимального решения
    используется алгоритм оптимизации значения нелинейной целевой
    функции всего двух переменных. Как будет показано ниже, при
    заданной структуре оптимального решения и при наличии столь
    незначительного числа управляемых переменных задача алгоритмизации процедуры отыскания оптимального решения является
    весьма легкой; при этом удается успешно применять простые, но
    очень эффективные методы «числовых» аппроксимаций.
    19.4. СТАТИЧЕСКАЯ МОДЕЛЬ

    В этом разделе рассматривается так называемая статическая
    х
    модель ), в которой решение относительно запасов принимается
    всего только один раз с учетом прогнозируемых уровней спроса,
    1

    ) В статических моделях плановый период не подлежит дроблению (т. е.
    состоит из единственного временного отрезка).

    208

    ГЛАВА 19

    представленных значениями некоторой случайной переменной. Эта
    модель интересна по двум причинам. Во-первых, как мы вскоре
    убедимся, такого типа модели в ряде случаев действительно адекватно описывают реальные ситуации. Во-вторых, оптимизационная процедура в этом случае является своего рода прологом к исследованию рассмотренных ниже динамических моделей.
    Приведенный ниже пример, основные элементы которого взяты
    из практики, дает определенное представление о том, как можно
    использовать статическую модель в реальных условиях. (При этом
    мы не обращаем внимание на некоторые детали, которые, хотя
    и влияют на выбор стратегии, но не имеют существенного значения
    с методической точки зрения.) Представим себе, что крупное столичное издательство, выпускающее газету «Дейли Страж», пытается
    определить, какое количество газет необходимо доставлять в каждый из газетных киосков. Непроданные газеты возвращаются в издательство. При существующей системе распределения стоимость
    нереализованных газет достигает 1 млн. долл. в год. Более рациональный способ распределения выпускаемого тиража газет по киоскам может обеспечить значительное снижение экономического
    ущерба.
    Несмотря на то что ежедневно принимаемые решения относительно числа газет, подлежащих доставке в каждый из киосков,
    по своей природе рекурренты (т. е. решения подлежат ежедневному
    пересмотру), организационная, задача в целом может быть решена
    в рамках статической модели. Поскольку газета, выпускаемая в тот
    или иной день, не представляет никакого интереса на следующий
    день, принцип определения числа газет, направляемых в пункты
    их продажи, необходимо выработать «раз и навсегда». Ежедневный
    спрос на газеты можно считать случайным (недетерминированным),
    т. е. лишь частично предсказуемым, и зависимым от того, в какой
    день недели выходит газета и насколько она насыщена интересным
    (или важным) материалом. Кроме того, в разные дни недели оказываются неодинаковыми удельные затраты на выпуск одного
    экземпляра газеты; например, печатанье каждого экземпляра газеты
    наиболее объемистого воскресного выпуска обходится издательству
    дороже, чем печатанье одного экземпляра той же газеты в какойлибо другой день недели. С учетом этих обстоятельств издательство
    газеты «Дейли Страж» решило прибегнуть к помощи операционной
    модели наподобие той, которая приведена ниже в разделе, посвященном рассмотрению случая линейного характера функции затрат
    на содержание запаса и функции потерь в штрафных ситуациях.
    (Исходя из некоторых, весьма очевидных соображений, задачу,
    представленную моделью такого типа, называют задачей издателя
    газеты или просто задачей газетчика.) В используемой модели экономические показатели, характеризующие затраты, и распределение вероятностей для спроса определяются прогнозируемыми условиями на каждый конкретный день.

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    209

    Читателю предлагается придумать другие задачи коммерческого
    характера, анализ которых может быть выполнен с помощью статической (однопериодной) модели управления запасами. При каких
    условиях окажется экономически выгодным применение методов
    исследования операций для решения таких задач?
    Форма представления стратегии пополнения запасов. Введем
    прежде всего следующие обозначения:
    i — уровень запасов перед принятием решения об оформлении заказа на дополнительную поставку;
    х — объем заказываемого товара ( ж ^ О ) ;
    у = i + х — суммарный объем имеющихся в наличии запасов, которые можно использовать для удовлетворения будущего
    спроса;
    q — фактический уровень спроса (q — случайная переменная, удовлетворяющая условию q ^ 0);
    р (q) — вероятность того, что уровень спроса равняется д.
    Допустим для удобства, что i, х, у и q принимают целочисленные значения 1). Оптимальные значения переменных х и г/, как
    правило, зависят от исходного (первоначального) уровня запасов i;
    поэтому в символическом представлении (т. е. в математической
    записи) оптимальной стратегии будут фигурировать функции х (i)
    и у (i).
    Не представляет большого труда построить такие модели, которые выглядят весьма правдоподобно, но приводят к оптимальным
    стратегиям парадоксального вида. Все, кому любопытно ознакомиться с примерами такого рода моделей, могут это сделать в процессе внимательного прочтения специально посвященного этим
    вопросам материала в последующих разделах данной главы. Чаще
    всего в связи с управлением запасами руководителями используется
    следующий простой вид правила пополнения запасов:
    у (i) = i, х (i) = 0

    при i ^ s

    у (i) = S, х (i) = S — i

    при i < s

    (заказ на поставку
    не оформлять),
    (оформлять заказ
    на поставку).

    (1)

    Согласно (1), заказ на поставку не оформляется, если начальный
    объем запасов i превышает или равен s; если же i < s, то оформляется
    заказ с целью пополнения запасов до суммарного объема S, который
    идет на удовлетворение будущего спроса покупателей. Правило (1)
    называют (s, $)-стратегией; здесь s —• критический уровень запасов (точка заказа), a S — уровень запасов, достигаемый в результате
    пополнения (т. е. после реализации заказа на дополнительную
    поставку товаров).
    1
    ) Случай, когда эти переменные могут принимать любые (непрерывные)
    значения, будет рассмотрен нами отдельно.

    210

    ГЛАВА 19

    Ниже будет показано, при выполнении каких экономических
    условий (т. е. при наличии какого комплекса стоимостных показателей) оптимальную стратегию пополнения запасов действительно
    можно представить в форме (s, S) — [правило (1)]. Однако, прежде
    чем перейти к рассмотрению одношаговой статической модели общего
    вида, рассмотрим подробно наиболее важный вариант моделей такого
    типа.
    Случай линейных функций затрат на содержание запасов и потери
    в штрафных ситуациях. Предположим, что ожидаемые затраты за
    весь плановый период равняются сумме покупной стоимости продукции, математического ожидания затрат на содержание продукции
    на складе и экономических потерь, возникающих в штрафных
    ситуациях г). Для определенности будем считать, что затраты,
    связанные с приобретением х изделий, выражаются формулой

    0

    при х~0,
    при

    где неотрицательная величина К представляет собой накладные
    расходы, а с есть стоимость одного изделия, приобретаемого у фирмыпоставщика (при этом естественно с ^ 0).
    Допустим, что ожидаемые затраты на содержание запасов и ожидаемое значение экономических потерь в штрафных ситуациях
    в течение всего планового периода зависят лишь от у = i -\- х,
    т. е. от суммарного объема продукции, который имеется в наличии
    и, следовательно, доступен покупателям. Обозначим функцию ожидаемых затрат через L (у) и предположим, в частности, что L (у)
    определяется следующей формулой:
    L(U)=

    Ufo-(7)p(?) + S n(q-y)p(q)

    g=0

    9>0

    0/>0),

    (3)

    где неотрицательная величина h есть затраты на содержание одного
    изделия, остающегося на складе до конца планового периода, а величина я — штрафные потери в расчете на одно изделие, отсутствующее на складе в конце этого периода.
    Следовательно, в выражении (3) первая сумма представляет
    собой ожидаемые затраты на содержание запасов, а вторая сумма —
    ожидаемые штрафные потери. Нами приняты также вполне разумные
    предположения о том, что с 4 - ^ > 0 и л > с (откуда следует, что
    h + п > 0).
    В качестве иллюстрации рассмотрим случай, когда
    р (q) = 1/5 при q = О, 1, . . ., 4, и, следовательно, Е [q] — 2. (4)
    х
    ) Как н в предыдущих главах, потери, возникающие в штрафных ситуациях, или просто штрафные потери, представляют собой тот экономический
    ущерб, который терпит фирма в случае неудовлетворения (или несвоевременного удовлетворения) спроса покупателей.— Прим. перев.

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    211

    Легко убедиться, что при этом

    для г/>4,

    •fSto-d+T
    S («д=0
    д=У+1
    Значения I/ (г/) при /г. = 5 и я = 0, 5, 10, 20 и 25 приведены в таблице
    на рис. 19.1 J). Заметим, что значение г/, минимизирующее значение
    L (у), увеличивается по мере возрастания я.
    Штрафные потери я
    (экономические потери в случае неудовлетворенного спроса)
    У

    0

    5

    10

    20

    25

    0

    0

    10

    20

    40

    50

    1

    1

    7

    13

    25

    31

    2

    3

    6

    9

    15

    18

    3

    6

    7

    8

    10

    11

    4

    10

    10

    10

    10

    10

    5

    15

    15

    15

    15

    15

    У >6

    5(у-2) 5(j/-2) 5 (? -2) 5 (У -2)

    5(0-2)

    Р и с . 19.1.

    В случае если каждое непроданное в конце планового периода
    изделие (т. е. избыточные запасы) удается реализовать по некоторой
    цене v (удовлетворяющей условию 0 <^ v -^ с), то из стоимости
    содержания изделия соответствующего вида величину v необходимо
    вычесть. Таким образом, в соотношении (3) под h в действительности
    1
    ) Желающим убедиться в правильности понимания формулы (5) рекомендуется самостоятельно вычислить значения L (у) при Л = 5 и я = 1 0 и сравнить полученные результаты с данными, приведенными в таблице па рис. 19.1.
    Кроме того, мы предлагаем читателю вычертить график функций L (у) с целью
    убедиться, что эта функция является выпуклой.

    212

    ГЛАВА 19

    следует подразумевать переучтенную (чистую) стоимость содержания единицы складируемых изделий (h = h' — v), которая может
    принимать и отрицательные значения. Точно так же, если идет речь
    об изделиях, складируемых для последующего коммерческого сбыта,
    и возникает ситуация, когда объем заказов, превышающий имеющиеся в наличии запасы, полностью теряется, величина л включает
    в себя ту цену г, по которой данный товар можно было бы продать
    (я = п' + г).
    Нетрудно убедиться, что в данном частном случае (s, ^-правило
    определяет оптимальную форму представления стратегии пополнения запасов; Покажем теперь, каким образом находятся оптимальные значения s и S. Положим

    (6)
    v
    >
    и назовем отношение (6) критическим отношением 1). Заметим, что
    R удовлетворяет условию 0 < R < 1, так как мы предположили,
    что я; > с и л -j- /г > 0. При этих условиях можно доказать, что
    значение неотрицательной величины S равняется наименьшему из
    целых чисел, для которого
    P(S)=%p(q)>R.
    g=0

    (7)

    Поскольку Р (S) есть не что иное, как статистическая (кумулятивная) функция распределения при q = S, оптимальным является
    такое значение S, для которого суммарный спрос полностью удовлетворяется, по крайней мере с вероятностью R.
    Из формулы (6) следует, что
    1) R возрастает с увеличением значения л, так что S является
    неубывающей функцией штрафных потерь;
    2) R убывает как с возрастанием значения /г, так и с возрастанием
    значения с, так что S есть невозрастающая функция hue;
    3) если я ^г 2с + h, то R ^ 1/2, а значение S лежит по крайней
    мере не ниже уровня медианы распределения вероятностей для
    объемов спроса.
    Проиллюстрируем эти утверждения на примере модели, представленной соотношениями (4) и (5). График статистической функции распределения
    2/ = 0, 1 , - . . , 4 ,

    (8)

    9=0

    приведен на рис. 19.2. Чтобы упростить проблему интерпретации
    данного графика, мы изобразили его в виде лестницы.
    Иногда величину R называют определяющим параметром.— Прим, перев.

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    213

    Предположим, что затраты, связанные с хранением одного изделия, составляют 5 денежных единиц (h = 5), а штрафные потери
    в расчете на каждое изделие равняются 10 денежным единицам
    (я = 10); пусть, кроме того, с — 0. При этом R = 2/3 и, согласно (7)
    и (8), S представляет собой наименьшее из целых чисел, удовлетворяющих условию
    (S + 1)/5 > 2/3, (9)
    t,oи, следовательно,
    5 = 3.
    (10)
    °'8L
    Я^-

    Оптимальное значение S всегеГ °'В
    да удается сразу же отыскать
    геометрическим путем, если
    известна
    статистическая
    а.2>
    функция распределения наподобие той, которая изобра- - 2 - 1 0 1 2 3 * 5 6
    жена на рис. 19.2. Для этого
    у
    достаточно проделать еледующее: указать на верти- Р и с. 19.2. Функция распределения Р (у).
    кальной оси точку, соответствующую найденному значению R, и провести через эту точку
    горизонтальную прямую до пересечения с вертикальной составляющей ломаной, изображающей функцию Р (у}', при этом значение
    S совпадает с тем значением г/, которое соответствует упомянутой
    выше точке пересечения 1). Каким было бы оптимальное значение S
    при /1 = 5, я = 10 и с = 5?
    Подводя итоги, можно утверждать, что для нахождения оптимального значения S вначале вычисляется по формуле (6) значение Л, а затем используется статистическая функция распределения
    Р (у). Заметим, что для определения S нет никакой необходимости
    вычислять значение L (у).
    Предположим, что накладные расходы К (т. е. расходы, связанные с процедурой оформления заказа, отгрузкой и транспортировкой) равны 0. Тогда, как будет показано ниже, оптимальным
    является вариант, когда s = S. Это означает, что при любом началь1
    ном объеме запасов i, меньшем, чем б , оформляется заказ на дополнительную поставку в объеме х = S — г. Если же i > S, пополнения
    запасов не требуется.
    Рассмотрим несколько более сложный случай, когда К ^> 0.
    При этом условии оптимальное значение критического уровня запасов s должно подчиняться жесткому условию s < S. Это объясняется тем, что если накладные расходы К сравнительно велики,
    1

    ) Если точка, определяющая значение R, лежит на продолжении горизонтального отрезка графика Р (у), то в этом случае значение S выбирается равным
    значению у, соответствующему левой граничной точке этого отрезка.

    214

    ГЛАВА 19

    а начальный объем запасов i (^ значению к S, то дополнительные накладные расходы и затраты
    на приобретение заказанных изделий не всегда удается скомпенсировать снижением удельной стоимости содержания запасов и штрафных
    потерь. Для простоты мы будем предполагать, что оптимальное
    значение s ^ 0.
    В соответствии с (s, ^-правилом при условии, что начальный
    объем запасов равняется s, заказ на дополнительную поставку
    товаров не оформляется. Следовательно, сумма ожидаемых затрат
    на содержание запасов и ожидаемых штрафных потерь при у = s 1 ),
    т. е. L (s), не должна превышать сумму накладных расходов, ожидаемых затрат на содержание запасов и ожидаемых штрафных потерь
    при у = S 2) [т. е. величину К + с (S — s) -f- L (S)]. При обязательном же заказе в случае, когда i < s, все экономические соображения для ситуации, характеризующейся условием г/ = s — 1,
    носят совершенно иной характер.
    Подводя итоги, мы можем утверждать, что в качестве s выбирается наименьшее из чисел, удовлетворяющих условию 3 )
    L (s) ^ К + с (S - s) + L (S).
    (11)
    Итак, при К > 0 критический объем запасов s вычисляется следующим образом: вначале находится численное значение L (у), а затем
    полученный результат сравнивается с численными значениями суммы К + с (S — у) + L (S) для убывающего ряда пробных значений у (начиная с у = S); вычислительная процедура заканчивается,
    как только находится у = s, являющееся наименьшим из пробных
    значений, для которого выполняется условие (11). [При выполнении
    такого рода вычислений читатель, возможно, сочтет более удобным
    производить эквивалентное по своему содержанию сравнение числовых значений величин L (у) + су и К + cS -f L (S), поскольку
    последняя представляет собой константу.]
    В примере (8) при h ~ 5, я = 10 и с = 0,1 неравенство (11)
    выглядит следующим образом:
    L (s) ^ К + 0,1 (3 - s) + 8 = 8,3 + К - 0,1s.
    (12)

    Предположим,

    что К ~ 4. Тогда s = 2, поскольку
    L (2) = 9 < 8,3 + 4 - 0,1 -2 = 12,1,
    L ( l ) = 13 > 8,3 + 4 -0,1-3 = 12,

    (13)

    где значения L (s) получены с помощью таблицы, приведенной на
    рис. 19.1. Каким было бы оптимальное значение s при К = 12?
    При каких условиях оформляется в этом случае заказ на пополнение
    запасов?
    *) То есть в случае х = 0.
    2
    ) В этом случае объем заказа z равен S — s.
    ) Соотношение (11) фактически является определением
    уровня запасов.
    3

    критического

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    215

    Мы продемонстрировали способ нахождения оптимальной (s, S)стратегии для весьма важного частного случая, когда функция
    затрат на содержание запасов и функция штрафных потерь являются
    линейными. Оставшаяся часть данного раздела посвящена рассмотрению структуры статической модели с более общей точки зрения
    Нами будут обсуждены методы построения и решения статической
    задачи при других функциях затрат и показано, при каких условиях,
    накладываемых на функции затрат, реализуется оптимальная (s, S)стратегия.
    Общее описание модели. Мы по-прежнему будем использовать
    приведенные выше определения величин i, x, у, q и р (q). Кроме
    того, введем следующее обозначение:
    8 (У \ i) — ожидаемые средние затраты в случае, когда объем
    наличных запасов для удовлетворения потребностей
    клиентуры после реализации заказа на пополнение
    становится равным у при условии, что начальный
    объем запасов равнялся i.
    В большинстве случаев практического применения статических
    моделей задача решается при начальном условии i = 0. Однако
    бывают и исключения. В действительности мы можем даже допустить
    возможность такой ситуации, когда i < 0; это условие означает,
    что имеет место разрешенная задержка в удовлетворении спроса,
    оказавшегося неудовлетворенным в предыдущие периоды. Таким
    образом, величину i можно интерпретировать как истинную (переучтенную) оценку состояния запасов до принятия решения относительно приобретения товаров у фирмы-поставщика.
    Заметим, что в определении функции ожидаемых затрат g (у \ i)
    фигурирует не х, а у. Поскольку х = у — i, правомерно использование в качестве одного из аргументов функции g как переменной х,
    так и переменной у; однако второй вариант с математической точки
    зрения представляется более удобным. Подчеркнем еще раз, что
    g (у \ г) представляет собой математическое ожидание затрат. При
    конкретных значениях у и i фактические затраты в течение планового
    периода следует рассматривать как величину стохастического характера, поскольку объем спроса q предполагается случайным.
    Освежим в памяти основные элементы метода динамического программирования, в соответствии с которыми задача оптимизации
    может быть сведена к нахождению
    (y\i),
    (14)
    т. е. минимальных ожидаемых затрат при условии, если начальный
    объем запасов равняется i. Ниже мы всюду будем предполагать,
    что значения у ограничены снизу значением г; никаких трудностей
    концептуального характера в случае снятия этого ограничения
    не возникает *).
    *) Ситуация, когда у < i, может, например, возникнуть в связи с намерением фирмы ориентироваться на полную распродажу товаров.

    216

    ГЛАВА 19

    Зная надлежащее оптимальное значение у (i),
    объем заказа находится с помощью соотношения

    x ( i ) = y (i) - i.

    оптимальный

    (15)

    В большинстве случаев значения функции g (у i) вычислить
    нетрудно. По мере увеличения у чаще всего g (у \ i) неограниченно
    возрастает. [Объяснить такое поведение функции g (у \ i) предоставляется самому читателю.] Поэтому даже при отсутствии каких-либо
    специфических свойств g (у \ i), которые можно было бы учесть
    при решении задачи минимизации (14), вычислительная процедура
    при нахождении оптимального значения у (i) оказывается весьма
    примитивной: в худшем случае приходится перебирать всевозможные варианты значений у = i, i + 1, . . . до тех пор, пока не будет
    достигнут минимум g (у | i). В процессе вычислений нужно быть
    внимательным, с тем чтобы не принять минимум локального характера за глобальный.
    Читатель может предположить, что, зная у (i) для одного или
    нескольких значений i, можно судить о том, какие значения примет
    у (i) при других значениях i. Попытаемся проверить, является ли
    это основанное лишь на интуиции предположение правильным.
    Допустим, что начальный объем запасов равняется i, причем
    i может принимать лишь следующие значения: О, 1, . . ., 8. Пусть
    максимальный уровень спроса равняется 8. Кроме того, предположим, что у (i) ^ 8 при любом значении i (если, разумеется, функция
    затрат удовлетворяет надлежащим требованиям). Допустим, что,
    пытаясь найти решение задачи минимизации, представленной соотношением (14), мы начинаем вычислительный процесс с рассмотрения
    следующих двух вариантов J):
    Вариант 1. Если i = 7, у (i) = 8 и, следовательно, х (i) = 8 —
    — i = 1. Какими, по мнению читателя, будут значения у (i) ж х (i)
    при i = О, 3, 4?
    Вариант 2. Если i = 3, у (i) = 4 и, следовательно, х (i) = 4 —
    — i = 1. Какими, по мнению читателя, оказались бы значения у (i)
    и х (i) при i = 0, 4, 7?
    Ответы на поставленные выше вопросы и краткое их обоснование
    рекомендуется записать на отдельном листе бумаги. К этим записям
    интересно будет вернуться после ознакомления с примером, к рассмотрению которого мы переходим.
    Случай единовременного штрафа. С помощью этого примера мы
    попытаемся показать, что даже простые на вид модели (т. е. модели,
    содержащие ограничения примитивного характера) могут приводить
    к оптимальным решениям весьма необычной структуры. Допустим,
    что возможны лишь два значения уровней спроса: 4 и 8. Пусть
    1
    ) Способ нахождения числовых значения у (i) при заданных i автором
    сознательно не указывается. В противном случае поставленные им вопросы
    были бы лишены смысла.— Прим, перее.

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ. ЗАПАСАМИ

    217

    также известно, что

    р (4) = р (8) = V 2 ,

    (16)

    а при д Ф- 4,8 p(q) = 0. Допустим, что выполняется условие

    при y = i

    0

    (ж = 0),

    Предположим, что затраты на содержание запаса равны нулю,
    а также будем считать, что товары, «залежавшиеся на складе» к концу планового периода, полностью обесцениваются (т. е. их не удается
    реализовать). Вместе с тем допустим, что в случае, когда спрос
    (потребности клиентуры в товаре данного вида) превышает г/, фирма
    несет единовременные штрафные потери я > 0. При этих предположениях функцию ожидаемых штрафных потерь можно записать в виде

    {

    л
    л/2

    для у = 0, 1, 2, 3,
    для у = 4, 5, 6, 7,

    О

    для у — 8.

    (18)

    Учитывая (16), легко убедиться в том, что формула (18) приводит
    к одинаковым штрафным потерям (я) независимо от того, на какое
    количество изделий фактический спрос q превышает имеющийся
    в наличии объем запасов у [проверка правильности вычисления
    правой части соотношения (18) возлагается на читателя].
    Ниже приводится хотя и несколько искусственный, но весьма
    показательный пример, поясняющий условия, при которых модель
    «единовременных штрафов» может найти практическое применение.
    Предположим, что житель пригорода N отправляется на собственном
    автомобиле за покупками в центральную часть города, где ему придется парковаться на открытой стоянке, оборудованной специальным
    счетчиком-коллектором. Пусть q есть то количество времени, которое потребуется N для завершения всех покупок, ay — количество
    оплаченного времени стоянки принадлежащего ему автомобиля *).
    Улица, оборудованная счетчиками-коллекторами в местах разрешенных платных автомобильных стоянок, тщательно контролируется
    полицией, так что если на выполнение (предположим, что речь
    идет о мужчине) всех поручений супруги N понадобится больше
    времени, чем оплачено (q > у), то ему наверняка вручат дополнительный счет (своего рода штраф за превышение времени стоянки)
    в размере п. Поскольку N не может предсказать g с абсолютной точностью, перед ним возникает следующая задача: рассчитать у так,
    чтобы не допустить сильного просчета ни в количестве опущенных
    1
    ) Продолжительность оплаченного времени определяется, например, числом пятицентовых монет, опущенных в приемник коллектора рядом со стоящей
    машиной.— Прим. перев.

    218

    ГЛАВА 19

    пятицентовых монет, ни в возможном штрафе за превышение оплаченного времени стоянки.
    [Другим примером организационной задачи, в которой должна
    учитываться возможность единовременных штрафных потерь, является задача составления расписания для так называемых аэробусных
    рейсов на авиалинии Нью-Йорк — Вашингтон. На такого рода рейсы
    билеты не резервируются: если пассажир прибывает в аэропорт
    вовремя, авиакомпания гарантирует ему место в самолете. Если
    все места на запланированный рейс оказываются занятыми, авиакомпания обязана назначить дополнительный внеплановый рейс,
    даже если в самолете планового рейса не хватило места всего одному
    пассажиру.]
    Резюмируя изложенные выше рассуждения, мы можем утверждать, что функция ожидаемых затрат g (у \ i) представляет собой
    сумму затрат, связанных с реализацией заказа на пополнение запасов [см. (17)] и ожидаемого значения штрафных потерь [см. (18)], т. е.
    g(y\i)=c(y-i)

    + L (у).

    (19)

    Обращаясь к соотношениям (16) — (18), мы сразу же приходим
    к выводу, что при любом значении i в процессе поиска оптимального
    решения рассмотрению подлежат лишь следующие варианты стратегии:
    у = i, 4 или 8; х = 0, 4 — i или 8 — i.
    (20)
    Аргументация только что сделанного нами утверждения возлагается
    на читателя.
    Рассмотрим теперь два примера, в которых экономические показатели имеют конкретное количественное выражение. Проанализируем вначале случай, когда с = 1, К = 4,5, а я = 12. При начальном уровне запасов i = 7 оптимизационная задача [см. (14)] выглядит
    следующим образом:
    / (7) = min g ( y \ l ) = min [g (1 \ 7), g (8 | 7)] =
    S/?-7

    = min[0 + 12/2, 4,5 + 1-1 + 0] =
    = 5,5 при у (7) = 8.

    (21)

    Таким образом, при начальном уровне запасов i = 7 оптимальным
    является заказ в объеме х (7) = 8 — 7 = 1.
    Рассмотрим теперь случай, когда i = 0. При этом

    = min[0 + 12; 4,5 + 1,4 + 12/2; 4,5 + 1,8 + 0] = 12 при у(0)=0. (22)
    Легко убедиться, что для i = 3 и i = 4
    у (3) = 8, а у (4) = 4,

    (23)

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    и, следовательно, в итоге имеем
    у (i) = i, x (i) = 0
    у (г) = 8, х (г) = 8 — i

    при i = О, 4, 5, 6, 8,
    при i = 1, 2, 3, 7.

    219

    (24)

    Читателю предлагается перевести соотношения (24) на обычный
    «язык предписаний», употребляемый при формулировке стратегии
    пополнения запасов. Согласуются ли результаты, полученные интуитивно при рассмотрении варианта 1 (см. предыдущий раздел) с (24)?
    Если нет, то чем это можно объяснить?
    Теперь рассмотрим вариант, в котором с = 1, К = i, а я = 5.
    Нетрудно проверить, что
    у (О = i, x (i) = 0 при i 4= 3, 7,
    г/ (3) = 4, а; (3) = 1 при i = 3,
    (25)
    i/ (7) =8, ж (7) = 1 при i == 7.
    Интерпретируйте соотношения (25), используя обычные термины,
    принятые при описании стратегии пополнения запасов. Согласуются
    : ли ваши ответы на вопросы, поставленные при рассмотрении вариан; та 2 (см. предыдущий раздел), с (25)? Если нет, то чем это можно
    [ объяснить?
    Несмотря на то что стратегии (24) и (25) действительно оптимальны, операционист может столкнуться с определенной трудностью, когда ему придется доказывать опытному руководителю,
    что при нулевом начальном уровне запасов заказ на пополнение
    оформлять не следует, а при начальном уровне запасов i = 3 целесообразно пополнить запасы, не взирая на возникающие при этом
    накладные расходы. Попытаемся теперь уточнить, какие условия,
    налагаемые на функции затрат, являются достаточными для того,
    чтобы простая по структуре (s, ^-стратегия (которая легко воспринимается руководящими лицами всех рангов) могла бы обеспечить
    оптимальное решение задачи управления запасами.
    Оптимальяая (s, $)-стратегия. Прежде всего нам необходимо
    вспомнить определение выпуклой функции, приведенное в гл. 9.
    Функция L (у), где у принимает целочисленные значения, называется выпуклой, если для любого значения у
    L(y + i)-L(y)^L(y)-L(y-

    1).

    (26)

    Предположим, что функция ожидаемых затрат представляет собой
    сумму расходов, связанных с реализацией заказа на поставку,
    и величины, включающей в себя ожидаемые затраты на содержание
    запасов и ожидаемые штрафные потери, т. е.
    g ( y \ i ) = c(y-i)+L (у).

    (27)

    Пусть затраты, связанные с реализацией заказа с (у — i), состоят
    из накладных расходов К ^ 0 и покупной стоимости заказанной

    220

    ГЛАВА 19

    партии изделий (при цене одного изделия с ^ 0):
    0

    при у = i (£ = 0),
    П ри j / > i (x = y-J>0).

    K + c(y_i}

    (28)

    Допустим, что су + L (у) при г/ | -v оо неограниченно возрастает,
    и предположим, что функция L (у) является выпуклой.
    Будем считать, что затраты на содержание представляют собой
    возрастающую функцию h (у — q), где (у — q) — излишек запасов
    (возникающий при условии q -<г/). Предположим формально, что
    >0 при />0,
    =0

    при/<0,

    и будем считать и (/) возрастающей функцией в области, где / ^Э 0.
    Аналогично предположим, что штрафные потери описываются возрастающей функцией п (q — у), где (q — у) — неудовлетворенный
    спрос (такая ситуация, естественно, возникает лишь при q > у).
    Снова предположим формально, что
    0

    "(/){ ^ О

    при ;>0,
    при /<0,

    и будем считать я (/) возрастающей функцией / в области, где / ^ 0.
    Тогда функция ожидаемых затрат на содержание запасов и ожидаемых штрафных потерь запишется в следующем виде:
    м

    S й(У — ?)^(g)+ S л (д— г/) p ( q ) при г/>О,

    «=°
    "
    П
    2: (<1—У)Р(<})
    при г/<0.

    (29)

    75=0

    Можно показать, что если сумма функций фактических затрат на
    содержание запасов и штрафных потерь h (j) + л (—j) представляет
    собой выпуклую функцию при любом целочисленном значении /, то
    и функция ожидаемых затрат L (у), определяемая соотношением (29),
    является выпуклой г).
    Легко доказать следующую теорему.
    О п т и м а л ь н о с т ь (s, (1). Кроме того, численное значение S не зависит от объема наклад*) В тех случаях, когда затраты па содержание запасов подлежат оценке
    при известном значении у до получения данных относительно уровней спроса,
    у
    ^ h (у — q) р (q) в (29) заменяют на h (у).
    9=0

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    221

    ных расходов К [см. (28)], а если К = 0, то критический уровень
    s = S.
    Когда форма представления оптимальной стратегии известна,
    вычислительная процедура, вытекающая из соответствующего правила пополнения запасов, значительно упрощается, поскольку при
    этом требуется лишь определить значения s и б1. Мы уже убедились
    в том, насколько простыми оказываются вычисления в случае, когда
    функция затрат на содержание запасов и функция штрафных потерь
    являются линейными. (Сформулированная выше теорема о структуре
    оптимальной стратегии г) остается справедливой и при более общих
    предположениях относительно функции ожидаемых затрат; однако
    вопросы, связанные с модификацией условий упомянутой теоремы,
    здесь нами обсуждаться не будут.)
    Ниже приводится доказательство (s, £)-теоремы и рассматриваются в общем виде вычислительные процедуры, используемые при
    анализе задачи управления запасами.
    Прежде всего заметим, что
    ming(y\i),
    У*
    (I)
    = min

    (II)

    y>i

    Поскольку и су, и L (у) выпуклы, их сумма также является
    выпуклой и, согласно принятому нами предположению, неограниченно возрастает при [ у \ —>• оо. Следовательно, существует такое
    значение S, для которого

    (Ill)

    min[cy + L ( y ) ] = c S + L(S).
    у

    Легко показать, что локальный оптимум является также и глобальным оптимумом.
    Предположим, что i ^ S; тогда, согласно (III),
    ci + L(i),
    так что

    (IV)

    K—ci + min [су + L (у)} > L (i).

    Следовательно, с помощью (II) для i ^ S мы имеем
    / (i) = L (0,

    y(i) = i

    и .т (i) - 0,

    i > 5.

    Теперь предположим, что i ^ »S; тогда, согласно (II) и (III),
    К — cl-\-cS-{-L (S)

    при y = S,

    L(i)

    при z/-=z,

    Ее называют также (s, 5)-теоремой.— Прим.

    перев.

    (V)

    222

    ГЛАВА 19

    Рассмотрим случай, когда К = 0; в силу (III)
    L (i) > —ci + cS+L (S),

    (VII)

    так что минимум, определяемый соотношением (VI), достигается при
    f(i)=c(S-i) + L (S), y ( i ) = S
    (VIII)
    и
    x ( i ) = S — i при i<£, Я = 0.
    Теперь проанализируем случай, когда К > 0; при этом для
    значений i, лежащих в окрестности 5, значение функции L (i) в (VI)
    может оказаться меньшим по сравнению со значением, принимаемым
    выражением [К — ci-\- cS-\-L (S)]. Пусть s есть наименьшее из
    чисел, удовлетворяющих условию
    (IX)

    L (s) < К - cs + cS + L (S).

    Запишем (IX) в другом, совершенно эквивалентном виде:
    (X)

    S).

    В этом случае соотношения (V) остаются справедливыми и для i
    тогда как при i < s
    S),

    и x ( i ) = S - i . (XI)

    y(i) = S

    Заметим в заключение, что значение 5, так же как и значение s
    в соотношении (12), найдено в соответствии с (III) и (X) и с учетом
    того, что
    Г K + c(S — i) + L(S)
    при i / ( 0 = 1( Lг Jv
    -^
    (ХП>
    (i)
    при i>s.
    Для нахождения оптимального значения 5 в случае, когда
    модель предполагает линейный характер функций затрат на содержание запасов и штрафных потерь, нами были предложены простые
    формулы (6) и (7). Эти формулы можно вывести следующим образом.
    В силу (III) S должно удовлетворять условию
    [с (S + 1) + L (S + 1)1 > [cS + L (S)],

    (XIII)

    что эквивалентно условию
    L (S + 1) - L (S) > -c.

    (XIV)

    В выражении, стоящем в левой части соотношения (XIV), можно
    выделить компоненты, имеющие отношение только к затратам на
    содержание запасов, а именно
    S+l

    S

    A l S (S + i-q)p(q)~^(S-q)p(q)\
    g=0
    g=0

    S

    = h^p(q) = hP(S).
    g=0

    (XV)

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    223

    Аналогично, выделяя в левой части (XIV) компоненты, относящиеся к штрафным потерям, получаем
    g=S+2
    г

    "vi

    /n\l

    тт Г \

    Р (^M

    ^^"Л7Т\

    y>s

    Учитывая (XV) и (XVI), мы можем записать неравенство (XIV)
    в виде
    (h + л) Р (S) — л ^ -с,
    (XVII)
    которое после упрощения приводит к (7).
    Рассмотрим случай линейных функций затрат на содержание
    запасов и штрафных потерь, предположив, что р (q) представляет
    собой плотность вероятности, а у может принимать непрерывный
    ряд значений; при этом *)
    оо

    при у>0,
    • \п-щ — у ) р \ у ) Щ -

    при г/<0.

    Тогда, если существует производная L' (у) = dL (y)ldy, значение
    у = S, минимизирующее [су -f- L (у)]>
    долнгно удовлетворять
    условию
    с + L' (у) = 0.
    (XVIII)
    Читатель, знакомый с дифференциальным и интегральным исчислением, без труда сможет показать, что для у ^з> О
    У

    оо

    L' (y) = h(y—y)p(y) +
    о
    у
    (XIX)

    = (h + n)(p(q)dq — n.

    о
    Таким образом, в силу (XVIII) и (XIX) S удовлетворяет условию
    S

    (XX)
    !) Читатель сразу же отметит, что приведенное здесь выражение для L (у)
    является непосредственным обобщением формулы (29) на случай непрерывных
    значений переменных.— Прим. перев.

    224

    ГЛАВА 19

    Численное значение s находится в результате решения неравенства (11).
    В этом разделе во всех формулах для затрат на содержание
    запасов фигурируют объемы изделий, остающиеся на складах к концу
    планового периода. Если затраты на содержание запасов носят
    линейный характер и оцениваются по значению у, то

    Если предположение относительно линейности сохраняется, но
    сумма затрат на содержание запасов оценивается по среднему значению уровня запасов J), то
    я + 0,5/1

    '

    19.5. МОДЕЛИ ЭКОНОМИЧЕСКИ ВЫГОДНЫХ РАЗМЕРОВ
    ЗАКАЗЫВАЕМЫХ ПАРТИИ

    В данном разделе мы будем исходить из предположений, существенно отличающихся от тех, которые постулировались нами при
    построении моделей статического типа. Мы переходим к рассмотрению ситуации, когда продолжительность планового периода не
    ограничена, и, следовательно, будет иметь место бесконечное число
    отдельных пополнений запасов. Поскольку динамический фактор
    значительно усложняет анализ проблемы, мы для упрощения
    модели будем предполагать, что спрос можно точно прогнозировать
    и он равномерно распределен по времени; другими словами, допустим, что количество изделий, запрашиваемых клиентами в течение
    единичного отрезка времени, равняется некоторому фиксированному
    2
    числу М ).
    Выбор шкалы времени (что эквивалентно выбору продолжительности упомянутого выше единичного отрезка) диктуется соображениями удобства и зависит от конкретных условий задачи. В нашем
    же случае при обсуждении приведенной ниже модели будем для
    определенности подразумевать под единичным временным отрезком
    1 неделю; например, если М = 30, то это будет означать, что, согласно принятому нами предположению, в течение недели общий спрос
    клиентов составит ровно 30 изделий, в течение 2 недель — 60 изделий, в течение V a недели — 15 изделий и т. д.
    Следует, кстати, отметить, что в большинстве учебных пособий
    по исследованию операций модель, к построению которой мы приступаем, рассматривается в главах, посвященных детерминистическим задачам управления запасами наподобие тех, которые были
    нами изучены в гл. 9. Мы перенесли подробное обсуждение этой
    *) Ожидаемое среднее значение запасов для заданного планового периода
    равняется
    0,5г/ + 0,5((/ — 2
    ) В таких случаях говорят, что имеет место постоянная норма спроса М.

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    225

    = Q- 45, s = О, М=

    Неделя

    Неделя

    Неделя

    Неделя

    Неделя

    Р и с . 19.3. Пилообразный график (s, ^-стратегии пополнения
    запасов. М — норма спроса; s — критический уровень запасов;
    S — объем запасов после очередного пополнения; Q = S — s — объем
    заказа на очередную поставку.

    модели именно в данную главу по той причине, что на практике
    почти всегда вместо детерминированной модели приходится использовать ее модифицированный вариант, позволяющий учитывать
    вероятностный характер спроса. Читатель должен рассматривать
    излагаемый здесь материал как основу для анализа стохастических
    вариантов моделей управления запасами, приводимых в следующем
    разделе.
    В рассматриваемых ниже задачах, связанных с определением
    оптимального размера объема заказа, как само время, так и уровни
    запасов описываются непрерывными переменными. Заметим, что это
    предположение резко контрастирует с условиями, которые постулировались для большинства динамических моделей, представленных
    нами в предыдущих главах. Вследствие непрерывности переменных
    различные элементы модели легко удается изобразить графически.
    Предположим снова, что М = 30, а стратегия пополнения запасов
    формулируется в виде следующего правила: всякий раз. когда уровень запасов становится нулевым, оформляется заказ на поставку
    45 изделий. Допустим также, что запаздывание поставок (по отношению к моменту оформления заказа) отсутствует, т. е. товары
    после того, как соответствующая заявка сделана, поступают на
    склад немедленно. Тогда уровень имеющихся в наличии запасов как
    функцию времени можно представить геометрически в виде графика
    (рис. 19.3). Приведем следующие характеристики рассматриваемой
    нами пилообразной модели:
    (I) С течением времени объем запасов от значения 45 единиц
    непрерывно убывает до нуля.
    (II) Скорость убывания запасов равняется 30 единицам в неделю,
    т. е. совпадает по своему значению с нормой спроса М.

    226

    ГЛАВА 19

    (III) Пополнение запасов осуществляется через каждые полторы
    недели (SIM = 45/30 = 1,5).
    Совершенно очевидно, что лишь в очень редких случаях можно
    быть уверенным в столь «безупречном» поведении спроса. Постулаты
    относительно стационарности и безошибочности прогнозирования
    спроса являются весьма жесткими. Тем не менее многие промышленные фирмы все же применяют в своей практической деятельности
    модели указанного выше типа, получая при этом значительные
    экономические выгоды за счет снижения затрат на содержание
    складских запасов. Однако, прежде чем использовать пилообразную
    модель управления запасами, ее, как правило, несколько модифицируют, с тем чтобы отразить вероятностный характер спроса.
    Обобщение модели, в результате которого удается учесть неопределенность значений уровня спроса, рассматривается в следующем
    разделе. Чтобы подготовиться к изучению этой обобщенной модели,
    читателю полезно ознакомиться с методом нахождения оптимальной
    стратегии пополнения запасов в случае, когда спрос прогнозируется
    с абсолютной точностью.
    Пусть затраты, связанные с пополнением запасов, складываются
    из накладных расходов К ^ 0 и покупной стоимости заказанной
    партии изделий 1 ), т . е .

    0

    при а; = 0,
    при х>Ъ.

    ^

    Предположим, что затраты на содержание запасов пропорциональны
    объему заскладированных изделий и являются линейной функцией
    времени; стоимость содержания одного изделия в течение единичного
    отрезка времени (недели) обозначим через h (h ^ 0). Обратим внимание на то, что все экономические показатели ведут себя стационарно,
    т. е. не меняются с течением времени. Заметим также, что в силу
    определения h затраты на хранение, например, 5 изделий в течение
    1 недели совпадают с затратами на хранение, скажем, 1 изделия
    в течение 5 недель или 2,5 изделия в течение 2 недель и т. д. Обычно
    /г является функцией с (возможен, например, вариант, когда h = h'c);
    однако, чтобы не усложнять обозначений, мы будем использовать
    только символ h. При анализе получаемых ниже формул следует
    помнить о том, что при изменении значения с, как правило, меняется
    и значение h. He представляет большого труда проанализировать
    модели, основанные на более сложных предположениях относительно
    фигурирующих в них экономических показателей; в частности,
    функция затрат, связанных с приобретением изделий у фирмыпоставщика, может иметь такой вид, при котором обеспечивается
    учет скидки цены в зависимости от размера приобретаемой партии.
    J

    ) Покупная стоимость заказанной партии товаров равняется сх, где х —
    количество приобретаемых изделий, а с — цена одного изделия (с !> 0).

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    227

    Однако в данной главе подобного рода ситуации не анализируются
    (см. упражнение 52).
    Поскольку, согласно принятому нами предположению, пополнение запасов может производиться неоднократно, можно ввести
    дополнительное требование, заключающееся в том, чтобы спрос
    удовлетворялся в полном объеме. (Приведенные ниже формулы фактически позволяют определить, при каких обстоятельствах предпочтительнее отказаться от дополнительного складирования того или
    иного изделия.) Фирма, однако, прежде чем оформлять заказ на
    дополнительную поставку, может позволить себе накопление портфеля невыполненных заказов; в таких случаях по прибытии заказанной партии изделий имеющиеся заявки должны быть немедленно
    удовлетворены, а оставшаяся часть изделий складируется для удовлетворения будущего спроса. Ситуации, при которых возникает
    портфель невыполненных заказов, характеризуются отрицательными значениями i. Для многих вполне реалистичных стационарных
    (т. е. линейных по времени) функций штрафных потерь, обусловленных разрешенной отсрочкой выполнения заказов, оптимальная
    стратегия обладает (s, 5)-структурой. т. е. формулируется следующим образом:
    когда i = s, оформляется заказ на поставку в объеме

    Q = S - s.

    (2)

    Формулировка (2) выглядит по сравнению с описанием (s, ^-стратегии, приведенным в предыдущем разделе, более краткой. Это
    объясняется тем, что если в какой-либо момент времени объем запасов равняется S, то по истечении Q/M недель он окажется точно
    равным s, поскольку мы предполагаем непрерывность расходования
    запасов с заранее известной скоростью М единиц в неделю.
    Читатель, по-видимому, сразу же заметит, что оптимум не может
    быть достигнут при выполнении жесткого неравенства s>0, поскольку при этом всегда имели бы место наличные запасы в объеме s (>0),
    хранение которых было бы сопряжено с феделенньтми затратами,
    но которые не участвовали бы в коммерческом обороте. Аналогично
    в условиях многократного пополнения запасов для любой реалистичной функции штрафных потерь оптимум не может быть достигнут
    при соблюдении жесткого неравенства S < 0. (Обоснование этого
    утверждения возлагается на читателя.) Таким образом, поиск оптимальных значений s и 5 обычно ограничивается областями значений s и 5, удовлетворяющих условиям s ^ 0 и S ^ 0.
    Если предположить, что продолжительность интервала времени
    исполнения заказа равняется нулю, т. е. пополнение запасов происходит сразу же после оформления соответствующей заявки- то
    получающийся в результате график (s, 5)-стратегии (в ее наиболее
    общей формулировке) будет иметь форму пилы с периодически
    повторяющимися экстремумами (рис. 19.4). Чтобы график функции,
    описывающей стратегию пополнения запасов, имел указанный вид,

    228

    ГЛАВА 19

    фактически достаточно вместо условия «мгновенной» поставки заказанных изделий принять менее жесткое ограничение, а именно
    предположить, что продолжительность интервала времени, требуемого для реализации заказа, является константой, численное
    значение которой заранее известно. Если продолжительность этого
    интервала времени равняется L, а фирма хочет получить заказанные
    ею изделия в тот момент, когда объем имеющихся в наличии запасов
    равняется s, то соответствующий заказ оформляется заблаговременно
    с упреждением в L недель. Поэтому если LM < Q, то критический
    уровень запасов просто смещается на LM единиц вверх по отношению к критическому уровню s, полученному при условии L = 0.

    Р и с . 19.4. Пилообразный график функции, описывающей
    (s, 5)-стратегию пополнения запасов.

    Отметим, что в случае, когда s < 0, норма спроса остается неизменной (т. е. равной М единиц в неделю), и, следовательно, значение
    тангенса угла наклона отрезка Ss по отношению к оси времени
    (рис. 19.4) остается неизменным и равным —М внутри каждого
    цикла.
    Наконец, предположим, что смысл оптимизации заключается
    в сведении к минимуму затрат в единицу времени. Если изделия
    подлежат складированию, то с учетом расходов на их приобретение
    и хранение можно получить для средней суммы затрат в единицу
    времени следующее выражение:
    КМ

    Каждое из слагаемых выражения (3) интерпретируется следующим образом:
    (1) KMIQ представляет собой среднее значение накладных расходов в единицу времени, поскольку MIQ — среднее число оформлений заказов в единицу времени.
    (2) Поскольку спрос покупателей должен быть удовлетворен
    полностью, в единицу времени у фирмы-поставщика закупается

    СТОХАСТИЧЕСКИЕ

    МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    229

    в среднем М изделий, и, следовательно, соответствующие расходы
    в среднем составляют сМ.
    (3) При пилообразном поведении уровня запасов (рис. 19.4)
    объем запасов характеризуется положительным значением на протяжении (5/0-й доли планового периода. Средний объем запасов
    в течение интервала времени, когда уровень запасов положителен,
    равняется S/2. Таким образом, произведение (S/Q) -(5/2) представляет собой средний объем запасов, отнесенный к единичному
    интервалу времени, и, следовательно, соответствующие затраты на
    хранение равняются hS2/2Q.
    Если критический уровень запасов s < 0, т. е. до прибытия
    пополнения накапливается портфель невыполненных заказов, то
    к выражению (3) следует прибавить средние штрафные потери за единицу времени. Поскольку в рассматриваемой нами модели задолженность по поставкам изделий клиентам полностью погашается за счет
    очередного пополнения запасов, клиенты не аннулируют свои заказы
    и, таким образом, штрафные потери не включают такой показатель,
    как потерянная прибыль. Однако накопление портфеля отсроченных
    заказов часто сопряжено с дополнительными канцелярскими работами учетного характера. В таких случаях штрафные потери включают дополнительную составляющую, значение которой предполагается пропорциональным объему отсроченных заказов по состоянию
    на момент времени, непосредственно предшествующий пополнению
    запасов (т. е. в тот момент, когда уровень запасов становится равным
    —s). В противоположность только что описанной ситуации в тех
    случаях, когда поступающее на склады изделие находит спрос внутри фирмы, штрафные потери нередко содержат составляющую, пропорциональную не только объему ожидающих исполнения заказов,
    но и продолжительности времени ожидания. Каждый из упомянутых
    случаев подробно исследуется ниже. Чтобы не возникало неясностей
    относительно влияния различных видов штрафных потерь на выбор
    оптимальной стратегии, а также чтобы не усложнять математические
    выкладки, мы рассмотрим каждый из указанных выше вариантов
    отдельно. Разумеется, возможна и комбинированная ситуация, анализ которой предполагает построение соответствующей единой
    модели. Здесь такого рода комплексные модели не рассматриваются.
    Штрафные потери, пропорциональные объему отсроченных заказов. Предположим, что если хотя бы некоторые из заказов клиентуры
    выполняются с отсрочкой, то соответствующие потери равняются
    произведению я на максимальное количество недостающих изделий
    (—s), где я > 0, a s ^ 0. Отсюда вытекает, что штрафные потери
    в размере л (—s) для каждого цикла носят единовременный характер, и, следовательно, соответствующие средние потери за единицу
    времени равняются

    я (—s) MIQ.

    (4)

    230

    ГЛАВА 19

    Поскольку Q = S—s, мы можем в выражении (4) вместо —s подставить Q — S ; легко убедиться в том, что после выполнения упомянутой операции замены мы с учетом (3) получаем следующую формулу для среднего значения затрат в единицу времени:
    Среднее значение
    затрат в единицу времени

    КМ , ,f . kS?- . „,
    АП
    = АС=з—+сМ
    + - = - + яМ

    nMS

    , сч
    . (5)

    Анализ задачи значительно упрощается, если дополнительно
    предположить, что я > (2Kh/M)1/2; это ограничение не является,
    вообще говоря, слишком жестким, так как численное значение
    коэффициента я обычно бывает весьма большим.
    Если изделие подлежит складированию, то, как будет показано
    ниже, оптимальное значение S равняется Q и, следовательно, s = 0.
    Однако оптимальным может оказаться вариант полного отказа от
    складирования.
    Для начала предположим, что оптимум действительно достигается при S = Q. Тогда формула (5) упрощается и принимает
    следующий вид:
    АС = —~- -+- сМ -\—^-.

    (6)

    Оптимальное значение Q находится в результате решения уравнения, которое получается после приравнивания нулю первой
    производной АС по Q. В итоге мы будем иметь следующие формулы:
    1

    Оптимальное значение
    Минимальное значение

    Q = (2KM/h) /*,
    1 2
    АС = сМ -\- (2KhM) / .

    Значение Q. получаемое с помощью приведенной выше формулы'
    часто называют экономически выгодным размером заказываемой
    партии (ЭВРП), а само соотношение, определяющее оптимальное
    значение Q. иногда называют формулой Уилсона.
    Если рассматриваемое изделие не складируется, то возникают
    потери, связанные с невозможностью удовлетворить спрос в объеме М
    за единицу времени. Предположим для простоты, что эти потери
    равняются пМ. Поскольку в рассматриваемом случае коэффициент я
    должен учитывать вероятность потери заказов (и, следовательно,
    потерю соответствующей части прибыли), он может с я и не совпадать. Из экономических соображений ясно, что
    если

    1

    яМ ^ сМ -г (2KhM) ^, то изделие складировать
    не следует.

    (8)

    В противном же случае изделие складируется, причем объем каждого очередного заказа на его поставку определяется с помощью
    формулы (7).

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    231

    Изложим в сокращенном виде аргументацию, лежащую в основе
    доказательства утверждения о том, что при я > (2Kh/M)l/z оптимальное значение Q равняется либо S, либо нулю. Введем в рассмотрение новую величину /, определяемую соотношением
    5 s / (I)
    Из (I) следует, что / удовлетворяет условию 0 ^/ ^ 1, поскольку
    s ^ 0 и S ^ 0. Кроме того, рассмотрим некоторую функцию С (/),
    такую, что
    СМ, если />0,
    О,
    если / = 0.
    Тогда после замены S —>• fQ в (5) задача оптимизации сведется
    к минимизации
    AC (Q, /) = KM/Q + С (/) + hfQ/2 + пМ - nMf.
    (II)
    Чтобы Q было оптимальным, необходимо, чтобы выполнялось
    условие *)
    —~~i = 0
    при />0,
    (III)
    откуда получаем, что
    л
    ^ ,
    Оптимальное значение Q = —(2KM/h).
    (IV)
    f/lVjlL/.y 1

    .-,

    f

    .-,

    /ТТТЧ

    В результате подстановки (IV) в (II) мы будем иметь AC [Q (/), /],
    представляющее собой линейную функцию /. Вычислим первую
    производную AC [Q (/), /] по / при / > 0:
    9 АС [?(/). /]= (2KhM)l/2—nM

    при/>0.

    (V)

    Из (V) следует, что dAG/df <; 0, поскольку, согласно предположению, л > (2Kh/M)1^. Таким образом, условие / = 1 является
    оптимальным, если AC [Q (1), 1] ^ nAf [см. соотношение (8)].
    Как уже отмечалось выше, рассмотренная нами модель имеет
    прямое отношение к ситуации, когда заказы в случае отсутствия
    наличных запасов тех или иных изделий теряются. Если предположить, что за счет каждой единицы неудовлетворенного спроса прибыль торговой фирмы сокращается на величину я, то можно доказать, что оптимальной снова является следующая стратегия: либо
    S — Q (спрос полностью удовлетворен), либо 3 = 0 (спрос остается
    полностью неудовлетворенным).
    Анализ ЭВРП на чувствительность. Заметим, что величина ЭВРП
    возрастает медленнее, чем в прямой пропорции к накладным расхоJ
    ) Это условие не является достаточным, поскольку оно не уточняет характер «экстремума». Убедиться в том, что определяемое условием (III) значение Q
    действительно соответствует минимуму, а не максимуму, можно лишь путем
    исследования второй частной производной АС по Q.— Прим. перев.

    232

    ГЛАВА 19

    дам К и норме спроса М, и убывает медленнее, чем в обратной пропорции к затратам на содержание запасов А. Например, если М увеличивается четырехкратно, ЭВРП возрастает лишь вдвое. Аналогичным образом легко убедиться, что при увеличении вчетверо значения h значение ЭВРП уменьшается только наполовину. Учтем, что
    продолжительность временного интервала между последовательными
    оформлениями заказа на поставку определяется следующей формулой:
    .-.
    ЭВРП = /I --—
    гк и/2
    .„.
    Оптимальное значение т1 =
    \ .
    (У)
    Следовательно, по мере возрастания нормы спроса М не только
    увеличивается оптимальное значение Q, но и уменьшается оптимальное значение Т, т. е. заказы на поставку изделия оформляются чаще.
    Фирма-поставщик нередко требует, чтобы объем заказываемых
    изделий выражался круглой цифрой. Так, например, если оптимальное значение Q = 53, то приходится (учитывая пожелание фирмыпоставщика) заказывать либо 50, либо 60 изделий. Попытаемся
    показать, что на величине среднего значения затрат лишь незначительно сказывается то обстоятельство, что вместо оптимального
    значения Q берется значение Q, лишь близкое к оптимальному.
    Допустим, что
    Фактическое значение Q =
    — г -(Оптимальное значение Q) = r (2KM/h)V2,
    где г > 0. Пусть переменную составляющую затрат можно записать
    в следующем виде *):
    КМ
    . h-Фактическое значение Q _
    ^ ' ~~ Фактическое значение Q '
    2
    __

    hr(2KM/h)1/2

    KM

    ,-Г

    2

    '

    ....
    \ '

    С помощью (11) нетрудно проверить, что

    Подставляя в (12) различные пробные значения г, можно убедиться
    в том, что значение переменной части затрат при небольших отклонениях значения Q от оптимального возрастает незначительно.
    Так, например,
    VC (r)/VC (1) < 1,1 в интервале 0,64 < г < 1,56.
    (13)
    [Заметим также, что VC (r)/VC (1) не меняет своего значения при
    замене г на г', где г' == 1/г.]
    х

    ) Соотношение (11) получается из формулы (6) простой подстановкой
    вместо оптимального значения Q его фактического значения (фиксированную
    компоненту сМ при этом, естественно, следует опустить).

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    233

    Модель, аналогичная только что рассмотренной, но предполагающая дискретную структуру планового периода и дискретный
    характер переменной, определяющей объем складируемых изделий,
    анализировалась нами ранее (разд. 11.4) с помощью так называемого
    метода восстановления. Чтобы удобнее было сравнивать дискретный
    и непрерывный варианты задачи, воспроизведем основные элементы
    модели, приведенной нами в разд. 11.4, используя обозначения,
    которые приняты в настоящей главе.
    Для определенности будем понимать под М целое число изделий, запрашиваемых клиентами в течение недели. Пусть Ст — суммарные затраты, связанные с реализацией заказа на поставку МТ единиц товара, где Т = 1, 2, . . . . Другими словами, величина Ст
    включает в себя все расходы фирмы за Г-недельный период и определяется формулой

    (I)

    CT = K-{-cMT + ^hM(T — \ ) T .
    Задача

    заключается в том, чтобы

    Минимизировать (%£-} =min № + cM + ±-hM (T — l ) \ .
    T = i 2 ..

    \ -*

    /

    у

    I J

    ^

    J

    (II)

    Временно абстрагируясь от условия дискретности Т. продифференцируем правую часть соотношения (II), приравняем вычисленную производную по Т нулю и разрешим полученное таким образом
    уравнение относительно Т. В результате получим
    Т* = (2А7Ш)1/2,
    что совпадает с выражением (9). Соответственно получим
    Q* = МТ* = (2KM/h)V*.

    (III)
    (IV)

    Поскольку значение Т*, вычисленное по формуле (II), как правило,
    оказывается дробным, требуется вычислить значение правой части
    соотношения (I) для ближайших целых чисел, округляющих Т*
    снизу и сверху, и выбрать более выгодный вариант.
    Чтобы лишний раз убедиться в правильности понимания способа
    получения формулы (5), необходимо вычислить СТ1Т в случае,
    когда фигурирующие в модели переменные могут принимать непрерывный ряд значений. В результате после замены МТ ->- Q должно
    получиться выражение, эквивалентное правой части соотношения (5).
    Штрафные потери, пропорциональные среднему объему задолженности по поставкам. Предположим теперь, что потери торговой
    фирмы оцениваются по среднему значению объема невыполненных
    заказов на единичном отрезке времени, т. е. аналогично тому, как
    оценивались затраты на содержание запасов. Обращаясь снова
    к графику, приведенному на рис. 19.4, мы видим, что доля времени,

    234

    ГЛАВА 19

    в течение которого система функционирует в режиме разрешенной
    отсрочки выполнения заказов, равняется —s/Q, где критический
    уровень s ^ O . Средний размер портфеля неудовлетворенных заказов на отрезке времени, характеризуемом отрицательным уровнем
    запасов, составляет (—s/2) изделий. Следовательно, средний объем
    неудовлетворенных заказов на единичном отрезке времени равняется
    sz/2Q. Чтобы определить среднее значение штрафных потерь за единицу времени, эту величину нужно умножить на соответствующий
    «штрафной» коэффициент, который для удобства сравнения с результатами, полученными в предыдущем подразделе, мы снова обозначим через я (>0). Однако следует иметь в виду, что показатель я
    в рассматриваемой модели имеет иную интерпретацию, чем в предыдущем случае. Если говорить определеннее, то следует заметить, что
    теперь я характеризует потери фирмы-поставщика, отнесенные
    к одному изделию и к единичному интервалу времени, тогда как
    в рассмотренном выше примере под я мы просто подразумевали
    штраф за отсрочку поставки клиентуре одного изделия вне зависимости от продолжительности задержки заказа. Вновь воспользовавшись тождеством S — s = Q, с тем чтобы исключить величину s,
    мы после некоторых упрощений получим следующую формулу для
    среднего значения затрат в единицу времени:
    Г Среднее значение "1
    затрат в единицу = АС = ±£- + сМ + ( + "' S'" — nS + ~ Q.
    I времени
    I

    (14)

    (В данном случае нет никакой необходимости рассматривать в явном
    виде предположение о том, что значение я превышает значения экономических показателей, характеризующих другие виды затрат.)
    Возьмем теперь частную производную АС по 5 и приравняем
    ее нулю. После соответствующих упрощений получим

    Повторив указанные выше операции над Q и применив (15) для
    того, чтобы исключить 5, получим следующие формулы:
    Оптимальное значение Q = (2КМ)1/* (i/h + Ш)1/2.
    Оптимальное значение S = (2/ШУ/г)1/2 (я/ (А. + я))1/2,
    1 2
    1 2
    Оптимальное значение s = — (2КМ/Л.) / (n/(h + я)) ' ,
    l z
    1 3
    Минимальные АС = cM + (2KM) f f(i/h
    + 1/я) / .

    (16)

    Каким оказывается при этом оптимальный интервал времени
    между последовательными пополнениями запасов? Как и в предыдущем случае, решение относительно того, целесообразно или нет
    складировать изделия, определяется результатами сравнения АС
    в (16) с потерями, возникающими от неполного удовлетворения
    спроса.

    СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    235

    Мы уже предупреждали читателя о том, что единицы измерения
    штрафных потерь, используемые в формулах (16), не совпадают
    с единицами измерения аналогичного рода экономических потерь,
    использованными нами при получении формул (7). Тем не менее
    поучительно сравнить результаты, представленные соотношениями (16), с результатами, представленными формулами (7), используя
    одинаковые численные значения я. Из (16), в частности, вытекает,
    что при ограниченном значении я оптимальное значение Q больше
    оптимального значения Q в предыдущем случае; оптимальное значение S меньше оптимального значения S в предыдущей модели;
    критический уровень s (s < 0) в (16) ниже соответствующего значения s в предшествующем случае; минимальные средние затраты в (16)
    меньше минимальных средних затрат в (7). Лишь в случае, когда
    п —>• оо, значения перечисленных выше характеристик в обоих
    вариантах модели оказываются одинаковыми. Кроме того, следует
    отметить, что только при h -*- оо оптимальным является решение
    S = 0; однако даже в этом случае Q и s принимают ограниченные
    значения.
    Читателю предлагается внимательно исследовать формулы (16)
    с тем, чтобы определить, как изменяются оптимальные значения Q,
    S. s и АС при вариациях значений К, h, л и. М. В частности, следует
    обратить внимание на то, что оптимальное значение Q убывает
    с ростом я, а оптимальное значение s убывает как при увеличении
    накладных расходов К. так и при возрастании нормы спроса М.
    Заметим, что, согласно соотношению (15), при h = я в течение второй половины интервала между последовательными пополнениями
    запасов происходит накопление портфеля невыполненных заказов
    (т. е. торговая фирма функционирует в режиме разрешенной задержки удовлетворения запросов клиентуры).
    Проблема запасов на промышленных предприятиях. Рассмотренные выше модели экономически рационального регулирования запасов соответствовали ситуации, когда фирма, занимающаяся оптовой торговлей теми или иными изделиями, приобретает их у промышленной фирмы-поставщика. Стратегия регулирования запасов
    соответственно формулировалась так, чтобы отвечать когда и в каком
    количестве заказывать требуемые товары. Обратимся теперь к задаче
    регулирования запасов в рамках самой промышленной фирмы, если
    некоторые из видов продукции выпускаются этой фирмой отдельными
    партиями. Многие из экономических категорий, фигурирующих
    в рассмотренных моделях (такие, как накладные расходы, затраты на содержание запасов, штрафные потери от неудовлетворенного спроса и т. д.), в равной степени характеризуют и только что
    упомянутую ситуацию. Предположим, что управляемые переменные
    стационарны во времени, и допустим, что предположения относительно спроса остаются в достаточной степени реалистичными.
    Можно ли при этих условиях утверждать, что оптимальная стратегия
    складирования продукции и регулирования уровней производства

    236

    ГЛАВА 19

    будет иметь (s, 5)-структуру, аналогичную структуре, представленной формулами (7) или (16)? Анализ показывает, что далеко не
    всегда.
    Существенная разница между ситуацией, когда изделия приобретаются у фирмы-поставщика, и ситуацией, когда изделия выпускаются промышленным предприятием, принадлежащим самой фирме,
    заключается в том, что для обеспечения производственного процесса
    требуются ресурсы совершенно иного рода, а именно рабочая сила,
    оборудование, различные компоненты для изготовления конечного продукта и т. п. Многие промышленные предприятия тщательно
    планируют свои производственные показатели заранее, учитывая
    наличие рабочей силы, ограниченность производственных мощностей и возможность обеспечения производства необходимыми материалами. Поэтому, если поставить задачу регулирования запасов
    всех видов изделий, производимых фирмой, и анализировать ее
    с помощью изложенных выше методов (или, например, с помощью
    метода, к рассмотрению которого мы перейдем в следующем разделе),
    то полученный таким путем результат, возможно, не удастся согласовать с разработанным фирмой производственным планом. Короче
    говоря, однопродуктовая модель ЭВРП в условиях, когда имеет
    место множество различных видов изделий, производимых самой
    фирмой, как правило, оказывается плохим приближением к действительности, ибо такая модель не учитывает текущих ограничений на
    дефицитные виды ресурсов.
    Для оптимизации про