• Название:

    Вагнер Основы ИСО т 2

  • Размер: 9.99 Мб
  • Формат: PDF
  • или

    Г. ВАГНЕР

    ОСНОВЫ
    ИССЛЕДОВАНИЯ
    ОПЕРАЦИЙ

    Harvey M. Wagner
    Department of Administrative Science Yale University;
    Consultant to McKinsey and Company, Inc.

    Principles
    of
    Operations
    Research
    With Applications to Managerial Decisions

    Prentice-Hall, Inc., Englewood Cliffs,
    New Jersey 1969

    Г. ВАГНЕР
    ОСНОВЫ
    ИССЛЕДОВАНИЯ
    ОПЕРАЦИИ

    Том 2

    Перевод
    с английского
    В. Я. Алтаева

    Издательство «Мир»
    Москва 1973

    У Д К . 35.073.5

    Том посвящен
    методам динамического, целочисленного
    и нелинейного программирования. Рассмотрены различные классы
    динамических моделей (модели управления запасами, модели распределения, модели замен и ряд других) и обсуждены процедуры
    построения соответствующих алгоритмов оптимизации. Приведен
    подробный анализ зависимости этих процедур от величины интервала времени, для которого ведется поиск оптимальной стратегии.
    Операционным задачам, решение которых можно получить
    методами целочисленного программирования, посвящена специальная глава. В ней обсуждены также возможности и особенности
    комбинаторных приемов оптимизации.
    Разделы, в которых рассматриваются нелинейные модели,
    содержат описание всех представляющих практический интерес
    методов оптимизации, включая разделение переменных, линеаризацию и аппроксимацию решений выпуклыми и вогнутыми функциями. Специально рассмотрен случай нелинейных ограничений.
    Приведен обобщенный алгоритм нелинейной оптимизации.

    Редакция литературы по вопросам новой техники

    D

    3314-335
    041(01)-73

    £5 7Г77"

    Г. ВАГНЕР

    Основы исследования операций
    Том 2
    Редактор М. ВЕЛИКОВСПИН
    Художник А. Шипов.
    Художественный редактор Ю. Урманчеее
    Технический редактор Н. Иовлева
    Сдано в набор 26/Х 1972 г. Подписано к печати
    /II 1973 г.
    Бумага № 1 60x901/16=15,25 бум. л. 30,50 печ. л. Уч.-изд. л. 32,39 Изд. •№ 2 0 / 6 4 7 9
    Цела' 2 р. 54 к. Зак. 0734^} 3L<^tO
    ИЗДАТЕЛЬСТВО «МИР» Москва,

    1-й

    Рижский пер., 2

    Ордена Трудового Красного Знамени Московская типография № 7 «Искра революции»
    Союзполиграфпрома при Государственном комитете Совета Министров СССР по делам
    издательств, полиграфии и книншой торговли. Москва, К-1, Трехпрудный пер., 9.

    ГЛАВА 8

    Введение в теорию динамических
    оптимизационных моделей
    8.1. АНАЛИЗ ДИНАМИЧЕСКИХ ПРОЦЕССОВ

    Элементы динамики и учет времени играли важнейшую роль
    в нескольких прикладных задачах исследования операций, рассмотренных в предыдущих главах,— как, скажем, в общей задаче планирования производственной программы (разд. 2.6). Однако ранее
    основное внимание уделялось рассмотрению алгоритмов, которые
    позволяют находить решения системы, включающей большее число
    ограничений. Мы, например, выяснили, каким образом симплексный метод позволяет на каждой итерации получать допустимый
    план, удовлетворяющий всем ограничениям системы. В том же
    контексте анализировалась устойчивость решения задачи линейного программирования. В гл. 6 и 7 рассмотрены особенности структуры сетевых моделей; основное внимание здесь было уделено
    эффективным методам отыскания численных решений задач большой
    размерности. Единственным важным отступлением от подобного
    подхода является алгоритм решения задачи отыскания кратчайшего
    пути на ориентированной ациклической сети (разд. 7.7). В этом
    алгоритме используется «односторонняя ориентация» сети, и читателю рекомендуется снова внимательно его рассмотреть, прежде
    чем приступить к изучению разд. 8.2.
    В гл. 8—12 решающее значение по-прежнему имеет одновременный учет всех ограничений системы, однако излагаемый здесь материал в основном посвящен динамическим структурным зависимостям оптимизационных моделей. В этих главах рассматриваются
    только детерминированные задачи, так что в каждой из них процесс решения приводит к однозначному результату. Вероятностные модели исследуются в гл. 17—18. Однако читатель увидит,
    что аналитические методы решения большинства вероятностных
    задач являются непосредственным обобщением тех подходов,
    которые излагаются в гл. 8—12. Соответственно изучение методов
    решения детерминированных задач оказывается весьма полезным
    и в качестве подготовки к рассмотрению вероятностных моделей.
    В гл. 8—12 основное внимание будет уделено форме и свойствам
    оптимальных планов. Будут изучены условия, которым должен
    удовлетворять оптимальный многошаговый процесс принятия решений, и исследовано, каким образом использовать эти условия для
    нахождения лучшего варианта. Подобный анализ часто называют
    динамическим программированием.
    Основным предметом рассмотрения в гл. 8 является анализ
    устойчивости решений во времени. Например, читатель увидит, что

    ГЛАВА 8

    увеличение длительности планового периода может существенно
    повлиять на правильность текущего выбора. Наряду с этим вопросом будет также изучено влияние начальных условий (начальный
    уровень запасов) и ограничений (ограниченность производственных
    мощностей).
    Во всех моделях, рассматриваемых в гл. 8 — 10, плановый период является конечным — например, он может быть равен году или
    десятилетию. В гл. И — 12 будут обсуждены особенности оптимизации в условиях бесконечного планового периода. (Вопросы дисконтирования во времени и приведения экономических показателей
    к исходному моменту времени будут излагаться лишь в гл. 11.)
    За увеличение глубины анализа динамических процессов приходится платить. Так, в этом случае необходимо радикально сокращать размерность (число ограничений) динамических оптимизационных моделей по сравнению с типичными задачами линейного программирования. Однако предлагаемый подход дает не только ценные
    дополнительные результаты, но и ряд практических преимуществ.
    Одно из них уже упоминалось выше: это возможность использования
    динамического программирования при бесконечном .плановом
    периоде. Другое его преимущество состоит в том, что такой подход
    позволяет решать ряд задач небольшой размерности, являющихся
    тем не менее важными частными случаями задач нелинейного программирования. К ним относятся задачи с нелинейной целевой
    функцией и небольшим числом нелинейных ограничений, а также
    задачи с целочисленными переменными. В гл. 10 будут приведены
    конкретные примеры, показывающие, что подобные задачи, даже
    внешне простые, могут быть сложными и запутанными. Наконец,
    приведенные численные методы применимы и к ряду проблем принятия решений, по существу не являющихся динамическими, которые, однако, для удобства алгоритмизации можно рассматривать
    как динамические или преобразовывать в многошаговые.
    Для того чтобы читатель видел все излагаемые вопросы в должной перспективе, подчеркивается, что численные решения всех
    моделей в гл. 8—10 можно получить с помощью ранее изученных
    алгоритмов (в частности, алгоритма нахождения кратчайшего пути
    на ориентированной ациклической сети). Важнейшая наша цель —
    научиться представлять модели в таком виде, в котором выявляются их динамические свойства. Эта цель достигается отчасти благодаря тому, что наш словарь в области исследования операций пополняется новыми терминами, а отчасти благодаря введению удобной системы математических обозначений. Однако читатель поймет,
    что не существует простых правил, механическое применение которых в любой задаче позволяет выявить ее динамические свойства.
    Лучшим учителем является опыт, поэтому в тексте приводятся многообразные примеры. Многие конкретные оптимизационные задачи
    удается сформулировать несколькими внешне различными способами, причем, как будет видно из дальнейшего, в каждой из форму-

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    7

    лировок в центре внимания находится та или иная из структурных
    зависимостей.
    Значение динамического программирования. Сделанные выше
    вводные замечания должны облегчить читателю переход к новой
    точке зрения, отличной от той, которая развивалась в предыдущих
    главах. Однако до сих пор ничего не говорилось о практической важности изучаемых далее моделей. Велико ли их экономическое значение?
    Как было показано в предыдущих главах, модели линейного
    программирования в большинстве случаев используются в промышленности для принятия крупномасштабных плановых решений
    в сложных ситуациях. В то же время модели динамического программирования обычно применяются при решении задач значительно меньшего масштаба. Вот некоторые типичные области применения моделей динамического программирования при принятии
    решений:
    Разработка правил управления запасами, устанавливающих
    момент пополнения запасов и размер пополняющего заказа.
    Разработка принципов календарного планирования производства и выравнивания занятости в условиях колеблющегося
    спроса на продукцию.
    Определение необходимого объема запасных частей, гарантирующего эффективное использование дорогостоящего оборудования.
    Распределение дефицитных капитальных вложений между
    возможными новыми направлениями их использования.
    Выбор методов проведения рекламной кампании, знакомящей
    покупателя с продукцией фирмы.
    Систематизация методов поиска ценного вида ресурсов.
    Составление календарных планов текущего и капитального
    ремонта сложного оборудования.
    Разработка долгосрочных правил замены выбывающих из
    эксплуатации основных фондов.
    Большинство этих применений детально рассматривается в настоящей и последующих главах, так что здесь не требуется дополнительных пояснений.
    Процессы принятия решений, к которым относится ряд упр.мянутых выше моделей, часто относятся к числу микроэкономических.] Однако во многих реально функционирующих системах еженедельно требуется принимать тысячи таких решений. В связи с этим модели динамического программирования ценны именно тем, что они позволяют
    принимать миллионы решений на основе стандартного подхода (часто
    с использованием ЭВМ) при минимальном вмешательстве человека.
    Без слов понятно, что даже если каждое из таких решений, взятое
    в отдельности, не является существенным, то в совокупности они
    могут оказывать большое влияние на прибыли фирм. Многие фирмы,
    воспользовавшиеся моделями динамического программирования,

    ГЛАВА 8

    были неплохо вознаграждены — им удалось добиться сокращения
    затрат на обслуживание и ремонт или же уровня запасов на 25% и
    более, причем без какого-либо ухудшения качества обслуживания.
    Небольшое наставление. Общей особенностью всех моделей динамического программирования является сведение задачи принятия
    решений к получению рекуррентных соотношений. Если читатель
    никогда не пользовался подобными формализованными методами для
    решения задач, то связанная с этим система математических обозначений может показаться ему странной и даже вызывающей недоумение. Приводимые ниже советы помогут читателю преодолеть подобные трудности.
    Текст рекомендуется прочесть не менее двух раз. При первом
    чтении следует постараться понять смысл поставленной задачи
    и хорошо ознакомиться с условными обозначениями; при втором чтении больше внимания целесообразно уделять деталям постановки,
    в том числе и характеру математических выражений. Необходимо
    внимательно ознакомиться с численными примерами и проверить
    правильность расчетов во всех тех случаях, когда это рекомендуется 1
    в тексте. Наконец, необходимо проявить терпение и не жалеть времени на изучение материала. Быстро усвоить методы динамического
    программирования удается далеко не всем, причем дело может медленно продвигаться даже у тех, кто сталкивался с рекуррентными
    соотношениями прежде. Однако если следовать приведенным советам,
    то после рассмотрения нескольких примеров в какой-то момент внезапно наступает «озарение», после чего читатель перестает испытывать трудности в понимании смысла рекуррентных соотношений.
    8.2. ЗАДАЧА

    О ДИЛИЖАНСАХ:

    АЛЛЕГОРИЯ

    На аллегорическом примере объясним некоторые важные идеи
    динамического программирования, а также построим систему условных обозначений динамических моделей^ Сама задача не содержит
    ничего нового — в ней попросту требуется найти кратчайший путь
    на ориентированной ациклической сети. Однако рассматриваемый
    в настоящем разделе конкретный пример содержит больше пояснений, чем пример в разд. 7.7, где излагался алгоритм нахождения
    кратчайшего пути.
    >
    Пример. Жил некогда мистер М., который решил отправиться
    искать счастья в Сан-Франциско. В те дни дилижансы были единственным видом общественного транспорта для поездки из восточных
    штатов, где проживал мистер М., на Запад. В бюро путешествий ему
    показали карту Соединенных Штатов (рис. 8.1) с нанесенными на ней
    дилижансовыми маршрутами, которые обслуживались в то время.
    Каждый квадрат на карте изображает один из штатов (состояний);
    для удобства штаты пронумерованы. Заметим, что, какой бы из
    вариантов пути от штата 1 (Восток) до штата 10 (Запад) мы ни выбрали, он включает 4 дилижансовых маршрута — или 4 «шага».

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    9

    Поскольку мистеру М. было известно, что путешествие связано
    с серьезными опасностями для здоровья и жизни, перед отъездом он
    решил застраховаться. Ставка страхового платежа (иными словами,
    стоимость, отвечающая принятой стратегии выбора пути) зависела
    от избираемых дилижансовых маршрутов, и она была тем выше,
    чем опаснее маршрут. Обозначим через Сц стоимость страхового
    полиса для переезда из штата i в штат /. Условные численные значения сц проставлены на рис. 8.1. Цель мистера М.— выбрать
    ю

    Запад

    Р и с . 8.1. Задача о дилижансах.
    такой путь от штата 1 до штата 10, для которого общая стоимость
    страхования является минимальной (читателю рекомендуется отыскать оптимальный путь самостоятельно).
    Мистер М. начал анализ проблемы с того, что признал существенным сформулированный ниже принцип.
    П р и н ц и п о п т и м а ль н о е т и., Оптимальная стратегия
    обладает тем свойством, что, каков бы ни был путь достижения некоторого штата (или состояния), последующие решения должны принадлежать оптимальной стратегии для части пути, начинающейся
    с этого состояния.
    Таким образом, мистер М. понял, что, например, оптимальный
    путь из штата 6 не зависит от того, каким маршрутом он прибудет
    в него. (Вопрос читателю: как найти оптимальный маршрут из штата
    6?) Развивая эту логическую идею далее, мистер М. пришел к выво-

    10

    .

    ГЛАВА 8

    ду, что если бы он знал оптимальные пути из штатов 5, 6 ж 7, то смог
    бы достаточно легко определить и оптимальный путь из штата 3 —
    конечно, если бы он решил ехать через этот штат. В самом деле,
    потребовалось бы лишь суммировать стоимость переезда из штата 3
    (буть то с35, с3б или сг7) с ранее вычисленной стоимостью оптимального
    пути (соответственно из штатов 5, 6 или 7), а затем сравнить полученные суммы и выбрать тот штат, для которого эта сумма минимальна.
    Аналогичным образом, найдя оптимальные пути из штатов 2, 3 и 4,
    можно определить оптимальный путь из штата 1. (Вопрос читателю:
    как это сделать?)
    Для того чтобы учесть сформулированный принцип оптимальности
    и его вычислительный смысл, удобно использовать следующие обозначения:
    /л (s) — стоимость, отвечающая стратегии минимальных затрат
    для пути от штата (состояния) s, если до конечного штата остается
    п шагов;
    jn (s) — решение, позволяющее достичь /„ (s).
    Многих начинающих чрезвычайно затрудняет подобная система
    обозначений, которую всегда используют в моделях динамического
    программирования, и это объясняется тем, что она выглядит весьма
    сложной. Однако все эти б^квы и индексы необходимы и несут важную смысловую нагрузку:!/ означает, что данное число есть значение
    целевой функции, s — что это значение зависит от состояния системы,
    подстрочный индекс п несет динамическую информацию о том, что
    из состояния s необходимо сделать еще п шагов; наконец, символ j
    зависит как от шага п, так и от состояния s и соответствует некоторому фиксированному пути.
    Читая описание приводимых здесь и далее задач динамического
    программирования, иногда полезно просто выучить смысл обозначений, как заучивают значения слов при овладении иностранным языком. В моделях линейного программирования нет необходимости
    в столь сложной системе обозначений, поскольку эти модели решаются «за один шаг». Иное положение в динамическом программировании, где мы приходим к решению за ряд шагов. Будем надеяться,
    что эти соображения послужат некоторым утешением для читателя.
    Возвратимся к задаче, стоящей перед мистером М. Он знает
    /о (Ю):
    /о (10) = 0 для у о (10) = Остановка,
    (1)
    поскольку для штата 10 число оставшихся шагов равно нулю, т. е.
    в этом штате путешествие заканчивается. Затем он видит, что очень
    легко вычисляются /i (8) и /i (9): к / 0 (10) попросту надо прибавить
    соответственно с 8]10 или с 9]10. Ободренный достигнутыми успехами,
    мистер М. решил вычислить /2 (6) — стоимость стратегии минимальных затрат, отвечающей его нахождению в штате 6, т. е. за два шага
    до конечного пункта. Он заметил, что если он попадет в штат б, то
    далее можно следовать только по двум путям. Первый из них —

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    Ц

    через штат 8', стоимость соответствующей стратегии определится,
    если прибавить с в>8 к вычисленному ранее значению /i (8). Второй
    путь — через штат 9; для вычисления его стоимости прибавим c 6i9
    к значению /i (9), которое также уже вычислено. Мистер М. понял,
    что значение /2 (6) должно равняться меньшей из этих двух сумм.
    (Вопрос читателю: таким ли способом он определял оптимальный
    маршрут из штата б?)
    Здесь мистер-М. начал подозревать, что в его подходе можно обнаружить известную методичность, и, разумеется, он был прав. Кратко
    описываемый метод можно представить в виде так называемого дина,ми_ческо.го рекуррентного соотношения:
    /»(s)=

    min

    по всем s
    и з на сети

    [ct] + /„-!(/)],

    в = 1, 2, 3, 4.

    (2)

    Выражение (2) означает, что мистер М. должен вычислить все
    возможные значения стоимости, отвечающие различным стратегиям,
    суммируя соответствующую стоимость для очередного шага пути
    (переезда из штата s в штат j), и стоимость, отвечающую оптимальной стратегии выбора пути, от штата /, из которого до конца пути
    остается только (п — 1) шагов. Вычисленные суммы следует сравнить между собой и выбрать такое у, для которого значение этой
    суммы минимально. Мистер М. пришел к выводу, что он должен применять выражение (2) следующим образом: вначале вычислить все
    /i (s), т. е. /! (8) и /i (9); затем в свою очередь для п = 2 вычислить
    /2 (5), /2 (6) и /2 (7); затем определить /3 (2), / 3 (3) и / 3 (4). Задача будет
    решена после вычисления /4 (1), так как штат 1 — начало путешествия вдоль пути, включающего 4 шага.
    Описанный выше метод решения задач можно назвать «методом
    самообеспечения». Вычислительный процесс начинается с простых,
    пожалуй, даже тривиальных расчетов. Полученный результат
    используется для выполнения дальнейших вычислений, после чего
    процедура повторяется снова^ В принятых условных обозначениях
    формула (2) означает, что, зная / 0 (s), можно вычислить /i (s), зная
    /i (s),— / 2 (s) и т. д. Такая вычислительная процедура именуется
    рекуррентным алгоритмом, а выражение (2) — рекуррентной формулой или рекуррентным соотношением.
    Вычислительный процесс. Рассмотрим применение рекуррентного
    алгоритма, выполнив необходимые вычисления для численных значений Си, проставленных на рис. 8.1.
    Для п = 1, руководствуясь выражениями (2) и (1), следует
    выполнить следующие тривиальные вычисления:

    /i (8) = св 10 + 0 = 1 для У! (8) = 10 (s = 8),
    fi (9) = сэ 10 + 0 = 4

    для h (9) = 10 (s = 9).

    (3)

    Упорядоченная запись остальных вычислений выполняется в таблицах, приведенных на рис. 8.2—8.5.

    ГЛАВА 8

    12

    Для каждого из фиксированных значений числа оставшихся
    шагов п (а именно для п, равного 1, 2, 3 или 4) построена одна
    таблица. В ней предусмотрено: по одной строке для каждого состояния, из которого остается сделать п шагов и по одному столбцу
    для каждого состояния, из которого остается сделать на шаг меньше.
    Так, в таблице для п = 1 (рис. 8.2) имеются две строки, для штатов 8

    п=г с
    . Пере код в со-

    8

    3

    Jzti

    ($(*))

    £-

    и

    7+i

    5+
    8

    8

    6

    3+1

    4 +4

    8

    4

    7

    7+1

    1+4

    9

    S

    Переход в со-

    V4
    Состояние
    (штат)

    0



    10

    j,(sl

    f,(s)

    1+0

    10

    1

    4 +0

    Iff

    4

    Р и с . 8.2. Задача о дилижансах.

    Мсходнае
    состояние
    (штат)

    Р и с . 8.3. Задача о дилижансах.

    и 9, поскольку мистер М. может выбрать маршрут, проходящий
    через любой из них. Однако в этой таблице — всего один столбец
    (для штата 10), поскольку из штатов 8 и 9 можно попасть только
    в штат 10. Для п = 2 (рис. 8.3) мистер М. может выбрать штаты 5, 6
    или 7, поэтому в таблице три строки; но из этих штатов он может
    попасть только в штаты 8 или 9, поэтому в таблице два столбца.
    Цифры в основных столбцах таблицы (слева от двойной вертикальной черты) представляют собой сумму стоимости очередного
    шага csj — перехода из состояния s в состояние j — и стоимости
    / n _i (/), соответствующей оптимальной стратегии для части пути,
    начинающейся из состояния /. В каждой строке выбирается наименьшая из этих сумм; она проставлена в первом столбце справа и обозначена fn (s). Соответствующий оптимальный выбор состояния у обозначен ;'„ (s) и проставлен во втором столбце справа.
    Вычисления для п = 1 повторно приведены в таблице рис. 8.2.
    В данном примере, при п = 1, единственным возможным выбором
    является j = 10. Поэтому /j (8) = }^ (9) = 10, что уже было отмечено в выражениях (3).
    Вспомним, что при п = 2 значение / может равняться только 8
    или 9. Для выполнения вычислений при п = 2 должны быть известны
    cs7-, а кроме них лишь значения ft (/'). Вычисления приведены в таблице рис. 8.3. Отметим, что fi (8) = 1 прибавляется к каждой из величин cs8 в столбце для j = 8, а Д (9) = 4 — к каждой из cs9 в столбце
    для / = 9. Из таблицы видно, что оптимальный маршрут при п = 2
    из штатов 5 ж 6 проходит через штат 8, а из штата 7 — через 9.
    Вычисления для п = 3 приведены в таблице рис. 8.4. Заметим,
    что здесь две клетки заштрихованы («запрещены»), поскольку из
    штата 2 нельзя попасть в штат 7, а из штата 4 — в штат 5.| Еще раз

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    13

    отметим, что из предыдущей таблицы.(рис. 8.3) потребовалось взять
    только значения / 2 (]). Это важнейший момент во всех методах динамического программирования: стратегия оптимальных затрат для п
    77=3

    Cy+f2(j)

    Переход ff со-

    V
    J\

    5

    6

    2

    W+8

    /2+4

    5+8

    Ю +4

    Состояние
    (штат) 3
    /

    4

    /////'/

    7

    7+5

    ^
    13+5
    15+4 ^

    лМ

    fa(f)'

    6

    16

    7

    12

    7

    18

    Р и с . 8.4. Задача о дилижансах.
    шагов определяется экономическими последствиями очередного решения и стратегией оптимальных затрат для остальных (п — 1)
    шагов.
    Завершающие вычисления (для п = 4) приведены в таблице
    рис. 8.5. Из этой таблицы видно, что стоимость, отвечающая стратегии минимальных затрат, равна

    U (1) = 17 для

    / 4 (1) = 3.

    (4)

    Какая оптимальная стратегия соответствует этому значению
    целевой функции? Для того чтобы ответить на этот вопрос, необходимо использовать таблицы следующим образом: начнем с таблицы

    V
    5\
    Состояние ,
    (штат)

    Пц lexad в соста тие (ш 'ПО.ПТ)
    и
    4
    2
    2+16

    5+12

    1+1&

    ш
    3

    ф)
    17

    Р и с . 8.5. Задача о дилижансах.
    для п = 4 (рис. 8.5) и установим, что оптимальный маршрут из
    штата 1 проходит через штат 3. Перейдем к таблице для п = 3
    (рис. 8.4), из которого видно, что, если мистер М. следует через
    штат 3 (вторая строка), оптимальный путь заключается в переезде
    в штат 7. Продолжим рассмотрение, перейдя к таблице для п = 2
    (рис. 8.3), согласно которой оптимальный путь из штата 7 проходит
    через штат 9. Наконец, из штата 9 мистер М. следует в штат 10, где
    путешествие заканчивается. В целом оптимальным является путь
    1—3—7—9—10, затраты по которому составляют / 4 (1) = 5 + 7 +
    + 1 + 4 = 17.

    14

    ГЛАВА 8

    Очевидно, динамическое программирование здесь более эффективно, чем прямой перебор всех возможных маршрутов, сопровождаемый их оценкой. В данной задаче имеется 14 возможных путей;
    чтобы для каждого из них определить стоимость, отвечающую
    выбранной стратегии, придется суммировать четыре (по одному для
    каждого шага) соответствующие величины <:,_,-. Следовательно, для
    простого перебора потребуется 42 (14 X 3 = 42) операции сложения. В то же время в рис. 8.3—8.5 сделано всего лишь 16 операций
    сложения. Преимущество рекуррентного подхода может оказаться
    огромным при практическом применении, когда полный перебор
    обычно неосуществим.
    Вопросы для повторения. Метод решения аллегорической задачи
    о дилижансах основан на ряде идей и подходов, которыми мы будем
    пользоваться и в дальнейшем. Для того чтобы овладеть ими, при
    изучении каждой новой модели необходимо "попытаться самостоятельно ответить на следующие вопросы:
    1. Значения каких переменных определяет выбираемая стратегия, иными словами — какие переменные являются «управляющими»?
    2. Какова целевая функция, на основе которой определяется
    оптимальная стратегия?
    3. Каким образом в модели и при анализе учитывается многошаговый характер задачи?
    4. Что является характеристикой состояния на каждом шаге?
    5. Каким образом вводимые ограничения влияют на состояние
    системы и на определение допустимых значений управляющих
    переменных?
    Если читатель сумеет сформулировать модель в терминах многошагового процесса, он тем самым выполнит первый этап анализа
    динамических свойств задачи.
    8.3.

    ПРОСТЕЙШАЯ ЗАДАЧА

    УПРАВЛЕНИЯ ЗАПАСАМИ

    В ранее рассмотренных задачах планирования, например в общей
    задаче планирования производственной программы (разд. 2.6), решения об управлении запасами определялись большой и сложной системой ограничений, В настоящем разделе рамки рассмотрения существенно сужены, что позволяет сосредоточить внимание на небольшом
    числе важдейших особенностей динамических процессов управления
    запасами.^ Модель, к изучению которой мы приступаем, играет
    такую же — или почти такую же — роль в исследовании операций,
    как законы Ньютона в физике. \ Хотя рассматриваемая ситуация
    и является идеализированной, в модели все же учитывается множество важных факторов, влияющих на выбор правил управления
    запасами.
    Следует помнить, что нашей основной целью в дальнейшем явится
    анализ динамических свойств процессов управления запасами. Поэто-

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    15

    му при описании модели не обсуждается строгость или реалистичность исходных предположений; этим вопросам посвящен разд. 8.5.
    По этой же причине вводимые экономические понятия сопровождаются лишь краткими пояснениями. Более подробно они рассматриваются в гл. 19 и в приложении 2, которые целиком посвящены моделям
    управления запасами.
    Важно отметить, что внедрение модификаций рассматриваемой
    модели рядом промышленных фирм дало заметный экономический
    эффект. Разумеется, в таких случаях все необходимые вычислительные операции выполнялись на ЭВМ.
    Пример фирмы «Надежный поставщик». Фирма должна разработать календарную программу выпуска некоторого вида изделий на
    плановый период, состоящий из N отрезков. Предполагается, что
    для каждого из этих отрезков имеется точный прогноз спроса на
    выпускаемую продукцию.
    Время изготовления партии изделий настолько мало, что им
    можно пренебречь; соответственно продукция, изготавливаемая
    в течение отрезка t, может быть использована для полного или частичного покрытия спроса в течение этого отрезка. Для разных отрезков
    спрос неодинаков; кроме того, на экономические показатели производства влияют размеры изготовляемых партий. Поэтому фирме
    нередко бывает выгодно изготовлять в течение некоторого месяца
    продукцию в объеме, превышающем спрос в пределах этого отрезка,
    и хранить излишки, используя их для удовлетворения последующего
    спроса. Вместе с тем хранение возникающих при этом запасов связано с определенными затратами. В зависимости от обстоятельств
    затраты обусловлены такими факторами, как проценты на капитал,
    взятый взаймы для создания запасов, арендная плата за складские
    помещения, страховые взносы и расходы по содержанию запасов.
    Эти затраты необходимо учитывать и при установлении программы
    выпуска.
    Цель фирмы «Надежный поставщик»— разработать такую программу, при которой общая сумма затрат на производство и на содержание запасов минимизируется при условии полного и своевременного удовлетворения спроса на продукцию. Анализ этой задачи начнем
    с преобразования качественного ее описания в математическую
    модель.
    Построение модели. Введем переменные:
    xt — выпуск продукции в течение отрезка t;
    it — уровень запасов на конец отрезка t.
    Спрос на продукцию для отрезка t обозначим Dt; предполагается,
    что величины Dt для всех t отображаются неотрицательными целыми
    числами и что к началу планового периода все Dt известны.
    Предположим также, что для каждого отрезка t затраты зависят
    от выпуска продукции xt, уровня запасов it на конец отрезка t и,
    кроме того, возможно, от значения t; обозначим затраты на отрезке t
    ^t (xt, it). Тогда целевую функцию можно записать в следующем

    16

    ГЛАВА 8

    виде:
    N

    Минимизировать ^Ct(xt,it),
    4=1

    (1)

    На значения переменных xt и it наложено несколько ограничений.
    Во-первых, предполагается целочисленность объемов выпуска:
    xt = 0, 1, 2, 3. . . (* = 1, 2, . . .. N).
    (2)
    Во-вторых, предполагается, что для администрации фирмы желателен нулевой уровень запасов на конец отрезка N'.
    iN = 0

    (конечный запас равен нулю).

    (3)

    Наконец, в-третьих, ставится условие полного и своевременного
    удовлетворения спроса в пределах каждого месяца. Выполнение
    этого условия можно обеспечить, введя два ограничения. Первое
    из них назовем «балансовым», )*оскольку в нем утверждается, что
    Уровень запасов на конец отрезка t =
    = (Уровень запасов на начало отрезка t) +
    + (Выпуск продукции на отрезке t) —
    — (Спрос на отрезке if).
    &сли воспользоваться принятыми условными обозначениями, то
    это ограничение можно будет записать в следующем виде:
    it = it-i + xt — Dt

    или в более удобном для нас виде:
    i t _, + xt - it = Dt

    (« = 1 , 2 . . ., N},

    (4)

    где ia — заданный уровень запасов на начало планового периода.
    Согласно второму вводимому ограничению, обеспечивающему
    своевременное выполнение фирмой «Надежный поставщик» своих
    обязательств, уровень запасов на начало каждого отрезка и объем
    Выпуска продукции в течение этого отрезка должны быть достаточно
    велики для того, чтобы уровень запасов на конец отрезка был бы
    неотрицательным^На самом же деле требуется не только неотрицательность, но и целочисленность уровней запасов (правда, если
    предположить целочисленность объемов спроса и выпуска продукции, то предположение о целочисленное™ уровней запасов не создает
    дополнительных трудностей). (Таким образом, требуется, чтобы
    it = 0, 1, 2, 3 . . . (t = I, 2, . . ., N-i).
    (5)
    Отметим, что ограначение (4) является линейным. Если бы все
    величины затрат Ct (xt, i t ) линейно зависели от значений переменных, то, мак показано нйж&, полученная модель была бы эквивалентна сетевой модели] й'Для нее легко удалось бы найти решение с помощью методов, описанных в га. 7^ Однако в большинстве практических случаев применения производственных моделей функция

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    17

    затрат нелинейна. Так, для выпуска партии изделий могут потребоваться дорогостоящие подготовительные операции (переналадка),
    из-за которых затраты на производство первой единицы партии
    изделий превышают дополнительные затраты на производство остальных единиц. В тех же случаях, когда объем производства в течение

    П 1
    е 2

    и

    3

    о 4

    д
    ы

    *1

    Ч

    1

    -1
    1

    *2

    1

    Ч

    Х3

    i3

    Xt

    = flt-io

    -1

    1

    = £>2

    1

    -1

    1

    =D

    1

    =0*

    Р и с . 8.6. Матрица ограничений задачи управления запасами.

    некоторого периода превышает нормальную мощность производственного участка, дополнительные затраты на единицу изделия
    могут возрастать из-за использования сверхурочных работ.
    Для того чтобы решить задачу при нелинейности каждой из величин Ct (xt, it), сформулируем ее в терминах динамического программирования.
    Пусть N = 4. Составим балансовые уравнения (4) для £ = 1 , 2 ,
    3, 4. Матрица этой системы ограничений представлена на рис. 8.6.

    Р и с . 8.7. Сеть, отображающая производство продукции
    и движение запасов.

    Построим пятое уравнение, просуммировав четыре уравнения,
    а затем составим систему из пяти уравнений, содержащую наряду
    с пятым четыре исходных уравнения, умноженных на —1. Читатель
    может убедиться в том, что построенная система адекватна сети,
    изображенной на рис. 8.7.
    Динамическая постановка. Вспомним, что в задаче о дилижансах
    мы строили вычислительный процесс от конечного состояния (сделаны
    все шаги многошагового процесса) к исходному. Такой же подход
    будет использован и в настоящей задаче. Здесь конечным состоянием
    будет начало последнего отрезка планового периода, а исходным —
    начальный момент первого отрезка (впереди еще N отрезков).
    2-0734

    18

    ГЛАВА 8

    При составлении математической модели удобно использовать
    систему индексов, при которой подстрочный индекс «1» соответствует
    конечному, а «./V» — начальному состоянию. Применим следующие
    обозначения:
    dn — спрос на продукцию на отрезке п, отстоящем от конца
    планового периода на п отрезков (включая рассматриваемый);
    сп (х, /) — затраты на отрезке п, связанные с выпуском х единиц
    продукции и с содержанием запасов, уровень которых
    на конец отрезка равен / единиц.
    В этой системе обозначений dj = DN и dN = Di, a c4 (x, j) ==
    = CN (x, j ) .
    Пусть N = 4, а плановый период начинается с января. Тогда Dt
    есть январский спрос, Z)4 — апрельский. В модели же используется
    «обратная система индексов»: январский спрос обозначен d4, апрельский — d^ Следовательно, d% — мартовский спрос (до конца планового периода — два отрезка, включая март).
    Что же определяет состояние системы в начале любого отрезка?
    Можно считать, что уровень запасов на начало отрезка. Для принятия текущего решения об объеме выпуска не нужно знать, каким
    образом достигнут начальный уровень. Учитывая это обстоятельствог
    введем следующие обозначения:
    /л (i) — стоимость, отвечающая стратегии минимальных затрат
    / на п оставшихся отрезков при начальном уровне запасов i;
    хп (j) — выпуск, обеспечивающий достижение /n (i).
    Согласно (3), уровень запасов на конец планового периода равен
    нулю, поэтому можно записать, что
    / 0 ( 0 ) = 0 (и = 0).
    "(6)
    Затем перейдем к п = 1. Начальный уровень запасов i может
    определяться любым неотрицательным целым числом, не большим,
    чем di, вне зависимости от значения i для полного удовлетворения
    потребности в пределах последнего отрезка объем выпуска должен
    быть равен (d^ — i). Следовательно,
    /i (0 = с, (di - i, 0), i = О, 1, . . ., ^.
    (7)
    Перейдем к п = 2. Заметим, что если начальный уровень запасов
    равен s, а объем выпуска — х, то общие затраты для двух месяцев
    составляют
    причем предполагается, что выбранная стратегия для п = 1 была
    оптимальной. Заметим, что величина (i + х — d2) есть попросту
    уровень запасов на конец отрезка 2. Величина i может принимать
    любые неотрицательные целочисленные значения, не превышающие
    (di + d2)', вопрос к читателю: объясните, почему? При заданном i

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    19

    целочисленное значение х должно быть не меньше, чем (dz — i),
    что обеспечивает полное удовлетворение потребности на отрезке 2,
    но не больше, чем (di + dz — i), так как конечный запас равен
    нулю. Оптимальному объему выпуска соответствует такое значение х,
    при котором минимизируется указанная выше сумма. Выполненный
    нами анализ ситуации для п — 2 можно выразить следующим общим
    выражением:

    / 2 (i) = min [с2 (х, i + х — d2) + / 4 (i + х — d z )l,
    X

    где i = 0, 1, . . ., di + d 2 , причем для отыскания минимума перебираются все неотрицательные целые значения х, заключенные
    в пределах d2 — i ^ х ^ Й 4 + d 2 — &•
    Как и в задаче о дилижансах, значения /з (0 можно вычислить,
    если известны значения / 2 (i), и т. д. В конце концов в данной задаче
    можно вычислить / N (i 0 ), где i 0 — уровень запасов на начало планового периода. Общее рекуррентное соотношение записывается в следующем виде:

    /„ (t) = min [сп (х, i + x —
    X

    п = 1, 2, ...,

    N,

    (8)

    где i = О, 1, . . ., di + . . . -f- dn, причем для отыскания минимума
    перебираются все неотрицательные целые значения х, заключенные
    в пределах dn — i ^ х ^ dt + Й2 + . . . + dn — i.
    Заметим, что, поскольку начальный уровень запасов г рассматривается как переменная величина, полностью характеризующая
    состояние системы, единственной независимой управляющий переменной в рекуррентном соотношении (8) является х, так как уровень
    запасов на конец отрезка равен (i + х — dn). Заметим также, что,
    поскольку /о (0) и / 4 (i) без труда вычисляются по формулам (6) и (7),
    можно непосредственно и поочередно вычислить значения / 2 (0),
    /2 (1), • • •. /2 (di), а затем / 3 (0), / 3 (1), . . ., /з № + dz). Последовательно переходя ко все большим значениям п, мы дойдем до
    вычисления /^_ 4 (0), fN_i (1), . . ., /^_ t (dt + d2 + . . . + d^) и,
    наконец, до f N ( i 0 ) .
    Для отыскания оптимальной производственной программы определим, какой объем выпуска XN (i0) позволяет достичь полученного
    значения {N (i0); соответствующее решение о выпуске является оптимальным решением для начального отрезка планового периода.
    Уровень запасов на начало следующего отрезка равен i0 + XN (i0) —
    — dN; найдем объем выпуска, позволяющий достичь полученного
    нами значения fN-\ [ i 0 + XN (ч} — dN] и т. д. Процесс станет совершенно понятным, когда читатель разберет пример, приведенный
    в следующем разделе.
    Здесь, прежде чем идти дальше, читателю следует удостовериться
    в том, что ему ясна описываемая постановка задачи в терминах
    2*

    20

    ГЛАВА 8

    динамического программирования. Процесс принятия решений рассматривается как многошаговый; п — число шагов (в данной задаче
    число отрезков планового периода) до конца процесса. В иллюстративных целях снова примем N = 4, причем эти отрезки соответствуют
    январю, февралю, марту и апрелю; п = 1 относится к апрелю,
    а п = 4 — к январю. В рекуррентном соотношении (8) динамического программирования январский спрос обозначен с?4; аналогичные
    индексы использованы для целевой функции.- До этого момента нет
    ничего сложного.
    Использовано лишь одно новое положение:1^ начальный уровень
    запасов считается характеристикой состояния системы за п шагов
    до конца планового периода. Продолжая рассмотрение примера,
    построенного для четырех месяцев, заметим, что если известен уровень запасов на начало апреля и апрельский спрос, то необходимый
    объем производства в точности должен быть равен разнице между
    этими двумя величинами. Такая зависимость отображается уравнением (7). Таким образом, если уровень запасов на начало апреля
    известен, нахождение оптимального выпуска для этого месяца чрезвычайно просто.
    Аналогично этому при известном уровне запасов на начало марта
    и мартовском спросе необходимый объем выпуска должен быть не
    меньше, чем разность между этими двумя величинами.
    В свою очередь принимаемое решение об объеме производства
    в марте влияет на уровень запасов на начало апреля — этот уровень
    равен (i-\-x — d2). Если последняя величина известна, то можно действовать в апреле оптимальным образом. Однако апрельский
    выпуск уже был оптимизирован на предыдущем шаге. Поэтому при
    определении оптимального мартовского объема производства необходимо рассматривать только сумму затрат в марте и соответствующих оптимальных затрат после марта. Вся совокупность этих соображений представлена правой частью рекуррентного соотношения
    (8) динамического программирования. Те же рассуждения можно
    повторить для февраля и, наконец, для января.
    Рекуррентное соотношение (8) эквивалентно алгоритму нахождения кратчайшего пути на ориентированной ациклической сети. Но
    какова структура сети, адекватной рассматриваемой модели? Ввиду
    нелинейности затрат такая сеть не аналогична изображенной на
    рис. 8.7. В схематическом изображении сети, адекватной соотношению (8) и построенной для реальной задачи, может быть очень много вершин и дуг.
    Однако лежащую в ее основе структуру можно охарактеризовать
    на следующем простом примере.
    Пусть
    dn = i для
    х = О, 1, 2

    п = 1, 2, 3, 4 (спрос

    постоянен во времени),

    (выпуск

    ограничен).

    (I)
    (II)

    ТКОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    21

    Сеть, построенная для этого примера, изображена на рис. 8.8.
    Вершина, обозначенная индексами (г, п), соответствует возможному
    значению переменной состояния г за п отрезков до конца планового
    периода. Пять вершин в левой части сети отображают различные возможности, возникающие при i0, равном О, 1, 2, 3 или 4. Наличие

    Январь

    Февпаль

    Март

    Апрель

    Конечное
    состояние
    Р и с . 8.8. Сеть, отображающая производство продукции
    и движение запасов.
    Индексы вершины: (i, n).
    Обозначение на дуге: сп (х, /) = nxj.

    только одной вершины в правой части сети обусловлено тем, что
    конечный запас должен быть нулевым.
    Рассмотрим дугу, направленную из вершины (i, n) в вершину
    (j, п — 1). Поскольку j = i + х — dn, то за п отрезков до конца
    планового периода переменная х = ] — i + d^. Каждое допустимое
    значение переменной отображено одной из дуг, на которой проставлено обозначение «га/», являющееся сокращением от сп(х, /). Так,
    вместо с4 (0,1) проставлено 401.
    Несомненно, схема рис. 8.8 кажется более сложной, чем сеть,
    изображенная на рис. 8.7. Это объясняется тем, что при нелинейных
    функциях Ct (xt, i t ) задача действительно усложняется.
    В рекуррентном соотношении (8) последовательность операций
    обратно, действительной их последовательности во времени,^ Это
    означает, что вычислительный процесс направлен от последнего
    отрезка планового периода к первому; в примере, где N = 4, / 4 (i)
    вычисляется для апреля. Однако можно также разработать и прямой
    алгоритм, при котором вычислительный процесс направлен от первого отрезка к последнему. В этом случае необходимо задаться неко-

    22

    ГЛАВА 8

    торым значением исходного уровня запаса i0. Предположим, что
    to = О- В случае прямого алгоритма наш подход основывается на вычислении gn (i):
    gn (i) — минимальные затраты с первого по п-ж отрезок при условии,
    что уровень запасов на конец отрезка п от начала планового
    периода равен i.
    При этом

    *о (0) = О,
    (III)
    gi (i) = d (D, + i, i) (i = 0, 1, . . ., Dz + D3 + . . . +DN+ i N ) ,
    (IV)
    gn (i) = min [&_! (i - x + Dn) + Cn (x, i)], n = 1, 2, . . ., N, (V)
    X

    где i = 0, 1, . . ., Dn+i+ . . . + DN + iN и для отыскания минимума перебираются все неотрицательные целые значения х, не превышающие (Dn -f- i). Конечной целью наших вычислений является
    определение значения gN (iN), где iN — заданный уровень запаса
    на конец планового периода.
    Заметим, что (i — x + Dn) в выражении (V) есть уровень запаса
    на начало отрезка п. Оптимальное значение х в соотношении (8),
    позволяющее достичь fn(i) в течение п последних отрезков планового
    периода, относится к выпуску первого отрезка. Напротив, оптимальное значение х, позволяющее достичь gn(i) в соотношении (V), относится к выпуску на отрезке п. Следовательно, после представления gn (i)
    для всех п и i в табличном виде мы получим решение, для чего нам
    придется" начать со значения iN. для отрезков N, затем определить
    соответствующее оптимальное значение XN, зафиксировать отвечающий ему уровень запасов на начало последнего отрезка,
    отыскать соответствующее оптимальное значение xN_t и т. д.
    8.4. ЧИСЛОВОЙ ПРИМЕР

    После того как модель управления запасами сформулирована,
    читатель подготовлен к решению конкретной задачи, стоящей перед
    фирмой «Надежный поставщик». Эта задача решается в настоящем
    разделе. В последующих разделах исследуется вопрос, каким образом увеличение числа отрезков N в плановом периоде влияет на оптимальную стратегию, и показано, что введение ограничения может
    коренным образом изменить эту стратегию. Данный пример иллюстрирует возможную сложность так называемых комбинаторных
    задач, даже если их размерность мала.
    Справедливости ради нужно отметить, что приведенные ниже
    численные значения параметров были тщательно подобраны для того,
    чтобы появились те динамические свойства, которые мы считали
    желательным продемонстрировать; не следует думать, что подобные
    свойства присущи процессам управления запасами всегда. Читатель
    должен понять, что в реальной ситуации только анализ, выполненный
    методами динамического программирования, позволяет в точности

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    23

    выяснить характер результатов. Это означает, что устойчивость
    оптимальной программы при изменении длительности планового
    периода нередко бывает трудно установить заранее.
    Для упрощения анализа будем считать, что спрос и функция
    затрат одинаковы для всех отрезков планового периода. Для конкретности примем
    Dt = 3 единицам (спрос постоянен во времени).
    (1)
    Предположим также, что затраты равны сумме двух элементов; первый из них относится к производству, а второй определяется стоимостью содержания запасов, которая является линейной функцией
    объема запасов. Таким образом, для всех отрезков
    Ct (xt, it) = С (xt) + hitl

    где С (0) = О, С (1) = 15, С (2) = 17, С (3) = 19,
    С (4) =21, С (5) =23;
    h = 1.

    (2)

    (3)
    (4)

    В свою очередь производственные затраты можно рассматривать
    как сумму условно-постоянных затрат на операции по переналадке
    (эти затраты равны 13 условным единицам) и пропорциональных
    затрат (они равны 2 условным единицам на каждую единицу продукции). Поскольку h = 1, затраты на содержание запасов численно
    равны уровню запасов на конец отрезка.
    Далее, производственные мощности и складские, площади фирмы
    -«Надежный поставщик» ограничены; это вводит в задачу дополнительное усложнение. Примем, что выпуск в течение одного отрезка
    не может превысить 5 единиц, а уровень запасов на конец отрезка —
    4 единицы. Иными словами, для всех отрезков

    и

    xt = О, 1, . . . , 5

    it = О, 1, . . . , 4.

    -|

    Г

    J

    (5)

    Заметим, что затраты на переналадку относительно высоки
    по сравнению с другими элементами; поэтому в оптимальной программе должна появиться тенденция к укрупнению партий. Однако
    объем выпуска xt не может превысить 5 единиц, тогда как спрос
    равен 3; следовательно, в течение одного отрезка уровень запасов
    не может возрасти более чем на 2 единицы. Таким образом, в течение
    двух первых отрезков не удается избежать двух переналадок, если
    исходный запас равен нулю.; Вовсе не очевидно, какая программа
    выпуска окажется оптимальной в случае более длительного планового периода. Ответ на этот вопрос должны дать методы динамического
    программирования.
    Формулировка задачи динамического программирования. При
    наличии приведенных выше данных об условиях деятельности фирмы

    24

    ГЛАВА 8

    «Надежный поставщик» можно составить динамическое рекуррентное соотношение, отображающее специфику задачи. Напомним, что
    используются следующие обозначения:
    /л (О — минимальные затраты в течение п последних отрезков планового периода при начальном уровне запасов t;
    хп (О — выпуск, позволяющий достичь fn (i).
    Для п = 1

    /i(i) = С (3-0
    J,
    Xi(i) = 3
    3—
    —ii

    » = 0, 1, 2, 3,

    (6)

    поскольку уровень запасов на конец планового периода равен
    нулю. В общем виде рекуррентное соотношение можно записать
    следующим образом:

    /„ (0 = min [ С ( х ) + \ ( г + х-У)+ /„_! (i + х - 3)1,
    » = 2, 3, . . .,

    (7)

    где i = О, 1, 2, 3, 4 и для отыскания минимума перебираются все
    неотрицательные целые значения х, заключенные в пределах 3 —
    — i ^ х ^ min (5, 7 — i). Ограниченность производственных мощностей, отображаемая первым из условий (5), не позволяет х превысить 5, а ограниченность уровня запасов на конец отрезка, отображаемая второй частью (5), не позволяет х превысить (7 — i).
    Для того чтобы анализ был содержательным, необходимо располагать всеми значениями функций /„ (i)\ в связи с этим их вычисление является нашей очередной задачей. Форма расчетных таблиц
    во многом напоминает таблицы, использованные в задаче о дилижансах. Для каждого шага п построена одна таблица; в ней предусмотрено по одной строке для каждого возможного значения начального уровня запасов i и по одному столбцу — для каждого возможного значения выпуска х. Поскольку спрос на продукцию в пределах
    каждого отрезка должен быть полностью удовлетворен, а уровень
    запасов на конец отрезка не может превысить 4 единицы, некоторые
    клетки в таблицах «запрещены» — они соответствуют недопустимым
    сочетаниям i и х. Каждое из проставленных в таблице чисел представляет собой сумму затрат для рассматриваемого отрезка п и оптимальных затрат для всех (п — 1) последующих отрезков. В двух
    правых столбцах таблицы проставлены: минимальная по строке сумма [в столбце /„ (i)l и соответствующий ей оптимальный выпуск
    [в столбце хп (i)}.
    Значения /i (i), вычисленные по формуле (6), приведены в таблице рис. 8.9, а значения функции / 2 (i) — в таблице рис. 8.10, Рассмотрим структуру последней таблицы более подробно. В ней имеется
    5 строк, по одной для каждого допустимого значения i. Клетки, соответствующие некоторым сочетаниям i и ж, «запрещены». Так, если
    г = 1 , то спрос удастся удовлетворить только при условии х ^ 2.

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    25

    Если i — 4, то х ^ 2, иначе нарушится условие нулевого уровня
    запасов на конец планового периода. Первое из слагаемых в каждой
    клетке — значение С (х), вычисленное по формуле (3). Второе слагаемое — затраты на содержание запасов, равные уровню запасов
    на конец отрезка, умноженному на h = 1. Так, например, при i = 3
    и х = 0 уровень запасов на конец отрезка также равен нулю; поэтому
    равно нулю и второе слагаемое в соответствующей клетке. При
    I = 3 и х = 1 уровень запасов на конец
    */-.\-nti -,\
    месяца равен 1; в соответствующей клетке второе слагаемое также равно 1. Аналоi х,(1) fi(i}
    гичным образом значения вторых слагае3
    19
    0
    мых вычисляются и для других клеток
    НачальныйУ I1
    2
    11
    третьей строки (i = 3). Наконец, третье
    запас
    слагаемое — это значение / t (i + х — 3),
    15
    2
    1
    ранее вычисленное и приведенное в таблице рис. 8.9.
    3
    0
    Для каждого фиксированного i зна^
    чение функции /2 (0 представляет собой Р и с . 8.9. Задача фирмы
    поставщик»
    минимальную из всех сумм в «клетках» «Надежный
    (п = 1).
    данной строки, a ;r2 (i)—соответствующий
    выпуск. Так, при i = 1 и п = 2 оптимальный выпуск равен 5 единицам; он позволяет за два месяца
    достичь затрат, равных 26. Любое другое значение х обусловливает
    более высокие затраты.
    Расчет значений / 3 (i) приведен в таблице рис. 8.11. Здесь первое
    слагаемое равно [С (х) + 1 (i + х — 3)], а второе слагаемое есть
    значение / 2 (i + х — 3), взятое из таблицы рис. 8.10. Остальные
    значения /„ (i) для п = 4, 5, 6 представлены в сводной таблице
    рис. 8.12. Читателю следует проверить, насколько им освоены рекуррентные вычислительные операции метода динамического программирования, построив целиком расчетную таблицу для / 4 (г), аналогичную таблице рис. 8.11, и сравнив полученные результата™ с теми
    данными, которые приведены в таблице рис. 8.12. Заметим, что для
    п = 4 оптимальными являются два значения выпуска — 3 единицы
    и 4 единицы.
    8.5 АНАЛИЗ

    ЧУВСТВИТЕЛЬНОСТИ

    РЕШЕНИЯ

    Численные результаты, приведенные в таблицах разд. 8.4, необходимы для определения оптимальных объемов производства. Наряду с этим в таблицах (рис. 8.9—8.12) содержится множество сведений
    об устойчивости решения при изменении заданных значений параметров модели, таких, как длительность планового периода или
    исходный уровень запаса. В связи с этим рассмотрим вопросы чувствительности оптимального решения на том же примере фирмы
    «Надежный поставщик», для чего воспользуемся приведенными выше
    результатами.

    C(x)+l(i+x-3)+ft (
    Выпуск:
    2
    3

    Р и с . 8.10. Задача фирмы «Надежный поставщик» (ге = 2).

    t+x-3)

    Р и с . 8.11. Задача фирмы «Надежный поставщик» (ге = 3).

    л=/

    Начальный
    запас

    п=2

    x,(i)

    f,W

    n=
    n=S

    x*(i) fi,(i)

    xs(i) fs(i)

    л=3

    хг(1) fz(i}

    Ъ(!)

    f3(i]

    л=В
    XeU)

    Ш

    а
    1

    Э

    13

    3

    38

    4

    48

    3,4

    67

    5

    79

    4

    SB

    2

    п

    5

    26

    5

    ts

    5

    64

    5

    74

    5

    33

    2

    1

    15

    4

    24

    4

    43

    ff

    54

    4

    72

    4

    91

    J

    0

    0

    0

    19

    0

    38

    0

    48

    0

    67

    0

    73

    0

    18

    0

    27

    ' 0

    46

    a

    65

    0

    15

    4

    Рис. ^
    8.12. Задача фирмы «Надежный поставщик».
    Ш

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    27

    Длительность планового периода. Для определенности будем
    считать, что плановый период начинается в январе. Нас интересует
    изменение оптимальных месячных объемов выпуска при увеличении
    числа месяцев N в плановом периоде и, в частности, изменение
    январского выпуска. Результаты анализа, основанного на данных
    рис. 8.12, приведены в таблице рис. 8.13; при этом предполагается,
    что исходный уровень запасов на начало января равен нулю.
    Таблица рис. 8.13 построена следующим образом. Январский
    объем производства (3 единицы) для N = 1 взят из первой строки
    Длитель пасть
    планового
    периода,N
    Яна.

    Февр.

    Март

    Апр.

    Май

    Июнь

    Общая
    Среднесумма месячные
    затрат затраты

    Р и с . 8.13. Программа выпуска продукции фирмой «Надежный поставщик»

    («о = 0).

    таблицы рис. 8.12 при п, равном 1. Январский объем производства
    (3 единицы) для N = 2 взят из той же строки при п — 2 и т. д.
    В случае N = 6 январский выпуск равен 4 единицам, а уровень
    запасов на начало февраля — 1 единице (он равен i + х — d =
    = 0 + 4 — 3). Следовательно, февральский выпуск (5 единиц)
    найдем из второй строки таблицы рис. 8.12 при п = 5, поскольку
    уровень запасов на начало месяца теперь равен 1 единице. В свою
    очередь это означает, что уровень запасов на начало марта составит
    3 единицы (i + х — d = 1 + 5 — 3 = 3); поэтому выпуск продукции в марте будет нулевым, как это показано в таблице рис. 8.12
    для i = 3 и п = 4. На основе аналогичных рассуждений определим,
    что производство в апреле (п = 3) должно быть равно 4 единицам,
    поскольку уровень запасов на начало апреля — нуль (i + х —
    — d = 3 + О — 3 = 0). При таком выпуске уровень запасов на начало мая будет равен 0 + 4 — 3 = 1, так что майский выпуск
    (п = 2) составит 5 единиц. Следовательно, в июне оптимален нулевой выпуск, поскольку уровень запасов на начало месяца (п = 1)
    равен 1 + 5 — 3 = 3 единицам. Читатель может убедиться в том,
    что минимальная общая сумма затрат для N = 6 составит (21 + 1) +
    + (23 + 3) + (0 + 0) + (21 + 1) + (23 + 3) + (0 + 0) = 96; эта

    28

    ГЛАВА 8

    сумма и проставлена в клетке таблицы рис. 8.12, соответствующей
    / 6 (0).
    Анализ оптимальных вариантов производственной программы,
    приведенных на рис. 8.13, свидетельствует о том, что январский
    выпуск зависит от длительности планового периода. При возрастании числа месяцев N с 1 до 5 оптимальный январский выпуск возрастает. Однако при N — 6 производство в январе должно составить
    всего лишь 4 единицы (при N = 5 эта величина была равна 5 единицам). Таким образом, удлинение планового периода может вызвать
    как рост, так и сокращение январского объема производства, причем
    для N = 4 имеются две альтернативные оптимальные программы.
    Из рис. 8.13 ясно, каким образом среднемесячные затраты зависят
    от N. Отметим, что при увеличении N от 2 до 6 среднемесячные затраты не убывают монотонно, а испытывают колебания.
    Оптимальная программа для N = 5 заслуживает особого внимания. В этом случае уровень запасов возрастает в январе, феврале
    и апреле. Таким образом, майский спрос по существу удовлетворяется 2 единицами апрельского выпуска и 1 единицей февральского.
    При подобных условиях оптимальным оказывается наличие запасов
    на начало как февраля, так и апреля, хотя в течение обоих месяцев
    фирма несет расходы, связанные с переналадкой.
    Исходный уровень запасов. В- настоящем подразделе изучается
    зависимость оптимальной программы от уровня запасов на начало
    планового периода^ Для определения такой зависимости применительно к январскому выпуску рассмотрим таблицу, приведенную
    на рис. 8.14. Если плановый период включает всего лишь один месяц,
    каждое увеличение исходного запаса на 1 единицу приводит к снижению на единицу январского выпуска. Однако при N = 2, 3, 4 или
    6 месяцам увеличение исходного запаса от нуля до 1 приводит не к сокращению, а к росту январского производства. Увеличение же исходного уровня запасов с 1 единицы до 2 единиц приводит к разным
    результатам в зависимости от значения N: выпуск продукции в январе может сократиться (однако не до объема, соответствующего
    г о = О при N = 2) или остаться прежним (при N = 4).
    В двух последних столбцах таблицы рис. 8.14 отражено снижение
    общей суммы затрат при единичном приращении исходного запаса.
    Рассмотрим, например, длительность планового периода N, равную
    двум месяцам. При нулевом исходном уровне запасов общая сумма
    затрат составляет 38 (рис. 8.12). Наличие 1 единицы исходного запаса
    позволяет снизить затраты до 26, а 2 единиц — до 24. Таким образом,
    цена первого единичного приращения исходного запаса равна 12,
    а второго — только 2 (рис. 8.14). Подчеркнем, что эта цена существенно зависит от длительности планового периода, а также от того,
    рассматривается ли первое или второе единичное приращение исходного запаса. Читатель должен построить оптимальные варианты программы для Ж = 4 и ./V = 6, г 0 = 1 и г 0 = 2 и выяснить причину
    наблюдаемых различий в снижении суммы затрат. (Попутно отметим,

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    29

    что при N = 4 и 10 = 2 уровень запасов на начало февраля составляет 4 единицы, так что, если бы условиями задачи были бы предусмотрены более строгие ограничения уровня запасов, при которых
    Январский
    выпуск
    Длительность
    планового
    ia = 0 ia = l io = 2
    периода, N

    Цена предыдущего единичного приращеHUST исходного
    запаса
    io=l

    4=2

    1 -

    3

    2

    /

    2

    2

    2

    3

    5

    4

    12

    2

    3

    4

    5

    4

    3

    2

    4

    3,4

    5

    5

    3

    Ш

    5

    S

    5

    4

    S

    г

    S

    4 '

    5

    4

    3

    2

    Р и с . 8.14. Цена единичного приращения исход л
    ного запаса фирмы «Надежный поставщик».

    должно соблюдаться условие i < 4, этот вариант оказался бы запрещенным и общая сумма затрат возросла бы.)
    Долгосрочный анализ при «усеченном» плановом периоде. До сих
    пор изучалась ситуация, при которой длительность планового периода совпадает с длительностью периода существования спроса на данный продукт. Это значит, что варианты программы, приведенные
    в таблицах на рис. 8.12 и 8.13, относятся к ситуации, при которой
    D ( = О для всех t> N.
    Теперь предположим, что Dt = 3 и после N месяцев, но текущие
    решения о месячном выпуске определяются только на основе данных
    для ближайших N месяцев. Например, при N = 4 оптимальный
    вариант январского выпуска выбирается (разумеется, с учетом уровня запасов на начало января) так, как будто спрос на продукцию
    существует только с января по апрель. В феврале процесс повторяется: февральский выпуск определяется с учетом заданного начального
    запаса, причем так, как если бы плановый период включал четыре
    месяца (с февраля по май). Такая процедура, иногда называемая
    скользящим планированием, часто применяется в промышленности. ,
    Посмотрим теперь, насколько хороши результаты, которые подобная процедура позволяет получить в данном примере.
    Начнем с анализа ситуации, в условиях которой величина Dt=3
    для 10 отрезков, а затем равна нулю.) На рис. 8.15 приведены оптимальные варианты программы и соответствующие им значения суммы

    ГЛАВА 8

    30

    затрат для разных значений N, причем предполагается, что уровень
    запасов на начало января равен нулю .(^Истинный оптимум для
    .V = 10 достигается двукратным повторением программы, полученной для N = 5 (рис. 8.13). Однако скользящее планирование не позволяет получить этот оптимальный вариант ни при одном из значений
    N. При ./V = 4 возникает несколько вариантов скользящего плана,
    Длительность
    ОВщая
    планового
    сумма
    периода, N Яна. <Ревр. Март Апр. Май Шт Июль Авг. Сент. Окт. затрат
    J

    д

    3

    3

    3

    3

    3

    3

    3

    3

    3

    /90 •

    Z

    3

    3

    3

    3

    3

    3

    3

    3

    3

    3

    190

    3

    4-

    5

    0

    4

    S

    0

    4

    5

    0

    3

    163

    4

    3
    4
    5
    5.
    4
    4

    3
    5
    4
    4
    5
    S

    3
    0

    3
    5
    4
    4
    5
    5

    3
    0
    0

    4
    5
    4
    5
    4
    5

    5
    0
    5
    0
    5
    0

    181
    163

    о

    J
    4
    J
    4
    3
    4

    0
    3

    0
    0
    0

    3
    4
    5
    5
    4
    4

    5

    0

    S

    0

    5

    5

    0

    5

    5
    В

    Оптимальный
    if
    вариант
    Р и с . 8.15.

    а

    о
    0

    Скользящий план фирмы «Надежный
    для 10-месячного периода (г0 = 0).

    •о

    1Б5

    3
    0
    3

    163

    0

    158

    поставщик»

    поскольку в случае нулевого исходного запаса выпуск может быть
    принят равным как 3, так и 4 единицам. В таблице рис. 8.15 приведены только два варианта программы, причем затраты на них различны. Наконец, отметим, что при скользящем планировании удлинение
    планового периода может даже нанести ущерб: затраты при N — 3
    ниже, чем в случае N = 5, хотя ни тот, ни другой вариант программы
    не оптимален.
    Теперь предположим, что величина Dt сохраняет одно и то же значение (3 единицы) в течение бесконечного периода времени и что программа всегда составляется методом скользящего планирования.
    Тогда (при исходном запасе i 0 = 0) производство сводится к постоянно повторяющимся циклами отображенным на рис. 8.16. Если
    i 0 = 0, то характер функции затрат и наличие различных ограничений приводят к тому, что уровень запасов на конец любого месяца
    не превышает 2 единиц. Следовательно, если при одинаковых исходных уровнях запасов (i = О, 1 или 2) и при двух различных N
    получаются одинаковые оптимальные варианты программы, то
    возникают одинаковые повторяющиеся производственные циклы.
    В связи с этим в таблице рис. 8.16 учтены только три возможных
    значения i. Нетрудно заметить, что для N — 1, 2, . . . существует

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    31

    только семь различных вариантов программы, которые приводят
    ко всего лишь четырем различным повторяющимся производственным циклам. (Для некоторых значений N существует несколько
    оптимальных вариантов производственной программы, и соответственно эти значения N повторены необходимое число раз.)
    Отметим, что только начиная с N = 10 скользящее планирование
    дает оптимальные варианты программы, обеспечивающие минимальные среднемесячные затраты. Даже при N — 17 возникающие повторяющиеся производственные циклы не являются оптимальными,
    Длительности
    планового
    периода, N

    Повторяющийся
    производственный цикл

    Среднемесячные
    затраты

    10,13,14,
    15,1В, 18,
    Оптимальный
    вариант
    Программы вля N^6 приведены в таблице рис. В. 12, а для N>6
    разработаны аналогичными методами. Если i ^J, та
    х• (i) = 0 Зля людиго N.
    Р и с . 8.16.

    Скользящий план фирмы «Надежный поставщик»
    для бесконечного периода (i0 = 0).

    и можно показать, что один из альтернативных вариантов для N =
    = 22 дает среднемесячные затраты, равные 16 условным единицам.
    Однако если плановый период достаточно велик (N ^ 18), оптимальная программа для бесконечного планового периода одновременно
    является оптимальной и для конечного периода. Это свидетельствует
    о том, что существует достаточная вероятность ошибиться в оценке
    необходимой длительности планового периода и такую вероятность
    можно уменьшить только посредством тщательного анализа. \
    В гл. И и 12 читатель ознакомится с определением оптимальной
    программы при учете влияния неограниченной длительности планового периода.
    Некоторые замечания. В настоящем примере численные значения
    параметров были подобраны специальным образом, однако общая
    ситуация описана в нем достаточно реалистично. Так, производствен-

    32

    ГЛАВА 8

    ные затраты включают условно-постоянные расходы на подготовительные операции, а также пропорциональные (переменные) затраты;
    затраты на содержание запасов, линейно зависящих от их уровня
    на конец отрезка; на размеры выпуска и уровень запасов наложены
    простые ограничения сверху. Тем не менее, например, при изменении
    длительности планового периода выбор оптимального варианта
    программы меняется коренным образом. Вряд ли можно установить,
    насколько часто подобная чрезвычайно высокая чувствительность
    встречается в реальных ситуациях и насколько серьезны экономические последствия неправильного выбора программы. Однако в данном примере можно понять, что степень и значимость чувствительности решений трудно определить, не выполнив в каждом конкретном случае строгий динамический анализ. Только что изученный подход, основанный на операционных идеях, является фундаментальным
    методом выполнения подобных исследований.
    Известно, что математическая модель нередко является достаточно общей для того, чтобы охватить множество различных реальных
    ситуаций. Поэтому содержательная оценка модели, приведенной
    в настоящей главе, должна в первую очередь основываться на анализе системы исходных предположений, а не конкретных условий деятельности фирмы «Надежный поставщик». Перечислим важнейшие
    из этих предположений.
    1. Прогноз спроса является точным. Хотя фирме редко удается
    совершенно точно предсказать спрос на несколько месяцев вперед,
    размеры ошибки часто достаточно малы и детерминированная модель
    дает хорошую аппроксимацию действительности. (В подобных обстоятельствах обычно применяется скользящее планирование, описанное выше, однако иногда пересмотр программы при этом осуществляется не ежемесячно, а раз в несколько месяцев.) Если же ошибки прогнозирования существенны, необходим переход к моделям 'тф&ого*
    типа, который описан в гл. 19 и приложении 2.
    2. Длительность изготовления продукции пренебрежимо мала.
    В реальных условиях делается другое предположение, согласно
    которому можно определять длительность периода производства
    с пренебрежимо малой ошибкой. Так, пусть изготовление партии
    изделий длится две недели. Если производственная программа построена с использованием приведенных в настоящей главе рекуррентных
    соотношений, причем в соответствии с этой программой февральский
    спрос удовлетворяется февральским выпуском, то на самом деле
    запуск партии необходимо осуществить на две недели раньше, т. е.
    во второй половине января.
    Другим аспектом данного предположения является возможность
    определения длительности изготовления партии изделий вне связи
    с изготовлением других заказов. Если несколько различных видов
    изделий обрабатываются на одном и том же оборудовании, производственная мощность которого ограниченна, то совокупность программ
    выпуска, каждая из которых получена с помощью обособленной моде-

    ТЕОРИЯ ДИНАМИЧЕСКИХ

    ОПТИМИЗАЦИОННЫХ

    МОДЕЛЕЙ

    33

    ли динамического программирования, может оказаться несовместимой.
    Модели, приведенные в настоящей главе, часто полезны в тех
    случаях, когда изделия заказывают у внешнего поставщика, располагающего необходимыми их запасами. Тогда задержка во времени
    связана с интервалом поставки, а затраты включают не издержки
    производства, а расходы на закупку изделий.
    3. Затраты по каждому отрезку зависят от текущего выпуска
    и от уровня запасов на конец отрезка; спрос на каждом отрезке полностью и своевременно удовлетворяется. Эти два предположения без
    особого труда можно обобщить на значительно более широкий круг
    ситуаций. Методы такого обобщения рассматриваются ниже.
    Не вводя существенно новых усложнений, можно переписать
    рекуррентное соотношение динамического программирования (8)
    в следующем виде:
    in (i) = min [cn (x,i,i + х — dn) + / n _ 4 (i + x — d n ) ] .
    (I)
    При такой записи соотношение (8) можно распространить на ситуацию, при которой затраты на содержание запасов исчисляются
    исходя из среднего уровня
    i + (i + x — dn)
    2
    '

    W

    Далее можно ввести допущение, согласно которому своевременно
    неудовлетворенный спрос полностью сохраняется и смещается
    на последующие отрезки. При таком допущении «балансовое уравнение»
    it = it-i + xt — Dt
    (III)
    по-прежнему остается в силе, но величина it может принимать и отрицательные значения, характеризующие накапливающийся неудовлетворенный спрос. Возможно и другое допущение, при котором
    своевременно неудовлетворенный спрос полностью теряется; в этом
    случае
    it = max (it.j + xt — Dt, 0).
    (IV)
    Тогда
    / n ( i ) = min {cn(x, i, i + x — dn) + / n _ t [max (i + a; — dn, 0)]}. (V)
    ж=0, 1, ...

    Как в выражении (III), так и в выражении (IV) целевая функция
    затрат сп (x, i, i -\- x — dn) должна включать штраф за задержку
    удовлетворения спроса или за полную его потерю. Такой функцией
    может быть функция (VI):
    сп (x, f, i + x — dn) = c (x) + h [max (i + x — dn, 0)] —
    — p [mm(i + a: — dn, 0)],
    (VI)
    где p (p >. 0) представляет собой штраф за единицу спроса, не
    Удовлетворенного в течение того отрезка, когда этот спрос возник.
    3-0734

    34

    ГЛАВА 8

    Очевидно, в случае допущения потери спроса сокращение выручки
    от реализации будет учитываться в значении р. Эти возможности
    более подробно рассматриваются в гл. 19 и приложении 2.
    В некоторых случаях фирма несет расходы и при переносе выпуска из одного отрезка в другой. Для такой ситуации также можно
    построить рекуррентное соотношение динамического программирования, однако оно будет более сложным; такое соотношение рассматривается в разд. 9.7.
    Если спрос в реальной действительности удается предсказать
    с достаточно высокой степенью точности, так что будет удобно использовать детерминированные модели управления запасами, то модели,
    описанные в настоящей главе, вообще говоря, оказываются слишком
    общими. Как правило, о функции сп (х, i, i + x — dn) известна столь
    детальная информация, что удается получить гораздо более сильные
    результаты, касающиеся длительности планового периода или характеристик оптимальной стратегии. В результате вычисленные операции по отысканию этой стратегии оказываются намного более простыми, чем рассмотренные в численном примере, изложенном в разд.
    8.4. В гл. 9 это положение демонстрируется на примере двух важных
    частных случаев.
    8.6. ПОИСКИ ВОЗМОЖНОСТЕЙ УЛУЧШЕНИЯ ПЛАНА

    Если бы читатель отвечал за производство в фирме «Надежный
    поставщик», его бы весьма обеспокоили полученные выше результаты
    анализа. Пытаясь выяснить причины повышенной чувствительности
    оптимальных вариантов производственной программы к изменениюпараметров, он обратил бы внимание, с одной стороны, на стремление
    планового отдела избежать высоких затрат на переналадку, что обусловлено характером целевой функции, а с другой — на ограниченность производственных мощностей, допускающих выработку не более 5 единиц в месяц. Вероятно, читатель рассмотрел бы последствия
    полного отказа от ограничений на объем выпуска и уровень запасов,
    пользуясь при этом целевой функцией

    0
    *,

    при -Xi = 0,
    при xt>0,

    (1)

    значения которой для xt = О, 1, . . ., 5 совпадают с ранее заданными.
    Если при подобных предположениях задаться нулевым значением
    исходного уровня запасов и по-прежнему принимать Dt = 3 единицам, то можно показать, что оптимальный январский выпуск составвит 9 единиц; партия этого размера должна изготовляться всякий
    раз, когда уровень запасов на начало месяца снизится до нуля.
    Соответствующие минимальные среднемесячные затраты сократятся
    до 131/з — по сравнению с 154/5, указанными в таблице рис. 8.16.

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    35

    Допустим, что, стремясь уменьшить отрицательное экономическое
    влияние ограничения по производственным мощностям, мы открыли
    возможность повысить месячный выпуск до 6 единиц. Однако соответствующие затраты производства составляют
    С (6) = 28,5,

    т. е. дополнительные затраты на 6-ю единицу выпускаемой продукции возросли (они равны 28,5 — 23 = 5,5). Очевидно, добавление
    к числу рассматриваемых вариантов еще одного варианта месячного
    inac на
    ачало, L

    п=-.1

    *,w ftii)

    п--г
    хгШ f2W

    п =-3

    /7 == 4

    ъа) № X«W Ъ(1)

    п= 5
    п-= 6
    xs(t) fsM 41') W)

    3

    19

    е

    31,5

    4

    48

    6

    63

    5

    73

    6 94,5

    1

    2

    п

    5

    26

    5

    45

    5

    57,5

    5

    74

    5

    89

    2

    4
    а а а

    24

    4

    4J

    5

    54

    4

    72

    5

    85,5

    W

    0

    31,5

    0

    48

    0

    63

    0

    79

    18

    а

    27

    а

    4S

    а

    58,5

    и

    75

    а

    1

    3

    4

    15

    У
    ///, ///,

    У

    0

    Р и с. 8.17. Результаты для случая возросших производственных
    мощностей фирмы «Надежный поставщик».

    выпуска не может ухудшить результаты, поскольку все ранее имевшиеся варианты сохраняются. Однако окажет ли это добавление
    большое влияние?
    Новые значения /n (i) и соответствующие им хп (i) приведены
    на рис. 8.17. Читателю следует еще раз проверить, насколько хорошо
    он освоил рекуррентный вычислительный процесс, для чего он должен
    рассчитать / 2 (i) и / 3 (i). На рис. 8.18 представлены оптимальные
    варианты производственной программы для новых условий примера;
    предполагается что исходный уровень запасов на начало января
    равен нулю. Сравнив эти результаты с приведенными в таблице
    рис. 8.13, можно убедиться в том, что варианты программы для
    JV = 2, 4 и 6 изменены: теперь в них учтена возможность выпуска
    6-й единицы. Вследствие этого минимальные среднемесячные затраты
    Достигаются при длительности планового периода, составляющей два,
    четыре или шесть месяцев. При N, равном 1, 3 или 5, оптимальный
    январский выпуск не достигает 6 единиц. Отметим, что приведенная
    на рис. 8.16 производственная программа для N = 5 по-прежнему
    остается оптимальной и при новых условиях.
    3*

    36

    ГЛАВА 8

    Длительность
    планового
    периода, N Яне.

    Февр.

    Март

    Апр.

    Май

    Июнь

    СреднеОбщая
    сумма, месячные
    затрат затраты

    Р и с . 8.18. Скользящий план фирмы «Надежный поставщик» для бесконечного периода при возросшей производственной мощности (г 0 = 0).

    Влияние величины исходного уровня запасов показано в таблице рис. 8.19. При выборе этого уровня, равным 1 или 2 единицам,
    оптимальный январский выпуск остается таким же, как на рис. 8.14,
    однако цена единичных приращений запаса меняется.
    Пусть спрос Dt, равный 3 единицам, существует в течение бесконечного времени, причем для разработки программы используется
    скользящее планирование. Варианты производственной программы
    для этого случая (при нулевом исходном уровне запасов) приведены
    Цена предыдущего единичного приращения исходного
    Длительность Январский выпуск
    запаса
    планового
    i
    =2
    периода, N
    ia=l
    ia~i ia=2
    a
    ^0
    1
    3
    Z
    /
    2
    Z
    S

    •?

    5,5

    Z

    3

    6
    4

    ff

    4

    3

    2

    4

    6

    ff

    5

    $5

    3,5

    5

    б

    f

    4

    ff

    2

    В

    Б

    5

    5

    5,5~

    3,5

    2

    Р и с . 8.19 Цена единичного приращения ис-.
    ходного запаса фирмы
    «Надежный поставщик»
    при возросшей производственной мощности.

    в таблице рис. 8.20. Вариант с минимальными среднемесячными затратами возможен при четных значениях N; нечетным значениям N
    отвечают ранее полученные варианты с более высокими затратами
    (рис. 8.16).

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    37

    Рассмотрим более детально различия между оптимальным регулярно повторяющимся производственным циклом для новых и прежних условий (эти циклы приведены в таблицах рис. 8.20 и 8.16).
    Ранее в течение десяти месяцев выполнялось шесть переналадок,
    Длительность
    планового
    периода, N

    Повторяющийся производственный цикл

    W^m
    /// ^ •'///////

    1

    3

    5

    5

    3

    4

    5

    0

    6

    0

    Ш

    2, Оптимальный
    вариант

    0

    Среднемесячные
    затраты
    19

    '4
    ^
    IS*

    Р и с 8.20. Пересмотренный скользящий план
    фирмы «Надежный поставщик» для бесконечного
    периода при возросшей производственной мощности (s0 = 0).

    максимальный уровень запасов был равен 4 единицам, причем нулевой (положительный) запас отмечался в восьми месяцах из десяти.
    При изменившихся условиях партия размером 6 единиц выпускается
    в каждом нечетном месяце, уровень запасов равен либо 3 единицам,
    либо нулю. В течение десятимесячного периода выполняется только
    пять переналадок, максимальный уровень запасов равен 3 единицам,
    причем запас является нулевым (положительным) всего лишь в пяти
    месяцах из десяти. Ослабив ограничение, налагаемое на производственные мощности, мы не только снизили среднемесячные затраты,
    но и получили новую оптимальную программу, которая по своим
    качественным аспектам является более привлекательной.
    КОНТРОЛЬНЫЕ УПРАЖНЕНИЯ

    Упражнения 1—6 связаны с задачей о дилижансах (разд. 8.2).
    1. а) Перечислите 14 различных маршрутов из штата 1 (Восток)
    в штат 10 (Запад) на сети, изображенной на рис. 8.1.
    б) Объясните, почему при использовании принципа оптимальности нет необходимости оценивать затраты для всей совокупности
    перечисленных маршрутов.
    2. а) Предположим, что между штатами 7 и 9 не существует
    дилижансового сообщения. Каким теперь будет оптимальный маршрут из штата 1 в штат 70?
    б) Предположим, что дополнительно введен дилижансовый маршрут, связывающий штаты 3 ж 8. Какой должна быть здесь наименьшая ставка страхового платежа, чтобы мистер М. по-прежнему считал
    предпочтительным ранее выбранный оптимальный маршрут?

    38

    ГЛАВА 8

    в) Определить диапазон ставок страхового платежа для переезда
    из штата 1 в штат 3, в рамках которого ранее выбранный маршрут
    остается оптимальным. Найти аналогичный диапазон для переезда
    из штата 3 в штат 7, а также из штата 2 в штат 6.
    3. Мистер М. полагает, что выбор оптимального маршрута определяется не абсолютными значениями страхового платежа для отдельных участков сети, относящихся к одному и тому же шагу, а разностями между этими значениями. Например, он думает, что выбрал
    бы тот же оптимальный маршрут, если бы затраты с12, с13 и с14 изменились на одну и ту же величину, т. е. были бы равны с 12 = 2 + б,
    с13 = 5 + S, с14 = д + S, где 6 — любая постоянная величина. Прав
    ли мистер М.? Если нет, объясните причину. Если да, то покажите,
    чем может оказаться полезным высказанное им соображение.
    4. Сестра мистера М., миссис Н., проживает в штате 5! Найдите
    оптимальный маршрут из штата 1 в штат 10, проходящий через
    штат 8.
    5. Племянник мистера М., мистер П., живет в Сан-Франциско
    (штат 10) и хочет отправиться в штат 1. Предположим, что для каждого из участков сети ставка страхового платежа одинакова при
    поездке как с Запада на Восток, так и с Востока на Запад.
    а) Объясните, почему оптимальный маршрут для мистера П. будет
    таким же, как для мистера М., но имеющим обратное направление.
    б) Выполните рекуррентные вычисления по формуле (2) (разд. 8.2).
    начав их со штата 1. (Заметим, что если в настоящем примере мистеру
    П. предстоит еще один шаг пути (п = 1), то он находится либо в штате 2, либо в штате 3, либо в штате 4, а если п = 4, то мистер П. находится в штате 10.)
    6. Задача о дилижансах. Найдите оптимальный маршрут из штата 1 в штат 10 для каждого из вариантов задачи, в которых ставки
    страхового платежа для переезда из штата i в штат / соответственно
    равны (Cij приведены на рис. 8.1):
    а) c t j -f- i (например, ставки страхового платежа для переезда
    из штата 1 в штат 2 равны 3, в штат 3 — 6, в штат 4 — 2 и т. д.);
    б) ctj + 7 (например, ставки страхового платежа для переезда
    из штата 1 в штат 2 равны 4, в штат 3 — 8, в штат 4 — 5 и т. д.);
    в) сц 4- / — i (например, ставки страхового платежа для переезда
    из штата 1 в штат 2 равны 3, в штат 3 — 7, в штат 4 — 4 и т. д.);
    г) Ciy + J + 7 (например, ставки страхового платежа для переезда
    из штата 1 в штат 2 равны 5, в штат 3 — 9, в штат 4 — 6 и т.д.).
    7. Сравните алгоритм, основанный на формуле (2) из разд. 8.2,
    с алгоритмом нахождения кратчайшего пути, изложенным в разд. 7.7.
    Упражнения 8 — 20 относятся к модели управления производством и запасами, описанной в разд. 8.3.
    8. В каждом из приведенных ниже вариантов задачи известны
    либо выпуск xt для отрезка t, либо уровень запасов it на конец отрезка t; определите значения неизвестных переменных, будь то it или

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    39

    xf. Предполагается, что плановый период состоит из 6 отрезков (N =
    = 6) и что спрос соответственно равен:
    Di = Ю, Dz = 15, D з = 8, £> 4 = 25, D5 = 12, De = 30 единицам.
    Установите, является ли получаемая программа допустимой, т. е.
    не отрицательны ли xt и it для всех t (i 0 — уровень запасов на начало
    отрезка 1).
    а) i 0 — 10. xt = 15 для каждого из отрезков;
    б) i 0 = 5, aij = 20, xt = 15 для t = 2, 3, . . ., 6;
    в) i f l ^ 5, Жц = 15 для t = 1, 2, . . ., 5, ж6 = 20;
    г) i 0 -- 1, £; = 10 для t = 1, 2, 3, xt = 23, для Z = 4, 5, 6;
    д) z 0 = 0, ii = 15, i ? = 20, i 3 = 25, i 4 = 15, i 5 = 5, i e = 0;
    •e) i 0 =' 10, i j = 15, i 2 = 20, i 3 = 25, i 4 = 15, i 5 = 5, ie = 0;
    ж) i 0 = 30, ч = 15, i a = 20, i з = 25, i 4 = 15, i 5 = 5, i e = 0;
    a) j 0 = 0. i, = 10, i ? = 10, i 3 = 10, i 4 = 10, J 5 = 10, i e = 10;
    и) i 0 = 35, i\ = 35, i 2 = 35, i s = 35, i 4 = 35, i 5 = 35, i e = 0;
    к) ig = 35, ii = 35, i a = 35, i s = 35, i 4 = 35, i 5 = 10, i6 = 0;
    л) Как изменится программа, если в вариантах д) и ж) — к)
    i, = Ю?
    9. Пусть затраты описываются функцией Ct (xt, i t ) :
    Ct (xt, i ( ) = C ( x t ) + hit,
    где
    О
    при xt = 0,
    (Xt)
    при xt>0

    и h = 0. Вычислите общую сумму затрат на производство и содержание запасов для следующих вариантов задачи 8:
    а) вариант а),
    д) вариант е)
    б) вариант б),
    е) вариант з),
    в) вариант в),
    ж) вариант к).
    г) вариант д),

    10. Пусть известны значения выпуска xt и уровня запасов, it,
    удовлетворяющие ограничениям (2) — (5) разд. 8.3; напомним, что
    Ct (xtJ it) есть функция затрат на производство и на содержание
    запасов, а уровень запасов на конец планового периода iN = 0.
    а) Увеличьте х2 на 1 и уменьшите х3 на 1, соответствующим образом изменив значения уровней запасов. Объясните, почему измененная программа остается допустимой. Определите изменение общей
    суммы затрат.
    б) Увеличьте х 3 на 1 и уменьшите х% на 1 , соответствующим образом изменив значения уровней запасов. Объясните, в каких случаях
    измененная программа может оказаться недопустимой. Укажите,
    как должен измениться спрос, чтобы полученная программа стала
    Допустимой. Укажите, каковы должны быть эквивалентные изменения уровней запасов. Полагая полученную программу допустимой,
    определите изменение общей суммы затрат.

    40

    ГЛАВА 8

    в) Увеличьте хг на 1 и уменьшите xt на 1, изменив соответствующим образом уровни запасов. Объясните, почему измененная программа остается допустимой. Определите изменение общей суммы
    затрат.
    г) Увеличьте уровень запасов i 2 на 1, изменив соответствующим
    образом объемы выпуска. Объясните, почему в рассмотренных случаях измененная программа может оказаться недопустимой. Укажите, как необходимо изменить спрос для сохранения допустимости
    новой программы. Полагая полученную программу допустимой,
    определите изменение общей суммы затрат.
    д) Уменьшите уровень запасов i 2 на 1, изменив соответствующим
    образом объемы выпуска. Объясните, в каких случаях измененная
    программа может оказаться недопустимой. Укажите условия, выполнение которых необходимо для сохранения допустимости новой
    программы. Полагая полученную программу допустимой, определите изменение общей суммы затрат.
    11. Пусть N = 6, составьте уравнение типа уравнения (4) из
    разд. 8.3 для t = 1, 2, . . ., 6.
    а) Представьте систему ограничений модели в виде матрицы, аналогичной изображенной на рис. 8.6.
    б) Постройте для данной задачи сеть, аналогичную изображенной
    на рис. 8.7. (Указание: просуммируйте шесть уравнений, перечисленных в п. а), получив в результате этого седьмое уравнение; затем
    постройте систему из полученного уравнения и из шести исходных
    уравнений, умноженных на —1.)
    в) Предположим, что функция затрат линейна:

    где

    Ct (s(, it) = Ctxt + hit,
    d = 1, C 2 = 4, C3 = 3, C 4 = 5, C5 = 7, Ce = 4.

    Приняв i 0 = 0, а спрос равным указанному в упражнении 8 Т
    найдите оптимальную программу для h = 0, h = 1/2, h = 1V2
    и h = 4. Укажите альтернативные варианты оптимальной программы, если такие имеются.
    12. Объясните устно, почему состояние системы на начало каждого отрезка планового периода полностью характеризуется уровнем
    запасов. Какие предположения о характере целевой функции и о длительности производства изделий дают возможность столь просто
    характеризовать состояние системы?
    13. Процесс рекуррентных вычислений в динамическом программировании в разд. 8.2 назван «самообеспечением». Объясните устно,
    каким образом подобный подход использован для решения задачи
    управления запасами в разд. 8.3.
    14. Пусть N = 6 и январь является отрезком 1 планового периода.
    Пусть далее dn характеризует спрос для месяца, отстоящего на п
    месяцев от конца планового периода. К какому месяцу относится d£

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    41

    15. Рассмотрите рекуррентное соотношение (8) разд. 8.3. Пусть
    i = 0 за п отрезков до конца планового периода. Каким является
    наименьшее допустимое значение выпуска х для отрезка и? Пусть
    вместо этого i = di + d2 + • • • + dn Какова программа выпуска
    для каждого из оставшихся отрезков?.
    16. Рассмотрите рекуррентное соотношение (8) разд. 8.3. Пусть
    с з (х, /) = 5х + 2у; за 3 отрезка до конца планового периода начальный уровень запасов i = 4; уровень запасов на конец каждого отрезка не должен превышать 4 единиц; пусть также da = 10. Найдите
    оптимальную программу производства и соответствующий ей набор
    уровней запасов па конец отрезка для следующих вариантов задачи:

    а) /2 (0) = 100, /2 (1) = 90, /2 (2) = 82, /2 (3) = 76, /2 (4)
    б) /2 (0) = 110, /2 (1) = 100, /2 (2) = 92, /2 (3) = 86, /2 (4)
    в) /2 (Л = 100 - 6/;
    г) /2 (/) = 100 - 9/;
    д) /2 (0) = 100, /2 (1) = 99, /2 (2) = 93, /2 (3) = 85, /2 (4)
    17. Напомним, что хп (i) есть оптимальный выпуск на отрезке,
    отстоящем на п отрезков от конца планового периода, при начальном
    уровне запасов i. Пусть dn = 2 для любого п, причем значения хп (i)
    равны:
    ха(0) = 5, * а (0) = 4 , 34(0) = 2 ;
    х 3 ( 1 ) = 4 , * 2 ( 1 ) = 3 , *!(!) = !;
    z s (2) =0, xt(2) =0, х , ( 2 ) =0;
    гз (3)= 0, * 2 ( 3 ) = 0 .
    Найдите оптимальную производственную программу и соответствующие уровни запасов для вариантов задачи а) — г), если до конца
    планового периода осталось п = 3 отрезкам, а начальный уровень
    запасов i равен:
    а) 0, б) 1 единице, в) 2 единицам, г) 3 единицам.
    д) Насколько меняется значение общей суммы затрат при переходе
    о т 1 = 2 к 1 = 1 з а т г = 3 отрезкам от конца планового периода.
    При переходе от i = 3 к i = 4? [Для отображения затрат на отрезке,
    отстоящем на k отрезков от конца планового периода, использовать
    условное обозначение ch (x, /).]
    18. а) Постройте сеть, аналогичную изображенной на рис. 8.8,
    Для анализа задачи, в которой dn = 2 единицам (п = 1, 2, 3, 4).
    б) Постройте сеть, аналогичную изображенной на рис. 8.8, для
    анализа задачи, в которой допустимые значения выпуска х равны
    О, 2 или 4 единицам.
    в) Объясните, как меняется сеть рис. 8.8, если налагается ограничение, согласно которому уровень запасов на конец каждого из отрезков не должен превышать 1.
    г) Объясните, как упрощается сеть рис. 8.8, если известен исходный уровень запасов на начало января, который равен 1.

    42

    ГЛАВА 8

    19. Объясните связь между алгоритмом отыскания кратчайшего
    пути на сети рис. 8.8 и рекуррентными вычислениями по формуле
    (8) разд. 8.3.
    20. В сети рис. 8.8 измените ориентацию каждой из дуг на обратную. Пусть исходный уровень запасов на начало января равен 1.
    Объясните, почему отыскание кратчайшего пути от вершины «Конечное состояние» до вершины, соответствующей единичному уровню
    запасов на начало января, совершенно идентично применению рекуррентного соотношения (IV) в конце разд. 8.3, причем любой из этих
    методов позволяет получить значение g 4 (0).
    Упражнения 21—34 относятся к задаче, посвященной фирме
    «Надежный поставщик» и приведенной в разд. 8.4.
    21. Для вариантов а) — в) составьте таблицы, аналогичные таблице рис. 8.11 и дающие значения /n (i) и хп (i) для указанных значений п. При построении каждой таблицы использовать значения
    / n _! (i), приведенные в таблице рис. 8.12.
    а) п = 4; б) п = 5; в) п — 6.
    22. а) Убедитесь в том, что функция затрат С (х), соответствующая выражению (3) в разд. 8.4, может рассматриваться как функция,
    включающая затраты на переналадку, равные 13, а также пропорциональные затраты, составляющие 2 на каждую единицу изготовляемой продукции.
    б) Объясните, почему выпуск х на любом отрезке должен быть
    меньше, чем (3 — i), где i — уровень запасов на начало отрезка.
    в) Объясните, почему выпуск х на любом из отрезков не должен
    превышать (7 — i), если уровень запасов на конец отрезка ограничен
    условием i ^ 4.
    г) Пусть исходный уровень запасов на начало планового периода
    равен нулю. Вычислите среднемесячные затраты для следующих вариантов производственной программы с месячным выпуском, равным:
    3 единицам;
    5 единицам в нечетные месяцы и 1 — в четные;
    5 единицам, 5 единицам, 2 единицам, 0;
    5 единицам, 5 единицам, 0, 2 единицам;
    5 единицам, 2 единицам, 5 единицам, 0;
    .
    4 единицам в нечетные месяцы и 2 — в четные;
    4 единицам, 4 единицам, 4 единицам, 0.
    Объясните различия между суммами затрат для этих вариантов.
    23. Постройте таблицу, аналогичную изображенной на рис. 8.13,
    предположив, что исходный уровень запасов на начало января равен:
    а) г о = 1; б) i 0 = 2; в) i0 = 3; r) i 0 = 4.
    д) Построив такую таблицу, проверьте правильность изменения
    общей суммы затрат, приведенных в таблице рис. 8.14, и дополните
    эту таблицу результатами, полученными для i 0 = 3 и i 0 = 4.
    24. Постройте таблицу, аналогичную изображенной на рис. 8.12,
    при условии соблюдения приведенного в а) и б) ограничения на уро-

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ

    43

    вень запасов на конец отрезка. (Указание: при составлении такой
    таблицы можно не повторять всех вычислений, разумно используя
    информацию, которая содержится в таблицах рис. 8.9 — 8.12.)
    a) i < 5; б) i < 3.
    в) Построив такую таблицу, определите наименьшее значение
    верхнего предела уровня запасов (3, 4 или 5 единиц), не оказывающего влияния на результаты.
    25. Постройте таблицы, аналогичные изображенным на рис. 8.12
    и 8.13, для следующих вариантов ограничений производственной мощности:
    а) На любом отрезке выпуск х не должен превышать 4 единиц.
    б) На любом отрезке выпуск х не должен превышать 6 единиц,
    причем С (6) = 25.
    в) Построив таблицы, определите влияние изменений ограничений производственной мощности.
    г) Какова оптимальная производственная программа фирмы,
    если для любого отрезка справедливо ограничение х ^ 1?
    26. Постройте таблицу, аналогичную изображенной на рис. 8.12,
    при условии, что уровень запасов на конец планового периода равен:
    а) 1 единице; б) 2 единицам; в) 3 единицам; г) 4 единицам.
    д) Для каждого из вариантов задачи постройте таблицу, аналогичную изображенной на рис. 8.13.
    27. Постройте таблицы, аналогичные изображенным на рис.
    8.12—8.14, при условии, что для любого отрезка спрос Dt равен:
    а) 2 единицам; б) 4 единицам.
    в) Объясните, как будет отличаться оптимальная производственная программа при месячном спросе, равном не 3, а 2 или 4 единицам.
    28. Постройте таблицы, аналогичные изображенным на рис.
    8.12—8.14, для вариантов а) и б) задачи:
    а) Элемент функции С (х), которая определяется выражением (3)
    в разд. 8.4, равен 10 (вместо 15).
    б) Затраты на содержание единицы запаса равны 5 (вместо 1).
    в) Объясните, какое влияние на выбор оптимальной производственной программы оказывает снижение затрат на переналадку или
    удорожание содержания запасов.
    29. Постройте таблицы, аналогичные изображенным на рис. 8.12
    и 8.13, при том условии, что спрос для последнего месяца планового
    периода не равен 3 единицам, а равен цифрам, указанным в вариантах
    а) и б) (например, при N = 4 спрос изменен для апреля). Сравните
    полученные результаты с производственными программами, приведенными в таблицах рис. 8.12 и 8.13; объясните, как изменится программа, если в январе делается неправильное предположение о том,
    что спрос последнего месяца планового периода равен 3 единицам
    вместо значений, указанных в вариантах а) и б):
    а) 2 единицы; б) 4 единицы.
    30. Спрос задан для десяти месяцев, а производственная программа разрабатывается методом скользящего планирования. Про-

    44

    ГЛАВА 8

    верьте, будут ли выбраны варианты программы, приведенные в таблице рис. 8.15, если длительность планового периода принята равной:
    а) N = 3, б) N = 4; в) N = 5; г) N = 6.
    31. Спрос задан для бесконечного периода, производственная программа разрабатывается методом скользящего планирования. Проверьте, действительно ли будут выбраны варианты программы и
    соответствующие им среднемесячные затраты, приведенные в таблице
    рис. 8.16, если длительность планового периода принята равной:
    а) N = 3; б) N = 4; в) N = 5; г) N = 6.
    32. Пусть функция затрат на содержание запасов (разд. 8.5) модифицирована таким образом, что h = 1, но относится к среднему
    уровню запасов, описываемому формулой (II), которая приведена
    в конце разд. 8.5. Постройте таблицы, аналогичные изображенным
    на рис. 8.12 и 8.13, и определите, какое влияние оказывает выбор
    такого метода исчисления затрат.
    33. Предположим, что фирма «Надежный поставщик» отказалась
    от проводимой ранее политики полного и своевременного удовлетворения спроса. Пусть, далее, функция затрат, включающая штраф
    за неудовлетворенный спрос, описывается формулой (VI), приведенной в конце разд. 8.5, причем штраф за единицу р = 10. Для вариантов а) и б) задачи постройте таблицы, аналогичные изображенным
    на рис. 8.12 и 8.13, и определите, какое влияние на выбор оптимальной программы окажет введенное изменение правил:
    а) Своевременно неудовлетворенный спрос полностью теряется,,
    так что уровень запаса на конец отрезка описывается формулой (IV),
    приведенной в конце разд. 8.5.
    б) Спрос, не удовлетворенный немедленно, полностью сохраняется и должен быть удовлетворен в течение следующего отрезка.
    Вместе с тем к концу последнего отрезка планового периода не должно
    существовать неудовлетворенного спроса, так что удовлетворяется
    весь спрос планового периода. Штраф удерживается на каждом отрезке, спрос по которому своевременно был неудовлетворен.
    34. Для каждого из приведенных ниже значений п постройте
    таблицу, аналогичную изображенной на рис. 8.11 и содержащую
    /„ (i) и xn(i). Используйте значения / n _ 4 (i), приведенные в таблице
    рис. 8.17.
    а) п = 2; Ъ) п = 3; в) га = 4; г) п = 5; д) га-=6.
    35. Объясните, как вы понимаете следующие термины:
    динамическое программирование;
    принцип оптимальности;
    рекуррентное соотношение;
    рекуррентный алгоритм;
    оптимальная стратегия;
    шаг;
    состояние;
    направленность, обратная движению во времени;
    скользящий план.

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
    УПРАЖНЕНИЯ

    НА

    РАЗВИТИЕ ВЫЧИСЛИТЕЛЬНЫХ

    45

    НАВЫКОВ

    36. Мистер М. собирается совершить туристическую поездку и хочет отыскать наиболее экономный маршрут от Дарвина (вершина 1)
    до Сиднея (вершина 13) на сети, изображенной на рис. 8.21; затраты
    для отдельных участков сети, в долларах проставлены на соответствующих дугах. Найдите этот маршрут; вычисления представьте
    в виде таблиц, аналогичных приведенным на рис. 8.2—8.5.
    37. Пусть на сети рис. 8.21 проставленные на дугах цифры характеризуют затраты при поездке как в одном, так и в обратном направлении. Найдите оптимальный маршрут из Сиднея в Дарвин.

    Сидней

    Дарвин

    Р и с. 8.21.

    Представьте расчеты в виде таблиц, аналогичных приведенным
    на рис. 8.2—8.5.
    38. По дороге из Дарвина в Сидней мистер М. хотел бы заехать
    в район 5, так как только там можно увидеть самых крупных кенгуру.
    Найдите маршрут из Дарвина в Сидней, проходящий через район 5.
    Упражнения 39—44 относятся к отдельным частным случаям модели управления запасами, которая описана в разд. 8.3 и характеризуется применением рекуррентного соотношения (8). В каждом из этих
    упражнений затраты на отрезке t описываются выражением
    Ct (xt, it) = Ct (xt) + ht it.
    Отметим, что отрезком 1 здесь именуется тот месяц, с которого начинается плановый период — например, январь. Для указанных значений длительности планового периода постройте таблицы, аналогичные приведенным на рис. 8.12 и 8.13. (Примечание: более эффективные алгоритмы решения задач такого типа описаны в гл. 9.)

    39. Пусть N = 4, спрос Dt = 1, а затраты на содержание запасов
    для всех отрезков равны ht = 0,1. Пусть, далее,

    d (0) = 0, d (1) = 5, d (2) = 10, d (3) = 15, d (4) = 16;

    46

    ГЛАВА 8

    С2 (0) = О, С 2 (1) = 6, С 2 (2) = 9, С 2 (3) = 12;
    Сз(0) = 0 , С 3 (1) = 5, С 3 (2) = 7;
    С4 (0) = О, С4 (1) = 3.
    С

    40. Пусть ^V = 5; D, = 1, D 2 = 1, £»3 = 2, Z? 4 = 3, Z)5 = 4;
    затраты на содержание запасов для всех отрезков составляют ht = 1>
    Производственные затраты равны

    при #г = 1, 2, 3, ...,
    где для всех t ct — 10 и

    sj = 1, s, = 2, s3 = 4, s4 = 8, sj-= 7.
    4'iT Пусть N = 4; D1= 1, Dz = 4, Z)8 = 2, £>4 = 2; At = 0 для
    всех месяцев. Производственные затраты описываются функцией,
    которая по форме идентична приведенной в упражнении 40, причем
    si = 1, s2 = 12, s 3 = 1, s4 = 2;
    c4 = 3, c2 = 1, c3= 2, c4 = 1.
    42. Решите задачу фирмы «С дальным прицелом», рассмотренную
    в упражнении 28 гл. б и в упражнении 48 гл. 7.
    43. Фирма может выпускать ограниченное число изделий, оплачивая труд рабочих в течение рабочего дня по обычным расценкам,
    и увеличивать выпуск (тоже ограниченно), оплачивая работу посверхурочным расценкам. Численные данные приведены в таблицерис. 8.22. Так, например,
    Г 2z,
    при Xl = 0, 1, 2, 3,
    с
    '

    { 2.3 + 5(1! —3) = 5а:1-9 при а:1 = 4, 5, . . . , 9.
    Апр.

    2

    4

    2

    5

    2

    6

    3

    1

    4

    3

    1

    3

    Затраты на
    единицу

    5

    6

    6

    6

    О
    О

    7

    Мощность

    6

    3

    3

    2

    0

    1

    1

    2

    7

    6

    0

    2

    Работа в те- Затраты на
    единицу
    чение
    рабочего
    дня
    Мощность
    Работа
    в
    сверхурочное
    время
    Спрос, D(

    Май Июнь

    Янв. Февр. Март

    Р и с . 8.22.

    ТЕОРИЯ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ

    МОДЕЛЕЙ

    47

    Различия в значениях затрат для разных отрезков обусловлены специфическими условиями спроса и предложения рабочей силы той
    квалификации, которая нужна фирме, а также изменением цен
    на сырье. Предполагаем, что затраты на содержание запасов исчисляются, исходя из уровня запасов на конец каждого отрезка, причем
    ht = 1 для всех отрезков. ,
    44. Пусть длительность планового периода N равна 3, спрос
    составляет:
    А = 3, D2 = 6, D3 = 3,
    а затраты на содержание запасов не учитываются. Производственные
    затраты характеризуются приводимыми ниже данными:
    Январь

    Февраль

    6
    Затраты
    на пере3
    наладку
    Пропорциональные
    затраты (в расчете
    на 1 изделие) при
    месячном выпуске: от 1 до 5 изде- от 1 до 5 изделий
    лий равны 1
    равны 1
    от 6 до 10 изде- начиная с 6-го
    изделия, равны
    лий равны 5
    25
    начиная с 11-го
    изделия, равны
    30

    Постройте таблицы,
    и 8.13.

    Март

    20

    за 1-е изделие
    равны 1
    начиная со 2-го
    изделия, равны 30

    аналогичные приведенным на рис.

    8.12

    ДОПОЛНИТЕЛЬНЫЕ УПРАЖНЕНИЯ

    45. Рассмотрим модель управления
    запасами,
    описанную
    в разд. 8.3. Пусть х — «программный» выпуск продукции для каждого
    отрезка; при отклонении фактического выпуска х от: х фирма платит
    «издержки сглаживания» v-\x — х\, причем х — заранее установленная постоянная величина.
    а) Покажите, каким образом следует изменить рекуррентное соотношение (8), для того чтобы учесть эти издержки сглаживания.
    б) Пусть v = 1, х = 3, а остальные данные взяты из разд. 8.4.
    Постройте таблицы, аналогичные изображенным на рис. 8.12 и 8.13Г
    и выясните влияние учета издержек сглаживания.
    в) Выполните задание б) при х = 2.

    48

    ГЛАВА

    г) Рассмотрите трудности, возникающие при постановке задачи
    в терминах динамического программирования, если издержки сглаживания равны v-\xt — xt_i | . (Этот случай описан в гл. 9.)
    46. Покажите способы модификации модели управления запасами
    (разд. 8.3) и рекуррентного соотношения (8), чтобы учесть:
    а) порчу запасов, при которой их уровень на начало отрезка t
    меньше, чем на конец отрезка (t — 1);
    б) производственный брак, в результате которого при объеме
    выпуска х число годных изделий меньше х;
    в) возможности «отрицательного спроса», т. е. возврата изделий;
    г) возможности «отрицательного выпуска», т. е. использования
    изделий для внутренних нужд фирмы;
    д) зависимости производственных затрат в течение отрезка t
    от объема выпуска не только на отрезке £, но и на отрезке (t — 1).
    47. Покажите способ модификации модели управления запасами
    разд. 8.3 и рекуррентного соотношения (8), если Rt (yt) есть общая
    выручка от реализации yt изделий в течение отрезка t, причем yt —
    управляющая переменная. (Предполагается, что реализация продукции в течение отрезка t не может превышать уровня запасов на конец
    этого отрезка.)
    В упражнении 48 требуется построить модель, использующую
    рекуррентное соотношение динамического программирования. Дайте
    определение всем используемым в модели величинам, получившим
    условные обозначения, и ответьте на пять вопросов, поставленных
    в конце разд. 8.2. Постройте целевую функцию, соответствующую
    состоянию за п отрезков до конца планового периода, и в частности при п = 1. Объясните, с чего начинаются и чем завершаются
    вычисления.
    48. Рассмотрите случай фирмы «Перманентный рейс», описанный
    в упражнении 26 гл. 2. Постройте модель (но не решайте задачу)
    на основе рекуррентного соотношения динамического программирования.

    ГЛАВА 9

    Динамические оптимизационные модели
    управления запасами1)
    9.1. ИСПОЛЬЗОВАНИЕ ОСОБЕННОСТЕЙ СТРУКТУРЫ

    В настоящей главе продолжается анализ детерминированной
    модели управления запасами, описанной в разд. 8.3. Будет показано,
    что при определенных свойствах целевой функции удается характеризовать оптимальную программу значительно полнее. В частности,
    можно установить ее вид: в свою очередь, обладая такими познаниями, можно разработать упрощенный вычислительный алгоритм
    построения такой программы.
    В гл. 9 нами принято, что целевая функция для любого отрезка
    t имеет следующий вид:
    Ct (xt, i t ) = Ct (xt) + ht ( i t ) t
    (1)

    где

    Ct (xt) > 0, Ct (0) = 0, ht (it) > 0, ht (0) = 0.

    (2)

    Таким образом, для любого отрезка общая сумма затрат представляет собой сумму затрат Ct (xt) на производство xt изделий и затрат ht ( i t ) , обусловленных наличием запаса it единиц на конец отрезка. Балансовые уравнения для любого отрезка имеют вид

    it = it-i + zt — Dt,

    (3)

    причем постулируется, что i 0 = 0, а все Dt — неотрицательные
    целые числа. Уравнение (3) можно записать и в другом виде:
    t
    t
    it = i0 + S *ft - S Dh.
    (4)
    b=i
    ft=i

    Наконец, выдвигается требование
    Неотрицательности и целочисленности xt и it,
    (5)
    при выполнении которого спрос удовлетворяется полностью и своевременно.
    9.2. ВЫПУКЛЫЕ И ВОГНУТЫЕ ЦЕЛЕВЫЕ ФУНКЦИИ

    В последующих разделах делаются некоторые дополнительные
    предположения о виде функций Ct (xt) и ht ( i t ) . В частности, будем
    различать два важных класса этих функций.
    1
    ) В настоящей главе основным предметом рассмотрения является анализ
    управления запасами, а второстепенным — динамический анализ. Целостность
    восприятия не уменьшится, если читатель временно опустит эту главу и вернется к ее изучению, перед тем как приступить к гл. 19 и приложению 2 (том 3).

    4-0734

    ГЛАВА 9

    50

    Функция у (ж), определенная при целых значениях х, называется
    выпуклой, если
    g (х+ 1) _ g (Х) ^ g (Х) - g (

    X

    -

    1),

    (1)

    и вогнутой, если
    На рис. 9.1 приведены графики нескольких выпуклых и вогнутых
    вниз функций.
    Если рассматривать g (х) как общую сумму затрат, то функция
    затрат является выпуклой, если каждая дополнительная единица
    Выпуклые срункции затрат

    9&

    ff(

    Вогнутые срунщии затрат

    д(х)

    Р и с . 9.1.

    стоит не меньше предыдущей. Аналогично функция затрат является
    вогнутой, если каждая дополнительная единица стоит не больше предыдущей. Иногда допустимые значения ограничены некоторыми пределами, например можно ввести условия х — а, а -\- I, . . . , Ъ — 1,
    Ъ (где а + 1 ^ Ъ — 1). Тогда приведенные выше определения относятся к значениям я, лежащим в пределах а + 1^ х ^ Ъ — 1.
    При изучении вида какой-либо конкретной функции удобно переписать условия (1) и (2) соответственно в виде (3) и (4):
    2

    (функция выпукла),

    (3)

    (функция вогнута).

    (4)

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    51

    Рассмотрим шесть примеров функции g (x); читателю рекомендуется — и будет полезно — начертить график каждой из этих функций.
    Для того чтобы представить ему такую возможность, в первых четырех примерах зададимся следующими численными значениями параметров: ' а = 2, Ъ = 1, с = 3.
    Пример I. Пусть g (х) = ах + Ъ. Тогда

    так что линейная функция g (х) для любых значений а, Ъ и х одновременно является и выпуклой, и вогнутой.
    Пример П. Пусть g (х) = axz -)- Ъ. Тогда

    = ux + a + o<
    ^ ^ ^
    О

    i

    i

    7 I

    *^ ~"*"

    I

    ^-- 2 '

    v

    L

    "JC*"

    — -S"'

    v

    ' '

    при a<0,

    (b)

    / n\

    v;

    Таким образом, для любых значений х функция g (х) является
    выпуклой при неотрицательном а и вогнутой — при неположительном а.
    Пример III. Пусть
    ах-\-Ъ

    при ж>-0,

    —сх + Ь

    при г<0,

    где а ^ 0 и с ^ 0. Из сравнения с примером I очевидно, что функция
    g (х) соответствует (3) и является выпуклой как для х <^0, так и для
    х > 0. При х = О
    [о + Ь

    с

    так что g (х) является выпуклой для всех х.
    Пример IV. Пусть

    f 0

    при х — 0,

    \ ах-\-Ъ

    при а;>-1,

    где Ъ ^ 0. Из сравнения с примером I становится ясно, что при
    х ^> 1 функция g (я) соответствует (4) и является вогнутой. При
    х =1

    ,

    (8)

    так что для неотрицательных х функция g (х) является вогнутой.
    Пример V. Пусть
    g(x)={

    О
    1В + 2х
    28,5

    при х = 0,
    при х=1, 2, 3, 4, 5,
    при х = 6.


    52

    ГЛАВА 9

    Из сравнения с примером IV понятно, что для х ^ 4 выполняется
    условие (4). При х = 5
    )

    )

    так что выполняется условие (3). Следовательно, g (х) не является
    ни выпуклой, ни вогнутой.
    Пример VI. Читатель продемонстрирует понимание проведенного
    выше анализа, показав, что кусочно-линейная функция
    a-iivi + a^x — юО + bj

    при 0-< ж •<«;!,
    при w^x^wz, (10)
    при

    является выпуклой в случае ai ^ а 2 *£ аз и вогнутой в случае
    «1 S& а 2 ^а з- (Выполните анализ при х = и^ и х — ш 2 . Начертите
    графики функции, приняв а 4 = 2, Ь\ = 1, ц?! = 4, а 2 = 3, и;2 = 6,
    Й 3 = 4.)
    Некоторые из рассмотренных выше частных случаев представляют особый интерес. Так, пример III охватывает и функцию
    htit
    при it^O,
    .
    . /л
    v(И)
    — put при i t <0,
    где ht (ht ^0) есть стоимость содержания единицы запасов, a pt
    (pt ^ 0) — штраф за несвоевременное удовлетворение спроса (в расчете на единицу). Пример V является обобщением примера, приведенного в разд. 8.6. Наконец, пример VI охватывает и функцию
    при

    rtut + i,brt(xt — ut)
    i,5ri(vt — ut) + 2rt(xt~vt)

    при ut^.xt^.vt, (12)
    при Vt^.xt,

    где xt — общее число человеко-часов, предусмотренных программой
    для отрезка t', rt — основная ставка за человеко-час работы; ut —
    заданная верхняя граница числа человеко-часов на отрезке t, отрабатываемых в основное время; 1,5 ft — «полуторная» ставка за человеке-чае сверхурочной работы; vt — заданная верхняя граница
    количества сверхурочных часов для отрезка t, a 2rt — «удвоенная»
    основная часовая ставка.
    9,3, МОДЕЛЬ УПРАВЛЕНИЯ ЗАПАСАМИ
    ti ВЫПУКЛОЙ ФУНКЦИЕЙ ЗАТРАТ

    .;,J& дополнение к допущениям о затратах, запасах и .выпуске,
    сделанным в 9.1, предположим, что:
    Функция производственных затрат Ct (xt)
    является выпуклой,
    (1)
    Функция затрат на содержание запасов ht (it)
    является выпуклой.
    (2)

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    53

    Случай выпуклости функции затрат иногда называют случаем
    убывающей предельной эффективности при увеличении масштаба.
    При выпуклости функции затрат можно задаться как ограничением
    U; на объем выпуска xt, так и ограничением bt на уровень запасов it.
    Просто это можно объяснить так: заменим эти ограничения введен^
    ем бесконечно больших величин Ct (xt) для xt > ut и бесконечно
    больших величин ht (it) для it > bt. При такой замене выпуклость (1)
    и (2) сохраняется. Наконец, отметим, что проводимый анализ может
    быть обобщен на случай разрешенной отсрочки (задержки) в удовлетворении спроса.
    Алгоритм вкратце можно описать следующим образом: поочередно
    рассматривается спрос на каждом из отрезков, начиная с отрезка 1.
    Каждая пока еще не удовлетворенная единица спроса удовлетворяется самым дешевым из возможных способов, причем эти возможности
    определяются с учетом использования производственных мощностей,
    уже предусмотренного в построенной части программы, а также
    соответствующей схемы движения запасов. Разумеется, возможность
    получения оптимальной программы с помощью столь простого алгоритма существенно зависит от предположений (1) и (2) о выпуклости
    целевой функции.
    Опишем алгоритм более подробно.
    Шаг 1. Пусть р — первый из отрезков, для которого пока еще
    не удовлетворенный спрос положителен (Dp > 0). Для каждого из
    отрезков 1, 2, . . ., р рассмотрим такое приращение выпуска на
    единицу по сравнению с уже построенной частью производственной
    программы, целью которого является удовлетворение единичного
    спроса на отрезке р.
    Шаг 2. Для каждого из р вариантов единичного приращения
    выпуска на одном из р отрезков вычислим общее увеличение затрат,
    вызванное приращением выпуска и запасов. Выберем вариант
    с минимальным увеличением затрат и соответствующим образом
    изменим уже построенную часть программы. Если имеется несколько
    таких вариантов, выберем вариант с возможно более поздним увеличением выпуска.
    Шаг 3. Уменьшим значение пока еще не удовлетворенного спроса Dp на единицу. Проверим, останется ли при этом хотя бы одно
    ненулевое значение Dt. Если останется — перейти к шагу 1; если
    нет — прекратить вычисления.
    Продемонстрируем применение этого алгоритма на примере.
    Задача фирмы «Вечная шина». Фирма «Вечная шина» составляет
    программу выпуска шин на шесть месяцев (с января по июнь). Данные о спросе по месяцам и о совокупном спросе (нарастающим итогом
    с начала года) соответственно приведены в предпоследней и последней
    строках таблицы рис. 9.2. Заметим, что совокупный спрос за шесть
    месяцев равен 18 единицам, т. е. совпадает с совокупным спросом
    фирмы «Надежный поставщик» (разд. 8.4).

    54

    ГЛАВА 9

    В каждом месяце существует возможность выпуска заданного
    числа шин при нормальном уровне затрат и некоторого дополнительного их числа — при повышенном уровне затрат. Для того чтобы
    продемонстрировать гибкость алгоритма, примем в данном примере,
    что как «нормальные» и повышенные затраты, так и верхние границы
    выпуска при этих затратах неодинаковы для разных месяцев. TIa
    рис. 9.2 нормальные и повышенные затраты проставлены в каждой
    паре клеток, расположенной над диагональю таблицы (верхний показатель — нормальные затраты). Соответствующие верхние границы
    Макси-

    Р и с . 9.2. Модель с выпуклой функцией затрат фирмы «Вечная шина».

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    55

    выпуска для каждого месяца приведены во втором столбце справа,
    а совокупная производственная мощность, т. е. верхние границы
    выпуска с начала года,— в первом столбце справа.
    Так, в январе можно выработать не более 3 единиц при затратах,
    равных 2 за единицу, и дополнительно до 6 единиц при затратах 5
    за единицу. В феврале возможен выпуск 1 единицы при затратах 4
    и дополнительно до 3 единиц при затратах 6 за единицу. В марте
    можно выработать до 4 единиц при затратах 2 и дополнительно до
    3 единиц при затратах 6 за каждую и т. д. Таким образом, производственные затраты каждого месяца отображаются функцией вида
    Ct (xt) = rtxt
    при 0 ^ xt ^ ut (работа в основное время), (3)
    Ct (xt) = rtut + st (xt — ut) = stxt + (rt — st) ut
    при ut ^ xt ^ vt
    (работа в сверхурочное время), (4)
    причем rt < st, так что функция Ct (xt) является выпуклой. В выражениях (3) и (4) rt — нормальные, a st — повышенные затраты,
    ut и vt — соответствующие верхние границы выпуска (например,
    для t = 1 значения этих параметров равны: r t = 2, st = 5, м 4 = 3
    единицам, yt = 3 + 6 = 9 единицам).
    В таблице на рис. 9.2 каждому месяцу соответствуют две строки
    и один столбец; в строках проставляется выпуск продукции в этом
    месяце, тогда как числа в столбце характеризуют удовлетворение
    спроса рассматриваемого месяца. Поскольку задержка удовлетворения спроса не разрешена, клетки под диагональю являются «запрещенными». Таким образом, первые две строки таблицы рис. 9.2
    показывают, что январский выпуск можно направить на удовлетворение спроса любого из шести месяцев, вторые две строки — что февральским выпуском можно удовлетворить спрос февраля и любого
    из последующих месяцев, и т. д. Аналогично июньский спрос можно
    удовлетворить выпуском продукции в любом месяце и т. п. Допустимую программу можно построить, если для каждого месяца
    соответствующий совокупный возможный выпуск с начала года
    не меньше совокупного спроса за этот же период. Читателю рекомендуется сравнить числа первого столбца справа и нижней строки
    таблицы рис. 9.2, чтобы убедиться в выполнении этого условия применительно к рассматриваемой задаче.
    Описываемый далее вычислительный алгоритм несколько упрощен по сравнению с трехшаговым алгоритмом, приведенным выше.
    Такое упрощение оказывается возможным благодаря использованию функций (3) и (4) и линейности затрат на содержание запасов,
    а именно:
    h-t (it) = /Mj (затраты на содержание запасов линейны).
    (5)
    Для упрощения численного примера положим для всех месяцев
    ht = 1. Показатели затрат в каждой строке таблицы рис. 9.2 ежеме-

    56

    ГЛАВА 9

    сячно возрастают на 1, что отражает месячные затраты на содержание запасов. Например, если изделие вырабатывается в январе при
    основном уровне затрат (2 за единицу) и хранится в течение февраля,
    то общая стоимость единицы становится равной 3 (2 + 1 = 3); это
    число и проставлено в клетке первой строки таблицы и февральского
    столбца. Если это изделие хранится еще один месяц, затраты возрастают на 1 и становятся равными 4 (3 + 1 = 4). Именно это число
    проставлено в клетке первой строки и мартовского столбца. Попутно
    отметим, что- нет необходимости задаваться условием равенства нулю
    запаса на конец планового периода (iN = 0), потому что в оптимальной программе выполнение этого условия обеспечивается сделанными 1
    допущениями (3), (4) и (5) о виде функции затрат.!
    Для того чтобы ознакомиться с алгоритмом во всех деталях,
    читателю следует начертить таблицу рис. 9.2. Заметим, что таблица
    напоминает матрицу транспортной задачи. Это сходство неслучайно:
    линейность выражений (3), (4) и (5) позволяет свести задачу к транспортной модели линейного программирования.
    Построение оптимальной программы. Пользуясь терминологией
    транспортной задачи, представим каждую разрешенную клетку
    таблицы рис. 9.2 как маршрут с соответствующим ему показателем
    затрат. Алгоритм попросту состоит в поочередном удовлетворении
    каждой единицы спроса всех месяцев (январь, затем февраль и т. д.)
    с использованием того из возможных маршрутов, затраты по которому
    минимальны. Если имеются одинаково экономичные варианты,
    предпочтение отдается возможно более позднему выпуску.
    Для того чтобы помочь читателю выполнить необходимые операции на заготовленной им копии таблицы рис. 9.2, вкратце опишем
    эти операции.
    I. Январский спрос (1 единицу) удовлетворим январским выпуском при затратах, равных 2 за единицу.
    II. Февральский спрос (2 единицы) удовлетворим январским
    выпуском при затратах, равных 3 за единицу.
    III. Первые 4 единицы мартовского спроса удовлетворим мартовским выпуском при затратах 2 за единицу, следующую единицу —
    февральским выпуском при затратах 5, последние 2 единицы —
    мартовским выпуском при затратах 6 за единицу.
    IV. Первые 3 единицы апрельского спроса удовлетворим апрельским выпуском при затратах 5 за единицу, следующие 2 единицы —
    апрельским выпуском в сверхурочное время при затратах 6 за единицу, последнюю единицу — мартовским выпуском в сверхурочное
    время при затратах 7 за единицу.
    V. Майский спрос равен нулю, поэтому в столбце мая не будем
    проставлять значений выпуска.
    VI. Первую единицу июньского спроса удовлетворим майским
    выпуском при затратах 3 за единицу, вторую — июньским выпуском
    при затратах 6 за единицу.

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    57

    Последовательно выполняя операции I — VI, читатель должен
    соответствующим образом уменьшать неиспользованный остаток производственной мощности (во втором столбце справа таблицы рис. 9.2).
    Как только этот остаток становится равным нулю, оставшиеся клетки
    строки больше не используются. Полученную читателем программу
    следует сравнить с приведенной в таблице рис. 9.3.
    Таким образом, оптимальной является следующая программа:
    Xi = 3, ж 2 = 1, х3 = 7, xt = 5, х5 = 1, хв = 1;
    (6)

    i t = 2,

    ;2 = 1,

    J 3 = 1,

    i 4 = °>

    *5 = 1,

    *в = 0.

    Макси-

    Максимальный

    Совокупный
    • спрос
    Р и с . 9.3. Производственная программа для модели с выпуклой
    функцией затрат фирмы «Вечная шина».

    58

    ГЛАВА 9

    Эта программа может быть получена следующим образом: значение xt исчисляется как использованный выпуск месяца t (который
    определим по данным второго столбца справа на рис. 9.3), a it —
    как сумма показателей выпуска в клетках, расположенных выше
    и правее «диагональной» пары клеток месяца (t -f- 1).
    Очевидно, этот вычислительный процесс намного проще, чем
    вычисление /„ (i), выполнявшееся в гл. 8. Он также несколько упрощен по сравнению с описанным выше трехшаговым алгоритмом.
    В частности, табличное представление данных позволяет на шаге 2
    без труда определить наиболее дешевое приращение выпуска с учетом
    имеющихся возможностей выпуска. Далее, на шаге 3 пока еще не удовлетворенный спрос уменьшается, насколько это возможно, с учетом
    оставшихся наиболее дешевых возможностей приращения выпуска.
    Введение дополнительных ограничений. При рассмотрении сделанных ранее предположений о выпуклости функций (1) и (2) отмечалось, что с помощью трехшагового алгоритма можно учесть как
    верхние границы ut выпуска zt, так и верхние границы bt запаса it.
    В рассмотренном численном примере соблюдение верхних границ
    выпуска xt попросту обеспечивалось рассмотрением только тех
    значений xt, которые бы не были слишком большими (уровень запасов не ограничивался). В задаче фирмы «Надежный поставщик»
    (разд. 8.4) читатель мог убедиться в том, что введение верхних границ иногда оказывает совершенно неожиданное влияние. Однако
    при выпуклой функции затрат справедлива следующая теорема.
    Теорема о влиянии варьирования верхних
    г р а н и ц , (а) Оптимальное значение хр не уменьшится при увеличении верхней границы ир возможного выпуска, а также при увеличении верхней границы bt уровня запасов it, если t ^ р. (б) Оптимальное значение хр не увеличится при увеличении верхней границы
    Ut для любого t =£ р или при увеличении верхней границы bt уровня
    запасов it для t ^ р.
    Для того чтобы убедиться в нетривиальности этой теоремы, достаточно проследить за изменениями оптимальной программы фирмы
    «Надежный поставщик» (разд. 8.4). При ограничении xt ^ 5 для
    to = 2 и N = 6 оптимальной являлась программа
    xi = 4, х2 = О, хг = 3, z4 = 4, хь = 5, х6 = О,
    (7)
    которую можно построить с помощью таблицы рис. 8.12. Предположим, что только для х3 верхняя граница увеличена до 6. Тогда оптимальной становится следующая программа, приведенная в таблице
    рис. 8.17:
    xt = 5, z2 = 0, х3 = 6, xt = 0, х5 = 5, х& = 0.
    (8)
    Следовательно, величина х^ возрастает при увеличении верхнего
    предела мартовского выпуска, что противоречит части (б) теоремы.
    (Заметим, что предположение i 0 = 2 не оказывает влияния, поскольку точно такой же результат был бы получен при i 0 = 0 и Z)t = 1.)

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    59

    Возможность задержки удовлетворения спроса можно учесть,
    внеся в операции трехшагового алгоритма небольшое число незначительных изменений. Однако объем вычислительных операций при
    этом существенно возрастает. Пусть неудовлетворенному спросу
    соответствуют отрицательные значения it. Предположим, что функция ht (i) является выпуклой для всех значений i, т. е. для . . ., — 2,
    — 1, 0, 1 , 2 , . . .. Изменим операции шага 1 — будем теперь рассматривать единичные приращения выпуска для всех отрезков от 1
    до N. Изменим операции шага 2, дополнительно включив в них учет
    увеличения затрат, вызванного задержкой удовлетворения спроса.
    Дополнительные вычисления в основном возникают на шаге 2, при
    расчете изменений затрат для каждого из возможных вариантов
    изменения уже построенной части программы: после того как определены объемы выпуска в измененной программе, необходимо найти
    такое распределение этих объемов между месяцами для удовлетворения уже рассмотренного спроса, при котором минимизируются затраты, связанные как с содержанием запасов, так и с задержкой удовлетворения спроса. Операции шага 3 не изменяются.
    9.4. АНАЛИЗ ДЛИТЕЛЬНОСТИ ПЛАНОВОГО ПЕРИОДА
    В МОДЕЛЯХ С ВЫПУКЛОЙ ФУНКЦИЕЙ ЗАТРАТ

    При использовании описанного алгоритма для решения приведенной выше задачи фирмы «Вечная шина», являющейся частным
    случаем модели с выпуклой функцией затрат, становится ясным,
    что увеличение длительности N планового периода может привести
    не к сокращению выпуска хотя бы в пределах одного месяца, а разве
    лишь к его росту. Этот вывод остается справедливым и для общей
    модели с выпуклой функцией затрат, приведенной в начале разд. 9.3.
    Прежде чем сформулировать эту теорему, введем обозначения
    для совокупного спроса — спроса за р месяцев 1, 2, . . ., р с начала
    года и для совокупного выпуска — выпуска за этот же период.
    Обозначим эти величины Rp и Х:
    =

    и

    Xp=^,xt.

    (1)

    Предположим, что полной уверенности в действительной величине спроса не имеется, однако можно утверждать, что значение Rp
    находится в определенных пределах:
    5 Р < Л Р < Тр,

    р = 1, 2, . . ., N.

    (2)

    Обозначим через Хр (S) и Хр (Т) производственные программы,
    оптимальные для условий Rp = Sp и Rp = Тр соответственно, т. е.
    для тех случаев, когда прогнозируемая величина принимает значения, отвечающие нижней и верхней границам. Тогда можно сформулировать следующую теорему о свойствах оптимальной программы:

    ГЛАВА 9

    60

    Теорема о длительности планового
    периода для модели с выпуклой функцией зат р а т , (а) При увеличении любого Dt ни одно из оптимальных
    значений Хр не уменьшится, (б) Для любого отрезка р (р = 1, 2, . . .
    . . ., N) оптимальная программа удовлетворяет неравенствам
    Хр (S) < Хр < Хр (Т).
    Часть (б) этой теоремы иллюстрируется графиком, приведенным
    на рис. 9.4.
    Этот результат вполне уместно назвать «теоремой о длительности
    планового периода», поскольку увеличение длительности с ./V отрезков до (N + 1) отрезка равносильно увеличению спроса от нуля

    Р и с . 9.4. Границы возможных изменений
    оптимальной программы для модели с выпуклой функцией затрат.
    X (S) — оптимальная программа для нижней
    границы прогнозируемого спроса, X (Т) — то же
    для верхней границы, X — оптимальная программа.

    7 8 3 10

    до DN+i при анализе задач с N + 1 отрезками. В части (а) теоремы
    утверждается, что никакое увеличение спроса не приводит к сокращению выпуска ни для одного из отрезков по сравнению с ранее
    построенной оптимальной программой.
    В задаче фирмы «Надежный поставщик» (разд. 8.4) ни одна из
    частей этой теоремы не применима. Из таблицы рис. 8.13 ясно, что
    при включении в рассмотрение июньского спроса, т. е. при увеличении N от 5 до б, январский выпуск сократился с 5 до 4, а выпуск
    двух первых месяцев, января и февраля,— с 10 до 9.
    Важным следствием части (б) этой теоремы является то обстоятельство, что в определенных случаях можно принимать решения об
    оптимальном объеме производства з^, располагая лишь очень неточной информацией о более позднем спросе. Такая возможность основана на отыскании значений величин X t (S) и Xt (Т) и определении
    разницы между ними, если таковая имеется. При небольшом различии значение х^ можно устанавливать в рамках полученных границ,
    не опасаясь существенных отклонений от оптимума. Процесс определения программы можно повторить в дальнейшем, при появлении

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    61

    дополнительной информации о спросе. Если же разница между
    ХР (S) и Хр (Г) велика, анализ этих двух вариантов программы
    помогает выявить, для каких отрезков важно уточнить прогноз
    спроса.
    Один из частных случаев модели с выпуклой функцией затрат
    представляет особый интерес, поскольку он встречается довольно
    часто и позволяет получить чрезвычайно сильные и полезные результаты о длительности планового периода. Предположим, что на объем
    выпуска и на уровень запасов не налагается ограничений, функции
    производственных затрат для всех отрезков одинаковы, а затраты
    на содержание запасов пренебрежимо малы, так что
    Ct(xt, it)=C(xt).

    (I)

    Для этого случая откажемся от предположения об обязательной
    целочисленности xt и сохраним лишь условие его неотрицательности.
    При этом потребуется определение выпуклости, обобщающее условие (1) разд. 9.2. Непосредственным обобщением будет следующее
    определение: функция g (x) является выпуклой, если для любых w
    и z (w ^ z) и для любого р (0 <; р ^ 1) выполняется условие
    р lg (z) - g (x)] >(1 - p) (g (x) - g (w)},

    (II)

    x = pz + (i—p)w.

    (Ill)

    где
    Перегруппировав в выражении (II) члены и использовав (III),
    получим
    PS (z) + (1 — р) g (w) > g Ipz + (1 — p) w] (условие

    выпуклости).

    (IV)
    [Приняв р = V 2 , w = x — 1 и z = ж + 1, как частный случай (IV)
    получим условие (3) разд. 9.2.)
    Пусть Ар — средний спрос для одного отрезка за первые р отрез
    ков — равно

    ^р = ^,

    Р=1, 2, . . . , TV

    (V)

    и пусть Ап — наибольшее значение из Ар (если для нескольких р
    значения Ар одинаковы, то в качестве отрезка п выберем самый
    поздний из этих отрезков). Тогда можно доказать, что оптимальным
    является объем выпуска
    xt = An,

    t = 1, 2, . . ., ц,

    (VI)

    так что in = О.'Можно также показать, что для остальных отрезков
    t (t > и)'оптимальные значения xt удовлетворяют условию
    xt < Лп,

    t > п.

    (VII)

    :

    62

    ГЛАВА 9

    Далее, справедлив следующий вывод: совокупность отрезков
    1, 2, . . ., п можно рассматривать в качестве отдельного планового
    периода. Программу выпуска для остальных отрезков, от (п + 1)
    до N, можно строить на основе рассмотрения только этих отрезковг
    причем остаток на начало отрезка (п -\- 1) должен быть принят равным нулю. Это значит, что расчеты по формуле (V) можно выполнить
    повторно, исходя из значений Вр:
    ~

    , п + 2, ..., N.

    (VIII)

    Таким образом, второй плановый период начинается с отрезка
    (п + 1) и кончается отрезком q, где q — самое позднее из тех п,
    при которых Вр принимает наибольшее значение. И здесь Вр является оптимальным объемом выпуска для каждого из отрезков второго
    планового периода. Понятно, что подобные рассуждения можно
    повторять до тех пор, пока не будет найдено значение хк. Одно из
    следствий полученного результата состоит в том, что если для всех t
    выполняется условие Dt+1^Dt, то при использовании формулы (V)
    сразу же получаем п = N. Напротив, при Dt+i ^ Dt для всех t
    оптимальным выпуском для любого отрезка является xi = Dt.
    Проделанные выше вычисления соответствуют следующему «графическому» методу построения программы: положим на стол миллиметровую бумагу и воткнем вертикально булавки в точках с координатами (р, Rp), где р = 1, 2, . . ., N, а также в точке (0, 0). Пропустим нить так, чтобы она проходила выше всех булавок, и завяжем один из ее концов на булавке, воткнутой в точке (0, 0). Второй
    конец нити туго натянем у булавки с координатами (N, RN); положение натянутой нити покажет оптимальные значения совокупного
    выпуска Хр.
    Если в задаче фирмы «Вечная шина» (рис. 9.2) применимо условие
    выпуклости (IV), расчеты по формуле (V) позволяют определить
    следующие значения АР1
    . 1
    di = j,

    , 3
    Л =-2-

    10
    л
    ^з = -з-.

    . _ 16

    Л5 — -у,

    , 16
    * = -^-

    А

    . __ 18

    Л6 -- Q-

    так что п = 4 и для f = 1, t = 2, / = 3 и £ = 4 получим xt = 16/4
    Затем, по формуле (VIII), вычислим
    5

    '16-16
    5-4

    =

    О
    Т

    д
    И

    Л

    18-16 2
    =- " = = " ' '

    так что q = 6 и для t = 5 и t = 6 получим xt = 2/a.
    Заметим, что, если значения нескольких Dt изменяются, однако
    Ап остается наибольшим из всех значений Ар, длительность первого
    планового периода не изменяется. Так, если любое Dt для /=»+!, ...,

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    63

    . . ., N уменьшается, это не изменит длительности первого планового
    периода.
    Наконец, отметим следующее существенное и удивительное обстоятельство: для построения оптимальной программы выпуска
    и определения длительности планового периода не требуются численные значения С (xt). Достаточно знать, что производственные затраты
    исчисляются для всех отрезков на основе одной и той же функции,
    что эта функция является выпуклой и что затраты на содержание
    запасов пренебрежимо малы.
    9.5. МОДЕЛЬ УПРАВЛЕНИЯ ПРОИЗВОДСТВОМ
    И ЗАПАСАМИ С ВОГНУТОЙ ФУНКЦИЕЙ ЗАТРАТ

    Модель, рассматриваемая в настоящем разделе, является еще
    одним частным случаем общей задачи управления запасами, которая
    приведена в разд. 8.3. Модель настоящего раздела-иногда называют
    динамической моделью экономически выгодного размера партии;
    она заслуживает внимания, потому что отображает часто встречающуюся и практически важную ситуацию. Кроме того, ее сложность
    является промежуточной между сложностью общей модели'разд. 8.3
    и модели с выпуклой функцией затрат разд. 9.3.
    Дополнительно к допущениям о затратах, запасах и объемах
    выпуска, сформулированных в разд. 9.1, положим, что
    Функция Ct (xt} является вогнутой,
    (1)
    Функция ht (it)
    является вогнутой,
    (2)
    где Ct (xt) — производственные затраты, a ht (it) — затраты на содержание запасов. Случай вогнутости функции затрат иногда называют
    случаем возрастающей предельной эффективности при увеличении
    масштаба. Хотя задержка удовлетворения спроса в данной модели не
    разрешена, проводимый анализ легко модифицировать с учетом
    допустимости такой задержки (разд. 9.6). Вместе с тем < введение
    верхних границ для xt и it не разрешается, что совершенно противоречит предпосылкам модели с выпуклой функцией затрат. Напомним,
    что ограничение на объем выпуска можно заменить установлением
    бесконечно больших затрат Ct (xt) для значений xt, превышающих
    заданную верхнюю границу. Однако при такой замене функция
    Ct (xt) перестает быть вогнутой.
    Вогнутость функции производственных затрат часто встречается
    в том случае, когда выпуск продукции связан с необходимостью
    затрат на подготовительные операции, или переналадку (единовременные затраты), после чего выпуску каждой дополнительной
    единицы продукции соответствуют не меняющиеся пропорциональные затраты:
    г < \ /°
    при ;г, = 0,
    Ct (xt) = <
    ,
    ,
    (3)
    ( st + ctxt при xt > 1.

    64

    ГЛАВА 9

    Напомним, что именно такой вид имела функция производственных затрат фирмы «Надежный поставщик» (разд. 8.4), где для xt ^ 5
    затраты на переналадку были равны s( = 13, а пропорциональные
    затраты составляли ct = 2 на единицу продукции! Хотя Ct (xt)
    и является вогнутой для 0 ^ xt ^ 5, эта задача все же не соответствует допущениям, сделанным в настоящем разделе, поскольку
    в нем не разрешается устанавливать верхнюю границу для значений xt.
    Вогнутая функция затрат часто возникает и в другом случае:
    когда модель используется в качестве модели пополнения запасов
    путем закупок у внешнего поставщика. В этом случае поставщик
    при крупных заказах нередко делает скидки в зависимости от размера заказа. Для иллюстрации приведем возможные ступенчатые цены,
    возникающие при подобных скидках:
    10 долл. за единицу при размере заказа до 12 единиц;
    8 долл. за каждую единицу сверх 12 при размере
    заказа от 13 до 144 единиц;
    5 долл. за каждую единицу сверх 144.
    (4)
    Эти ступенчатые цены описываются следующим математическим
    выражением:

    {

    IQxt

    при

    0
    120 + 8(^-12)
    при 13 120+ 1056+ 6(2:4 —144) при 145 <ж4.

    (5)

    Выражение (5) имеет тот же вид, что и выражение (10) в разд. 9.2.
    Функция Ct (xt) является вогнутой, поскольку коэффициенты при
    xt, а именно 10, 8 и 5, убывают с ростом х(. Если в (5) включить
    также затраты на подготовительные операции, функция по-прежнему
    останется вогнутой. Следовательно, при определении оптимальной
    программы движения запасов фирма может в данном случае учесть
    и условно-постоянные затраты — собственные накладные расходы,
    связанные с оформлением и обработкой заказа.
    Структурные результаты. Глубоким обобщением результатов
    анализа рассмотренной модели является следующая теорема.
    Теорема о виде оптимальной программы.
    Всегда существует программа, обеспечивающая минимальность
    затрат и обладающая той особенностью, что любой выпуск xt в ней
    принимает одно из следующих значений: 0, Dt, Dt + Dt+i, . . .
    . . ., Dt +Dt+i + . . . +DN.
    Из данной теоремы следует, что при отыскании оптимальной
    программы требуется для каждого t рассматривать только
    [1 + N — (t — 1) = N — t + 2] возможных значений xt. Сравним это с результатами, полученными для модели общего вида
    (разд. 8.3), где выпуск xt мог принимать любое значение от 0 до
    Dt + Dt+i + . . . + DN. Важное алгоритмическое следствие сфор-

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    65

    мулированной теоремы состоит в том, что для отыскания оптимальной программы необходимо рассмотреть всего лишь около 0,5 7V2
    различных вариантов.
    Еще одно следствие данной теоремы: всегда существует оптимальная программа, отличающаяся той особенностью, что для любого
    отрезка, остаток на начало которого строго положителен, выпуск
    равен нулю. (Читатель должен объяснить, почему это следует из
    данной теоремы.) При использовании принятых нами условных
    обозначений данное положение записывается следующим образом:
    существует оптимальная программа, в которой
    it-ixt = О, t = 1, 2, . . ., N.

    (6)

    Таким образом, если спрос Dt удовлетворяется за счет запаса
    i / _ i ( t f _ i > 0), то весь этот запас исчерпывается на последнем из
    отрезков, для которого выпуск был ненулевым. Несомненно, для
    модели с выпуклой функцией затрат такое утверждение неверно.
    Все отрезки, для которых xt > 0, можно называть «точками возобновления». Этот термин отражает то обстоятельство, что начальный
    уровень запасов для такого отрезка равен нулю и производственный
    цикл как бы начинается заново.
    Остается рассмотреть использование рекуррентных соотношений
    динамического программирования для эффективного поиска оптимальной программы среди множества допустимых программ, вид
    которых отвечает сформулированной выше теореме. Прежде чем
    приступить (в разд. 9.6) к рассмотрению такого алгоритма, изложим
    основные его идеи словами.
    Пусть январь — первый месяц планового периода. Начнем вычислительный процесс с расчета стоимости январского производства
    при таком объеме выпуска, который достаточен для удовлетворения
    январского спроса. Затем повторяем расчеты, каждый раз увеличивая
    длительность планового периода ца один месяц и используя полученные ранее результаты. Так, допустим, что найдены оптимальные
    программы для плановых периодов, включающих: январь и февраль;
    январь, февраль и март и т. д., до планового периода январь —
    июнь включительно, причем пусть каждая из этих программ имеет
    описанный в теореме вид. Теперь же в плановый период требуется
    включить июль.
    Из теоремы о виде оптимальной программы следует, что июльский
    спрос должен быть целиком удовлетворен продукцией, выпущенной
    только в одном из месяцев, будь то январь, февраль, . . ., июль;
    всего необходимо рассмотреть семь таких вариантов. Далее, если для
    удовлетворения июльского спроса используется, например, апрельский выпуск, то этот выпуск должен полностью обеспечить удовлетворение спроса с апреля по июль (объясните, почему это так?). Что
    же касается оптимальной программы января, февраля и марта,
    то для этого трехмесячного планового периода она уже найдена
    5-0734

    66

    ГЛАВА 9

    ранее. Следовательно, оптимальным вариантом семимесячной программы будет самый дешевый из семи описанных выше вариантов.
    Применительно к модели управления запасами с вогнутой функцией затрат теорему о виде оптимальной программы доказать нетрудно.
    Ранее условие (6) рассматривалось в качестве следствия этой теоремы;
    теперь используем иной подход — вначале докажем справедливость
    условия (6), а затем покажем, каким образом из этого следует оптимальность программы описанного вида.
    Пусть имеется некоторая допустимая программа, в которой
    хотя бы для одного отрезка it-\xt > 0, и пусть отрезок р — первый
    из таких отрезков. Рассмотрим тот более ранний отрезок, в течение
    которого выпускались изделия, образовавшие запас i t _ t , и вычислим
    приращение затрат, связанное с дополнительным производством 1
    единицы продукции и хранением ее до начала отрезка р. Затем
    сравним эту величину с увеличением затрат при дополнительном
    производстве 1 единицы на отрезке р.
    Если последняя величина меньше, изменим программу, увеличив
    Хр на г р _! и уменьшив выпуск на более раннем отрезке на это же
    число единиц. В связи с допущениями (1) и (2) о вогнутости функции
    затрат общее увеличение затрат на отрезке р не превышает общего
    снижения затрат, достигнутого благодаря сокращению более раннего
    выпуска и хранимых запасов. Аналогично этому, если увеличение
    затрат при дополнительном выпуске единицы на отрезке р является
    большей величиной, то общая сумма затрат по всему плановому
    периоду не возрастет при увеличении на хр выпуска на более раннем
    отрезке и полном прекращении выпуска на отрезке р. В любом из
    этих двух случаев построена допустимая программа, в которой
    условие (6) удовлетворяется при it = 1, 2, . . ., р. Если существуют
    более поздние отрезки, для которых это условие нарушается, повторим выполнение операции применительно к каждому из них. В конце концов будет получена программа, в которой условие (6) удовлетворяется для всех отрезков, а затраты не больше, чем у исходной
    программы.
    Отсюда следует приведенная выше теорема, поскольку обратное
    ей утверждение означает существование хотя бы одного отрезка,
    для которого 0 < i t _! < Df Для допустимости этой программы
    должно выполняться условие xt~^Dt — г ( _1 > 0, что противоречит (6).
    9.6. АЛГОРИТМ ОПТИМИЗАЦИИ МОДЕЛИ
    С ВОГНУТОЙ ФУНКЦИЕЙ ЗАТРАТ

    Введем следующее условное обозначение:
    chj — общие затраты связанные с производством на отрезке
    (k + 1) объема выпуска, необходимого для удовлетворения спроса
    на отрезках (k + 1), . . ., 7, где k = О, 1, . . ., (N — 1) и k + 1 sg:

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    67

    / ^ N. Следовательно,
    Ch+i(Dk+i)

    при /=7с + 1,

    (1)

    Ck+i (Dh+i -)-•••+ Dj) ~\- hh+i (Dk+z ~Ь • • • + Dj) + ... -j- AJ.-J (Dj)

    при j > h + 1.
    Так, если январь есть отрезок (k + 1), а март — отрезок /, то chi
    представляет собой сумму, состоящую из затрат на производство
    в январе объема выпуска, необходимого для удовлетворения январского, февральского и мартовского спроса; затрат на содержание
    запасов; исчисленных исходя из того их уровня на конец января,
    который достаточен для удовлетворения февральского и мартовского
    спроса; затрат на содержание запасов, исчисленных исходя из того
    их уровня на конец февраля, который достаточен для удовлетворения мартовского спроса.
    Задача фирмы «Растущий сбыт». Исходные данные для этой задачи
    приведены в таблице рис 9.5; длительность планового периода N

    с J - затраты на производство на
    отрезке (ft+1) продукции, удовлетворяющей спрос па отрезках (k+i),...,j

    i
    Р и с . 9.5.
    Модель с вогнутой функцией
    затрат фирмы
    «Растущий сбыт».

    Р и с » 9.6. Модель с вогнутой функцией
    затрат фирмы
    «Растущий сбыт».

    равна 4 отрезкам. В дополнение к данным, приведенным на рис. 9.5,
    Ct (Xt) положим, что для всех отрезков

    =

    и

    10 '

    (2)

    (Читателю рекомендуется попытаться отгадать оптимальную программу для N = 1, W = 2, N = 3 и N = 4.)
    Приведем несколько примеров исчисления c Aj - по формуле (1)
    на основе данных рис. 9.5:

    CDI = Ci (1) - 5,
    с 0 2 = С, (1 + 1) + h, (1) = 10 + 0,1 = 10,1,
    5*

    68

    ГЛАВА 9

    ^оз = Ci (1 + 1 + 1) + ^ (1 + 1) + ht (1) = 15 + 0,2 + 0,1 = 15,3,
    «04 = C t (1 + 1 + 1 + 1) + Ml

    cla

    + 1 + 1) + Ml

    + 1) + Ml)

    = 16 + 0,3 + 0,2 + 0,1 = 16,6,
    = C 2 (1) = 6,

    =

    (3)

    Ci3 = C, (1 + 1) + A 2 (1) = 9 + 0,1 = 9,1,
    Си = С, (1 + 1 + 1) + ha (1 + 1) + h3 (1) = 12+0,2+0,1 = 12,3.

    Читатель должен самостоятельно вычислить значения остальных
    Ckj, а именно с23, с 24 и с34, и сравнить полученные результаты со
    значениями, приведенными в таблице рис. 9.6.
    Введем следующее обозначение:
    /п — минимальная стоимость программы для отрезков от 1 до п при
    нулевом запасе на конец отрезка п.
    Тогда соответствующее рекуррентное соотношение динамического
    программирования имеет вид

    /„=

    min

    ft=0, 1, . . ., n-l

    [fh + Chn],

    п = \, 2, ..., N,

    (4)

    тде /о = 0. Обозначим kn такое значение k, которое позволяет достичь
    /„. Требуется найти значение / j V .
    Выражение в квадратных скобках в правой части (4) представляет
    «обой сумму двух элементов затрат. Первый элемент, т. е. Д, есть
    •сумма затрат для отрезков от 1 до /с, соответствующая оптимальной
    программе для этого периода. В этой программе запас на конец
    отрезка равен нулю. Второй элемент, chn, представляет собой затраты на отрезках от (k + 1) до п, соответствующие программе производства, которая позволила бы удовлетворить весь спрос на оставшихся отрезках — при нулевом остатке на начало отрезка (k + 1).
    Значение &„, при котором сумма (/ft + ckn) достигает минимума,
    определяет оптимальную программу для периода длительностью п
    отрезков; в плановом периоде от отрезка 1 до отрезка п это значение
    позволяет указать отрезок (&„+!), в котором должно произойти
    последнее возобновление программы. Поэтому настоящий алгоритм
    можно рассматривать как способ определения оптимальной последовательности точек возобновления [В точке возобновления начальный запас всегда равен нулю, поэтому в (4) можно исключить переменную состояния i.] Заметим, что алгоритм построен как «прямой»
    ((разд. 8.3), т. е. вычислительный процесс направлен от первого
    ютрезка к последнему.
    Продемонстрируем применение рассмотренного алгоритма на примере, исходные данные для которого приведены в таблице рис 9.5.
    /о-О,
    /! = min [/о + с01] = [0 + 5] = 5 и fej = О,
    / а = min [/о + с 02 , / 4 + с12] =

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    69

    = min [0 + 10,1; 5 + 6] = 10,1 и fta = О,
    /з = min [/о + с03, /! + с13, /2 + с 23 ] =
    = min [0 + 15,3; 5 + 9,1; 10,1 + 5] =14,1
    и Аз = 1,
    (5)
    /4 = min [/о + с 04 , /J + с14, / 2 + с 24 , /з + c3J =
    = min [0 + 16,6; 5 + 12,3; 10,1 + 7,1; 14,1 + 3] =
    = 16,6 и Л4 = 0.
    Эти расчеты показывают, что для планового периода длительностью N отрезков оптимальной программой будет следующая:
    Xi = 1
    при N = 1,
    Xi = 2, ж 2 = 0
    при jV = 2,
    Ж! = 1, ж 2 = 2, а;3 = 0
    при JV = 3,
    (6)
    7
    xj = 4, £ 2 = 0 £3 = О, #4 = 0 при Л " = 4.
    Покажем, как построить оптимальную программу, например,
    для N = 3. В выражении (5) ka = 1; это означает, что программа
    для отрезков 1, 2 и 3 явится оптимальной в том случае, если отрезок 1
    мы будем рассматривать как отдельный, изолированный плановый
    период, а на отрезке 2 — выпускать продукцию для удовлетворения
    спроса как на отрезке 2, так и на отрезке 3. Значение выпуска хг = ?
    равно общему спросу на отрезках 2 и 3. Решение для отрезка 1 Т
    рассматриваемого в качестве отдельного планового периода, определяется программой (5) для N = 1, согласно которой ж1 = DI = 1.
    Заметим, что при удлинении планового периода оптимальное
    значение xi (январского выпуска) колеблется. Согласно теореме
    о длительности планового периода, приведенной в разд. 9.5, это
    явление не свойственно моделям с выпуклой функцией затрат.
    Однако в моделях с вогнутой функцией затрат такие колебания
    возникают, причем даже в очень простых ситуациях, как это будет
    показано в разд. 9.7. Таким образом, динамические свойства модели
    обусловливают более сложный характер изменения результатов,
    хотя алгоритм для этой модели усложняется ненамного.
    Полезно построить сеть, соответствующую рекуррентному соотношению динамического программирования (4). Присвоим вершинам
    номера от 1 до 5; chj — стоимость перемещения единицы по дуге,
    направленной от вершины (5 — /) к вершине (6 — К). Сеть приведена
    на рис. 9.7; отметим, что по своей структуре она идентична сети,
    изображенной на рис. 6.10. Вычисления по формуле (5) можно рассматривать как нахождение кратчайшего пути в вершину 5 из всех
    других вершин; здесь /п — длина кратчайшего пути из вершины
    (5 — п) в вершину 5. Читателю следует выполнить на сети операции,
    аналогичные расчетам в соответствии с выражением (5).
    Представляется полезным также сравнить (4) с «прямым» рекуррентным соотношением динамического программирования (V), при-

    70

    ГЛАВА 9

    веденным в разд. 8.3. Отметим, что существует следующее соотношение:
    /л' = gn (0).

    Таким образом, если известен вид оптимальной программы,
    можно полностью исключить вычислительные операции по определению gn (i) для всех i > 0.
    Без особых трудностей можно найти также оптимальную программу для случая разрешенной задержки удовлетворения спроса,
    iff, 6

    Р и с . 9.7. Модель

    с вогнутой функцией затрат фирмы
    «Растущий сбыт».

    т. е. случая, при котором it может быть отрицательным. Допустим,
    что функция ht (i) является вогнутой как для i = О, 1, 2, . . . , так
    и для i = О, —1, —2; вместе с тем функция ht (i) не обязательно
    должна быть вогнутой для i = . . ., —2, —1, О, 1, 2, . . . . При этом
    продолжает оставаться справедливым равенство xt либо нулю, либо
    общему спросу за ряд последовательных отрезков, включающий
    отрезок t', однако в данной модели этот ряд отрезков может включать отрезки, не только следующие после отрезка t, но и предшествующие ему. Основная идея состоит в том, что по-прежнему отыскивается оптимальная последовательность точек возобновления,
    для которых начальный запас равен нулю. Между каждыми двумя
    такими точками выпуск осуществляется только на одном из отрезков.
    Определение chj становится более общим. Теперь излагаем его следующим образом: chi — минимальные общие затраты, связанные
    с производством только на одном из отрезков k -\- 1, . . ., / такого
    объема выпуска, который необходим для удовлетворения спроса
    на всех этих отрезках.
    Таким образом, вначале на основе предварительных оптимизационных расчетов определяются СА/-:
    ( Ck+i (Dk+l)
    при j = k + 1,
    I
    min
    [C
    (D
    с
    t
    h+i + ... + Dj) + hk+i i
    **J

    i

    Ь J_ \
    Полученные значения chi
    шении (4).

    при i > k + 1.
    используются в рекуррентном соотно-

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    71

    9.7. АНАЛИЗ ДЛИТЕЛЬНОСТИ ПЛАНОВОГО ПЕРИОДА
    В МОДЕЛЯХ С ВОГНУТОЙ ФУНКЦИЕЙ ЗАТРАТ

    Как мог заметить читатель, существенное различие между моделями с выпуклой и вогнутой функцией затрат заключается в том,
    что при увеличении длительности планового периода оптимальное
    значение xt может уменьшаться только при вогнутой функции затрат.
    Такое уменьшение оказывается возможным даже в простейших
    случаях.
    Так, пусть производственные затраты равны сумме затрат на
    переналадку (единовременные затраты) и пропорциональных затрат:
    (1)

    Ct (Ъ) = st + ctxt,
    где st ^ 0 и ct ^ 0. Примем
    sj = 1, s2 = 2, ss = 4, s4 = 8, s5 = 7;
    ct = 0 и ht (it) = htit = it (ht = 1)
    и положим
    Di = 1, D, = 1, D3 = 2, D, = 3, Db = 4.

    (2)

    (3)

    Используем описанный в разд. 9.6 алгоритм и убедимся в том, что

    А =1, /2 = 2, /з = 5, / 4 = 9, /6 = 16;
    ^ = 0, &2 = 0, *3 = 1, А 4 = 2, fce = 4,

    (4)

    откуда
    Ж! = 1

    xt
    Ж!
    хг
    «! =

    = 2,
    = 1,
    = 2,
    2, ж 2

    ДЛЯ N = 1,

    я2 = 0
    z2 = 3, х3 = 0
    а;2 = 0, а:3 = 5, z4 = 0
    = 0, х3 = 5, z4 = 0, хь ~

    для Л7'
    для N
    для N
    4 для

    = 2,
    — 3,
    = 4,
    Ж = 5.

    (5)

    Для того чтобы показать, каким образом из (4) может быть получено (5), рассмотрим, например, случай N = 4. Напомним, что
    (kn + 1) есть самый поздний отрезок с ненулевым объемом выпуска
    в том случае, если плановый период длится от отрезка 1 до отрезкам.
    Поскольку в (4) fc4 = 2, отрезки 1 и 2 образуют отдельный плановый
    период, а выпуск на отрезке 3 покрывает спрос на отрезках 3 и 4.
    J
    Таким образом, x3=D3 rD4:=--2-\-3 = 5. Для определения выпуска на первых двух отрезках рассмотрим случай N = 2. Поскольку ft2 = 0, выпуск относится к отрезку 1 и равен спросу на этих
    двух отрезках, т. е. х^ = Dt + Z)2 = 1 + 1 = 2.
    Отметим, что при удлинении планового периода значения как
    #i, так и х2 колеблются; однако справедлива следующая теорема
    о длительности планового периода.

    72

    ГЛАВА П

    Теорема о длительности планового периода для модели, учитывающей единовременные
    з а т р а т ы . Пусть затраты описываются функцией (1)
    И ct ;> ct+i для t = 1, 2, . . ., N — 1. (а) Если kn = п — 1 при
    л ^ 2 , то программа, полученная при рассмотрении совокупности
    отрезков 1, 2, . . ., п — 1 в качестве отдельного планового периода,
    всегда является оптимальной, (б) Если t^n, то kt^kn.
    Чтобы проиллюстрировать часть (а) теоремы, допустим, что при
    использовании алгоритма применительно к четырем месяцам (с января по апрель) было найдено /с4 = 3. Это значит, что при N 5& 4
    апрельский спрос должен удовлетворяться апрельским выпуском.
    Тогда в части (а) теоремы утверждается, что правильная процедура
    построения оптимальной программы состоит в выделении первых
    трех месяцев (января, февраля и марта) в качестве отдельного планового периода, вне зависимости от спроса в мае и в последующих
    месяцах. Разумеется, при удлинении планового периода будет получена дополнительная информация об оптимальном значении апрельского выпуска. Однако в любом случае £4 > 0, т. е. известно, что
    в оптимальной программе для N ^ 4 апрельский выпуск положителен. Заметим, что в примере (4) часть (а) выполняется и для N = 5.
    Следовательно, в (5) значения xt (t = 1, t = 2, t = 3, t = 4), оптимальные при N = 4, остаются оптимальными и при N ^ 5, вне зависимости от значений Dt для t ~^> 5.
    Чтобы проиллюстрировать чисть (б) теоремы, допустим, что при
    использовании алгоритма применительно к тем же четырем месяцам
    (с января по апрель) было найдено /с4 = 2. Это означает, что при
    N = 4 апрельский спрос должен удовлетворяться мартовским выпуском, а программа для января и февраля определяется исходя из
    N = 2. В части (б) утверждается, что спрос любого месяца, более
    позднего, чем апрель, удовлетворяется продукцией, выпускаемой
    после февраля — в марте или в другом более позднем месяце. Заметим, что численные данные примера (2) отвечает условиям теоремы
    и поэтому результаты (4) согласуются с частью (б) теоремы.
    Сформулированная теорема позволяет сократить объем вычислительных операций, связанный с использованием алгоритма. Если
    условия теоремы соблюдаются, рекуррентное соотношение можно
    записать в следующем виде:
    /„=

    min
    «=&Д-1

    .....

    [/ft + Cftn],

    и = 1, 2, . . ., N,

    (6)

    П— 1

    что сокращает поиски минимума. Так, в примере (2) можно определить /5, подставляя в формулу (6) только /с = 2, & = 3 и А; = 4 t
    поскольку в (4) /с4 = 2. При подобном подходе применение соотношения (6) потребует исчисления не всех chj для /с = О, 1, . . ., N — 1
    и k -{- I ^. j ^. N, и целесообразно исчислять chj только по мере
    возникновения надобности в них. При этом удобно воспользоваться

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    73

    следующим рекуррентным соотношением:
    Chn = Ch,n-i + Cft+iAi + hh+i (Dn) + . . . + hn_i (Dn), n > k + 1;
    (7)
    здесь предполагается линейность затрат на содержание запасов,
    т. е. ht (it) = htit.
    В отличие от теоремы о длительности планового периода для
    модели с выпуклой функцией затрат часть (а) рассматриваемой
    теоремы позволяет получить более сильный результат (для планового
    периода устанавливается определенная программа выпуска), однако
    положение (б) является более слабым, поскольку, как было видно
    из (5), при увеличении N xt может колебаться. Анализ модели может
    дать дополнительные результаты, если принять, что производственные затраты (1) и затраты на содержание запасов исчисляются для
    всех отрезков по одним и тем же формулам, при одинаковых значениях параметров, что Dt для всех отрезков одинаковы и что плановый период является бесконечным^. Этот случай рассматривается
    в разд. 12.5.
    Заметим, что в теореме предполагается как соответствие функции
    производственных затрат виду (1), так и выполнение условия ct ^
    ^ Ct+i- Результаты (5) задачи фирмы «Растущий сбыт» (разд. 9.6)
    свидетельствуют о том, что для модели с вогнутой функцией затрат
    часть (б) теоремы в общем случае неверна. Приведем еще два примера, показывающих, что теорема неверна, если отбросить условие
    ct ^ ct+i или если все функции Ct (xt) одинаковы, но не имеют
    вида (1).
    Рассмотрим пример, в котором не выполняются неравенства
    c
    ct > t+iSi = 1,
    Cl

    = 3,

    s2 = 12,

    s3 = 1,

    c a = l,

    c 3 = 2,

    s4 = 2,
    c 4 = l,

    (I)

    примем ht (it) = 0. (He сумеет ли читатель отгадать оптимальные
    программы для N = 1? N = 2? N = 3? N = 4?)
    Применим алгоритм и убедимся в том, что

    / t = 4, / а = 16, /з = 21,
    ki = О, fca = 0,
    Аз = 2,

    / 4 = 24,
    Л4 = 1,

    (II)

    что нарушает (б). Какова оптимальная программа для N = 1? N = 2?
    Л" = 3? Л^ = 4? (Насколько точными оказались предположения читателя?) Наблюдается ли при удлинении планового периода вначале
    увеличение, а затем сокращение выпуска на каких-либо отрезках?
    Теперь рассмотрим пример, в котором Ct (xt) и ht (it) одинаковы
    для всех отрезков:
    Ct (1) = 5, Ct (2) = 10, Ct (3) = 11, ht ( i t ) = it
    (III)

    74

    ГЛАВА 9

    и Df = 1 (t = 1, 2, 3). Заметим, что Ct (xt) не соответствует выражению (1). Можно убедиться в том, что
    h = 5,

    U = Ю,

    /з = 14, ,

    fcj = 0,

    /е2 = 1,

    k3 = О

    и что это также не согласуется с (б).
    9.8. МОДЕЛЬ УПРАВЛЕНИЯ ЗАПАСАМИ
    ПРИ СГЛАЖИВАНИИ ПРОИЗВОДСТВА

    В изучавшихся ранее моделях управления запасами осуществлялась экономическая оптимизация, основанная на достижении равновесия между ростом производственных затрат, с одной стороны,
    и ростом затрат на содержание запасов — с другой. В результате
    такой оптимизации возникают существенные колебания выпуска
    в течение установленного планового периода. Даже сам вид оптимальной программы для модели с вогнутой функцией затрат
    (разд. 9.5) отвечает такому положению, когда изделия заказываются
    небольшими партиями. Это бывает наиболее удобно, когда фирма
    выпускает большое число различных видов изделий. Аналогично
    этому при пополнении запаса путем закупок у внешних поставщиков
    обычно целесообразно заказывать партии, достаточно большие для
    удовлетворения спроса в течение нескольких месяцев. Однако в тех
    случаях, когда анализируемая ситуация относится к разработке
    программы выпуска одного из основных видов продукции, изготовляемой фирмой, следует учитывать важный экономический фактор, который до сих пор не принимался во внимание. Этот фактор —
    стоимость изменения объема производства.
    В принципе такой фактор несложно учесть в общей модели (гл. 8).
    Воспользуемся теми же, что и раньше, символами xt и it для обозначения объема производства на отрезке / и остатка на конец отрезка
    соответственно; тогда в модели изменится лишь целевая функция,
    которая будет иметь следующий вид:
    N
    x

    Минимизировать У] Ct ( t, it, xt-i)t=i

    (1)

    Например, она может иметь вид
    Ct (xt, it, X(_ t ) = Ct (xt, it) + vt (xt, xt-d,

    (2)

    где последняя функция в правой части представляет собой стоимость
    изменения объема производства при переходе от отрезка (t — 1)
    к отрезку t.
    Приведем простой пример функции издержек сглаживания
    vt (xt, Xt-д = vt (xt — xt-\Y,

    где vt > 0.

    (3)

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    75

    Еще один простой пример:
    ( at (xt — xt-i)
    Vt (xt, Xj-i) = {
    [ bt(xt-i — Xt)

    при

    xt — X(_j>0,

    a<>-0,

    при

    xt — x/_i-^0,

    o^^-O.

    (4)

    Если сглаживание производства играет существенную роль при
    составлении программы, то спрос, объем выпуска и уровень запасов
    часто выражают при анализе в таких «трудрвых» единицах измерения, как человеко-неделя. В тех случаях, когда функция (4) считается адекватной, at соответствует затратам на увеличение численности работающих, a bt — на ее сокращение. (Можно принять, что
    at + bt> 0.)
    Как следует изменить рекуррентное соотношение динамического
    программирования для учета этого нового фактора? Вспомним, что
    в гл. 8 рекуррентное соотношение было записано в следующем виде:
    i(i + x — dn)],

    n = i,2,...,N, (5)

    где i = О, 1, . . ., di + • • • + dn, а минимум отыскивался по всем
    неотрицательным целым значениям х, находящимся в пределах
    dn — i ^х ^ di + . . . + dn — i; запас на конец планового периода
    предполагался равным нулю. Однако данные об исходном запасе
    теперь не являются достаточными для того, чтобы полностью характеризовать состояние системы на начало периода: необходимо также
    знать объем выпуска на предыдущем отрезке. Следовательно, состояние системы определяется двумя этими параметрами. ' Остальные
    изменения, которые необходимо внести, очевидны.
    Введем следующие условные обозначения:
    in (i) У) — минимальные затраты для п оставшихся отрезков при
    начальном уровне запасов i и выпуске на предыдущем
    отрезке у;
    х
    п ( i , У) — выпуск, позволяющий достичь /n (i, у).
    Заменим (5) новым рекуррентным соотношением:
    /„ (i, у) = min [сп (х, i + х — dn, у) + /,,_,, (i + х — dn, х)],

    п = 1, 2, . . ., N.
    (6)
    Требуется найти значение fN (i0, z/ 0 ), где у0 — выпуск на отрезке,
    предшествующем отрезку 1. Вначале вычисляются значения

    /i (^ У) = ci № — i, 0, у) для i = О, 1, . . ., d{
    и у = 0, 1, . . ., dj + d a .

    (7)

    Замечает ли читатель существенные различия между соотношениями (5) и (6)? Имеется одно такое различие. Для вычисления
    минимума в соответствии с (5) требовалось знать значения /„ (i)
    для всех возможных значений (i); для вычисления минимума в соответствии с (6) необходимо вычислить /„ (i, у) для возможных пар
    значений i и у. Хотя динамическое программирование и в этом случае

    76

    ГЛАВА 9

    обладает огромными преимуществами перед полным перебором,
    добавление еще одной переменной состояния приводит к существенному росту вычислительных операций, как это видно из приводимогониже примера. Таким образом, с теоретической точки зрения рекуррентные методы можно обобщить, учитывая с их помощью еще большее число факторов, например выпуск продукции за два предыдущих
    отрезка или же изменение уровня запасов. Однако это приводит
    к такому росту вычислений, который в реальных ситуациях быстролишает подобный подход практического значения. Если же на практике необходимо учитывать большое число зависимостей, приходится
    либо применять другие методы решения (например, линейное или
    нелинейное программирование), либо существенным образом использовать выявленные свойства (вид) оптимальной программы.
    Задача фирмы «Гарантия». Предположим, что спрос, верхние
    границы объема выпуска и уровня запасов, а также затраты фирмы
    «Гарантия» характеризуются следующими данными:
    Dt = 3 (спрос постоянен),
    (8)
    xt = О, 1, . . ., 5 и it = О, 1, . . ., 4; iN = 0,
    (9)
    Ct (xt, i t , x t _ i ) = С (xt) + hit + v (xt — ^г-i)2
    (функция затрат для различных отрезков одинакова),
    (10)
    где для всех отрезков
    (7(0)= О, С(1) = 15, С (2) = 17, С(3) = 19, С1 (4) = 21,
    С (5) = 28,
    (11)
    h = 1 и и = 1.
    (12)
    [Эти показатели полностью совпадают с данными задачи, рассмотренной в разд. 8.4, за исключением третьего члена правой части (10) —
    сглаживающей функции.] Рекуррентное соотношение (6) можно запи-'
    сать в следующем виде:

    » = 1, 2, ...,

    N,

    (13)

    где i = О, 1, . . ., 4, у = О, 1, . . ., 5, а минимум отыскивается
    путем перебора всех неотрицательных целых значений х, заключенных в пределах 3 — i ^ х ^ min (5, 7 — i).
    Вычисления по формуле (7) для п = 1 систематизированы в таблице рис. 9.8. В этой таблице шесть пар столбцов, по одной паре для
    каждого из возможных значений у, а именно для О, 1, . . . . 5.
    «Запрещенные» клетки таблицы соответствуют тем сочетаниям i is. у,
    которые оказываются недопустимыми с учетом ограничений (9) на
    объем выпуска и уровень запасов. Так, при у = 0 исходный запас
    на начало планового периода не может превышать 1, потому что
    запас на начало предыдущего отрезка не мог быть больше 4, а для

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    77

    удовлетворения спроса на этом отрезке запас приходится уменьшить
    на 3. Аналогично этому при у — 5 исходный запас на начало планового периода должен быть не меньше 2 — также с учетом удовлетвоНачалъньш
    запас

    Выпуск на предыдущем отрезке

    у-о
    x,(L,3)
    О

    28

    23

    20

    1

    21

    18

    17

    13

    15

    16

    19

    2
    3

    Р и с . 9.8.

    21
    31
    25

    О

    Модель

    сглаживания выпуска
    (п = 1).

    фирмы

    «Гарантия»

    рения спроса на предыдущем отрезке, равном 3. Поскольку запас
    на конец планового периода, согласно принятым допущениям, равен
    нулю, оптимальный выпуск ж 4 (i, у) зависит только от значения i,
    но не от у. Как будет показано ниже, при п > 1 хп (i, у) зависит
    и от значения у.
    Вычисления для п = 2 и у = 2 систематизированы в таблице
    рис. 9.9. Читателю рекомендуется проанализировать приведенные
    \С(х)+Ш+х- JJ] н- (x-yf+f, (i +х -3, х)
    Выпуск на предыдущем отрезке

    Р и с . 9.9. Модель сглаживания выпуска фирмы «Гарантия» (п = 2,
    У = 2).

    в таблице результаты и понять, каким образом они получены
    с помощью рекуррентного соотношения динамического программирования (13). В частности, заметим, что третье слагаемое в каждой

    ГЛАВА 9

    78

    из клеток основных столбцов таблицы взято из рис. 9.8. Так, если
    i = 0 и х = 3, то 19 есть значение /г- (г + х — 3, х) = fi (О, 3),
    записанное в строке г = 0 и правом из пары столбцов для у = 3'
    таблицы рис. 9.8. Заметим также, что строка i = 4 на рис. 9.9 полностью запрещена, поскольку запас на начало предыдущего отрезка
    Выпуск на преЗыдуш,ем отрезке

    (Рис.
    S.10)

    Начальный
    запас
    x2(i,2)fz(i,2)

    39
    38

    38

    39

    38

    33

    35

    36

    33

    32

    31

    32

    35

    25

    28

    33

    37

    2,3

    Р и с . 9.10. Модель сглаживания выпуска фирмы «Гарантия» (п = 2).

    не мог превышать 4 единицы. При выпуске у — 2 и спросе 3 исходный
    запас на начало планового периода не может быть больше 3 единиц.
    Теперь очевидно, что для этой модели объем вычислений приблизительно в 6 раз больше, чем для общей модели гл. 8, так как вычисления, аналогичные проделанным в таблице рис. 9.9, выполняются
    для каждого из возможных значений у, где у = О, 1, . . ., 5.
    Полный набор значений / 2 (i, у) и соответствующих им значений
    х2 (i, у) приведен в таблице рис. 9.10. Читателю следует проверить,
    понял ли он рекуррентное соотношение (13), самостоятельно вычислив значения /2 (г, 5). Для удобства сравнения в правом столбце
    таблицы рис. 9.10 проставлены оптимальные объемы выпуска
    в задаче разд. 8.4, где не учитывают издержки сглаживания.
    Рассмотрим различие между решениями обеих задач. Заметим, что
    при п = 2 и начальном запасе 1 выпуск 5 единиц не является более
    оптимальным; теперь оптимален выпуск 3 единиц, если выпуск на
    предыдущем отрезке был не менее 3, и 2 единиц — в противном случае. Напротив, при начальном запасе 4 оптимальным является
    выпуск не 0, а 2 единиц.
    Влияние, оказываемое введением в модель издержек сглаживания, проиллюстрировано в таблице рис. 9.11. Заметим, что, если
    исходный запас на начало планового периода i 0 равен 1 или 2,
    в «сглаженной» программе продукция выпускается как в январе,
    так и в феврале, тогда как в задаче фирмы «Надежный поставщик»
    положительным был только январский выпуск. Если г 0 равно 3 или4,
    фирма «Гарантия» должна выпускать продукцию в январе, тогда

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    79

    как фирма «Надежный поставщик» выпускала это же число изделий
    в феврале. Предпочтительность января объясняется тем, что уменьшение выпуска до нуля с последующим его повторным возрастанием
    приводит в настоящей модели
    к увеличению затрат.
    „ Надежный
    Фирма.
    В разд. 6.7 рассматривалась
    поставщик"
    „Гарантия"
    задача разработки производстИсходный
    Без
    сглаживазапас на При сглаживявенной программы со сглаживании выпуска ния выпуска
    начало
    нием занятости, близкая к наплатаоеа
    Яне.
    Яне. Февр.
    <Ргвр.
    периода, i
    стоящей модели. Управляющая
    переменная xtj в задаче сглаО
    3
    3
    3
    3
    живания занятости отображала
    число бригад, приступавших к
    1
    3
    2
    5
    0
    работе в начале отрезка i и заканчивавших ее в начале отрез2
    4
    2
    2
    0
    ка /'. Должно было выполняться следующее ограничение: чи3
    3
    3
    0
    0
    сло бригад, используемых на
    *i
    2
    0
    0
    2
    любом
    отрезке k
    (k = 1,
    2, . . ., п — 1), должно быть
    не меньше R^. Затраты, соот- Р и с . 9.11. Оптимальная производстветствующие Xij, включали за- венная программа при длительности N
    работную плату, набор, пере- планового периода, равной 2 отрезкам, и
    возку и обучение рабочих. За- выпуске на предыдущем отрезке х0 =4.
    траты, не входящие в состав заработной платы, иногда делали экономичным содержание контингента
    работающих, превышающих минимальную потребность. Таким образом, в задаче ставилась цель разработки такого допустимого графика
    занятости работающих, при котором минимизируются общие затраты
    на содержание рабочей силы.
    Можно установить следующую связь между такой задачей
    и моделью сглаживания, приведенной в настоящем разделе. Введем
    обозначения
    i

    g

    п-1

    z<= S xt) и Dt = Rt,
    (I)
    v
    i=t+i
    '
    где xt — общее число бригад, нанятых к началу отрезка t (вне зависимости от срока окончания ими работы). При этом выполняемую
    бригадой работу нельзя переносить из одного отрезка на следующий;
    если на некотором отрезке k число бригад превышает потребность
    в них, равную^] Rk, излишек рабочего времени нельзя сохранить
    для использования на отрезке (k + 1). В связи с этим можно сократить размерность переменной состояния в рекуррентном соотношении (6), исключив i. В результате возникает следующее рекуррентное
    соотношение динамического программирования:
    при п>1,
    (II)
    ?n-i(x) + cn(x,0,y)]

    80

    ГЛАВА 9

    gi (у) = min ct (x, О, у)
    x^di

    при n = i.

    (Ill)

    С помощью этих соотношений отыскивается значение gN (у0).
    Отметим различия между соотношением (II) и задачей из разд. 6.7.
    Последняя обладала известной гибкостью — в том смысле, что
    издержки сглаживания зависели не только от момента i начала
    периода работы бригады, но и от длительности работы, т. е. от разности (/ — i). Вместе с тем затраты с^ определялись для каждой бригады в отдельности, так что общая сумма затрат для некоторого периода
    являлась линейной функцией числа нанятых бригад.
    Что же касается модели настоящего раздела, функция затрат которой имеет вид Ct ( x t , О, a^_i), то она обладает гибкостью в другом
    отношении. В издержках сглаживания учитывается только изменение
    уровня занятости для двух смежных отрезков, но не длительность
    работы каждой из нанимаемых или увольняемых бригад. Однако
    в данной модели появляется возможность учета нелинейной зависимости затрат от количества используемых бригад. Кроме того, изменение общей суммы издержек сглаживания может нелинейно зависеть от уровней занятости на двух смежных отрезках планового
    периода.
    Если все затраты линейны, то
    с

    и = ct + ci+i + • • • + cj-i + at + bj,

    (IV)

    где затраты исчисляются для каждой бригады в отдельности, причем
    ct — сумма заработной платы на отрезке t, at — затраты по найму
    и bt — затраты, связанные с увольнением. В этом случае оптимальный график работы может быть найден с помощью любой из этих
    двух моделей; однако дополнительный анализ соотношения (II)
    позволяет предложить очень простой алгоритм, базирующийся на
    подходе, который был использован в модели управления запасами
    с выпуклой функцией затрат (разд. 9.3).
    КОНТРОЛЬНЫЕ

    УПРАЖНЕНИЯ

    1. Проверьте сделанные в разд. 9.1 утверждения о том, что:
    а) соотношения (3) и (4) эквивалентны, истолковав при этом
    содержание соотношения (4);
    б) наложение ограничений it ^ 0, где it определяется из (4),
    обеспечивает своевременное удовлетворение спроса,
    2. а) Дайте истолкование определений (3) и (4) разд. 9.2.
    б) Начертите графики функций для примеров (I) — (IV) разд. 9.2,
    приняв для четырех первых примеров в = 2, Ъ = i и с = 3, а для
    двух последних примеров — значения, приведенные в тексте.
    в) Начертите график функции для примера (VI), приняв следующие значения параметров: a t — 4, bi = 1, wi — 4, a 2 = 3,
    u>2 = 6, a 3 = 2.

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    81

    3. По данным, приведенным в таблице 9.2, составьте функции
    затрат вида (3) и (4) из разд. 9.3.
    Упражнения 4—7 относятся к задаче фирмы «Вечная шина»,
    значения параметров для которой приведены в таблице рис. 9.2.
    Примените алгоритм для решения задачи с измененными значениями
    параметров и вычислите приращение общей суммы затрат. Для
    каждого отрезка t укажите выпуск xt и остаток на конец отрезка it.
    4. а) Примите январский спрос равным 2 единицам (вместо 1).
    б) Примите майский спрос равным 1 единице (вместо 0).
    в) Предположите, что спрос на всех отрезках остается без изменения, кроме отрезка t. До какого предела можно увеличивать Dt,
    так чтобы по-прежнему существовала возможность построения допустимой программы? (Ответьте на этот вопрос для t = 1, 2, . . ., 6.)
    5. а) Примите максимально возможный выпуск января при
    нормальных затратах равным 4 единицам (вместо 3).
    б) Примите максимально возможный выпуск января при нормальных затратах равным 5 единицам (вместо 3).
    в) Считайте невозможным производство при повышенных затратах в марте и апреле.
    6. Для каждого варианта постановки задачи объясните влияние
    изменения затрат на решение, приведенное в таблице рис. 9.3.
    а) Производственные затраты на единицу продукции для всех
    отрезков одинаковы (например, 2 на единицу в основное и 5 на единицу в сверхурочное время).
    б) Затраты на единицу для основного и сверхурочного времени
    равны между собой (например, для отрезка 1 возможен выпуск 9 единиц при затратах 2 на единицу, для отрезка 2—4 единиц при затратах 4 на единицу и т. д.).
    в) Затраты на содержание запасов для всех отрезков равны
    h = 6 на единицу (вместо 1).
    г) Затраты на содержание запасов для всех отрезков равны
    h = 0,1 на единицу (вместо 1).
    7. Пусть совокупный спрос Rp — см. (1) разд. 9.4 — удовлетворяет неравенствам:
    1 1<Й2<7,
    6<Д3<14,
    10 < Д 4 < 20, 10 < Д5 < 25, 12 < R, < 27.
    Найдите значения Хр (S) и Хр (Т), определяемые теоремой
    о длительности планового периода для модели с выпуклой функцией
    затрат. Начертите график, аналогичный приведенному в разд. 9.4.
    Можете ли вы указать оптимальный выпуск для отрезка 1?
    8. Рассмотрите частный случай модели с выпуклой функцией
    затрат, приведенной в конце разд. 9.4. Найдите оптимальную программу при следующих вариантах спроса:
    a) Z?i = 1, Z?2 = 2, Z>3 = 7, Ds = О, D6 = 2. Примите значение
    Z)4 последовательно равным 5; 4; 3; 2 единицам.

    82

    ГЛАВА 9

    б) DI = 1, Dz = 2, Z)4 = 6, Z>5 = 0, De = 2. Примите значение D»
    последовательно равным 11; 12 единицам.
    в) DI = 1, D2 = 2, Z)3 = 7, Z)4 = 6, De — 2. Примите значение
    D5 последовательно равным 1; 2; 4 единицам.
    г) Z)3 = 7, Z>4 = 6, Z>5 == 0, De = 2. Примите Dt = 2 и £>2 = 1,
    a Z)j = 3 и D a = 0.
    9. Предположим, что поставщик предлагает следующую ступенчатую систему цен: 10 долл. за каждую единицу при заказе объемом
    до 12 единиц; 8 долл. за единицу при заказе объемом от 12
    до 144 единиц; 5 долл. за каждую единицу при заказе объемом сверх
    144 единиц. Начертите график зависимости общей суммы закупочных
    затрат от размера заказа. Является ли эта функция вогнутой? Если
    да, то почему? Останется ли функция затрат вогнутой, если включить
    в нее затраты на подготовительные операции? Если да, то почему?
    10. а) Объясните, почему вид оптимальной программы, построенной для модели управления производством и запасами с вогнутой
    функцией затрат (разд. 9.5), обусловливает обязательное существование такой программы, в которой выпуск отрезка является нулевым, если запас на начало отрезка положителен.
    б) Если такое свойство оптимальной программы считается заданным, вычислите, какое число разных допустимых вариантов программы необходимо рассмотреть. Для определенности положим, что все
    Dt > 0 (напомним также, что запас на начало планового периода
    io = 0).
    в) Вычислите, сколько различных значений c-aj-. определяемых
    выражением (1) разд. 9.6, необходимо рассчитать для применения
    алгоритма решения общей модели с вогнутой функцией затрат.
    11. Справедливость теоремы о виде оптимальной программы для
    модели управления производством и запасами с вогнутой функцией
    затрат доказывается в конце разд. 9.5. Доказательство основано
    на целесообразности либо увеличения хр на величину t p _j, либо
    увеличения на величину хр выпуска на более раннем периоде. Пусть
    задана программа, в которой для одного или более отрезков выполняется условие if-iXt > 0- Будет ли оптимальной измененная программа, полученная из заданной путем таких преобразований?
    Обоснуйте ваш ответ.
    12. Задача фирмы «Растущий сбыт» (разд. 9.6). Рассмотрите
    пример, условия которого приведены в таблице рис. 9.5. Найдите
    оптимальную программу, если функция затрат на содержание запасов имеет вид ht (it) = htit: где для всех отрезков
    a) ht = 1; б) ht = 2.
    13. В модели с вогнутой функцией затрат (разд. 9.5, 9.6) для
    всех отрезков планового периода Dt = 1

    г
    1 \ _ / 5xt
    Lt (Xt)
    ~ \ 12 + xt

    при

    при

    Xt =

    °» *' 2' 3'
    xt>*

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    83

    ht (j f ) = htit. (Заметим, что это упражнение напоминает задачу
    фирмы «Растущий сбыт» в разд. 9.6, где в таблице рис. 9.5 функция
    производственных затрат для t = 1 полностью совпадает с приведенной в настоящем упражнении.) Найдите оптимальную программу,
    если для всех отрезков ht = 0,1 при длительности планового периода;
    а) N = 4; б) N = 5; в) N = 6; г) N = 7;
    д) N = 8, е) N - 9;
    ж) найдите оптимальную программу для ht = 1 и N = 9;
    з) то же для ht = 2 и N = 9.
    14. Выполните упражнение 13, взяв следующую функцию затрат!
    ГО
    при xt = О,
    ^t ( t) ~ 1 о i о
    [3 + 2xt при xt -^
    ^ л1.

    и

    x

    15. Выполните упражнение 13, приняв для всех отрезков Dt = 2.
    16. Выполните упражнение 13, приняв спрос изменяющимся
    по отрезкам следующим образом:
    а) DI = 1, D2 = 2, D3 = 1, £> 4 = 2, . . .,
    б) Z)t = 2, Z>2 = I, D3 = 2, £4 = 1, . . ..
    17. Выполните упражнение 13, приняв затраты на содержание
    запасов меняющимися от отрезка к отрезку следующим образом*
    а) hi = 1, Л, = 2, hs = 1, Л4 = 2, . . .,
    б) fej = 2, U 2 = 1, h, = 2, Л 4 = 1, . . ..
    18. В конце разд. 9.6 утверждается, что использование рекуррентного соотношения динамического программирования (4) можно
    рассматривать как нахождение кратчайшего пути на ациклической
    сети. Рассмотрите вычисления, проделанные в (5), и повторите эти
    операции на сети рис. 9.7; покажите связь с нахождением кратчайшего пути на ациклической сети.
    19. Пусть разрешена задержка в удовлетворении спроса, однако
    весь спрос должен быть удовлетворен к концу планового периода,
    т. е. для t •< N допустимы отрицательные значения i f . Выполните
    упражнение 13, пп. а) — е), если функция затрат на содержание
    запасов и штрафа за задержку удовлетворения спроса имеет вид
    ht ( i t ) = ht | it | , где
    a) ht = 0,1; 6) ht = 1;
    в) ht = 2.
    20. Рассмотрите примеры (1) — (3) разд. 9.7. Проверьте результаты, приведенные в (4) и (5).
    21. Сравните сведения о программе, которые дают соответственно
    теорема о длительности планового периода для модели с выпуклой
    функцией затрат (разд. 9.4) и теорема о длительности планового
    периода для модели, учитывающей единовременные затраты
    (разд. 9.7).
    22. Рассмотрите теорему о длительности планового периода для
    модели, учитывающей единовременные затраты (разд. 9.7); пусть
    первый месяц планового периода — январь.
    а) Если ke = 5, какие выводы можно сделать об оптимальной
    программе на основе части (а) теоремы?

    84

    ГЛАВА 9

    б) Если kg = 3, какие выводы можно сделать об оптимальной
    программе на основе части (б) теоремы?
    23. а) Проверьте справедливость рекуррентного соотношения (7)
    из разд. 9.7 для случая линейной функции затрат на содержание
    запасов.
    б) Внесите в (7) необходимые изменения для того случая, когда
    затраты на содержание запасов характеризуются вогнутой функцией
    общего вида.
    24. Проверьте правильность результатов, приведенных в конце
    разд. 9.7, и объясните, почему в данном случае не выполняется
    часть (б) теоремы о длительности планового периода для модели,
    учитывающей единовременные затраты:
    а) проверьте (II);
    б) проверьте (IV).
    25. Задача фирмы «Гарантия» (разд. 9.8). В рекуррентном соотношении (13) динамического программирования показан способ использования квадратичной функции издержек сглаживания.
    а) Запишите функцию (13), включив в нее кусочно-линейную
    функцию издержек сглаживания (4), где для всех отрезков at =
    = bt = 1.
    б) Используя полученную в п. а) функцию, постройте и заполните таблицы, аналогичные приведенным на рис. 9.8—9.11.
    26. Предложите по крайней мере две функции издержек сглаживания, которые могут рассматриваться как приемлемая замена
    функций (3) и (4) из разд. 9.8.
    27. Покажите, какие изменения необходимо внести в рекуррентное соотношение (6) из разд. 9.8 в том случае, когда затраты на
    отрезке t зависят не только от xt, it и xt_2, но и от xt-\_. Приняв существование такой зависимости в задаче фирмы «Гарантия», выявите
    увеличение объема вычислительных операций по сравнению с теми
    вычислениями, которые требовались для построения таблиц
    рис. 9.8-9.10.
    28. Объясните, как вы понимаете следующие термины:
    выпуклая функция;
    вогнутая функция;
    убывающая (возрастающая) предельная эффективность
    при увеличении масштаба производства;
    анализ длительности планового периода;
    динамическая модель экономически выгодного
    размера партии;
    затраты па подготовительные операции
    или переналадку (единовременные затраты);
    скидки за размер заказа (или ступенчатые цены);
    точка возобнавления;
    издержки сглаживания.

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
    УПРАЖНЕНИЯ

    НА РАЗВИТИЕ

    85

    ВЫЧИСЛИТЕЛЬНЫХ НАВЫКОВ

    Упражнения 29—37 относятся к модели управления запасами
    с выпуклой функцией затрат, описанной в разд. 9.3 (напомним, что
    исходный запас на начало планового периода г 0 = 0).
    29. Пусть функции производственных затрат заданы таблицей
    рис. 9.12, например для отрезка 1 выпуску xit равному 12, соответЗатраты на выпуск единицы k
    Выпуск едини- Отрезок 1
    цы k

    Отрезок 2

    Отрезок 3

    Отрезок 4

    2
    3
    5
    8

    1
    6
    7
    12

    4
    4
    8
    9

    1
    3
    6
    10

    1 6 < k < 10
    ll 16
    Р и с . 9.12.

    ствует общая сумма затрат 32 (1-5 -(- 3-5 + 2-6 = 32). Пусть,
    далее, затраты на содержание запасов равны ht ( i t ) = htit, где h^ —
    = 1, /i2 = 2 и /i3 = 1, а спрос составляет соответственно

    D! = Ю,

    Dz = 3,

    D3 = 17, L>4 = 23.

    а) Найдите оптимальную производственную программу. Для
    каждого из отрезков t укажите выпуск xt и уровень запасов на конец
    отрезка i^.
    б) Найдите оптимальную производственную программу, приняв
    для всех отрезков ограничение на уровень запасов it ^ 5.
    в) Определите влияние увеличения на единицу спроса на первом
    отрезке (для которого DI = 11); на втором отрезке; на третьем
    отрезке; на четвертом отрезке.
    г) Найдите оптимальную производственную программу, приняв
    для всех отрезков ht = 0; ht = 5.
    д) Найдите оптимальную производственную программу, изменив
    спрос следующим образом: DI = 3 и D 2 = 10; D3 = 23 и Dt = 17;
    Dz = 17 и D3 = 3.
    30. Пусть исходные данные задачи соответствуют принятым
    в п. а) упражнения 29. Примем, что совокупный спрос Rp, определяемый в соответствии с выражением (1) из разд. 9.4, удовлетворяет неравенствам
    v
    р

    (=1

    (=1

    Для каждого из указываемых ниже вариантов задачи найдите значения величин Хр (S) и Хр (Т), определенные в теореме о длитель-

    86

    ГЛАВА 9

    ности планового периода для модели с выпуклой функцией затрат,
    вычислите значения соответствующих объемов выпуска и уровней
    запасов на конец отрезка и начертите график, аналогичный приведенному на рис. 9.4. Объясните, можно ли найти оптимальный
    выпуск для отрезка 1:
    a) k = 1;
    б) k = 2;
    в) k = 3.
    31. Пусть исходные данные задачи соответствуют п. а) упражнения 29. Примем, что совокупный спрос Rp, определяемый в соответствии с выражением (1) из разд. 9.4, удовлетворяет неравенствам
    2#,-р/с<Я р < 2 Dt + pk.
    t=i
    t=i
    Для каждого из указываемых ниже вариантов задачи найдите значения Хр (S) и Хр (Т), определенные в теореме о длительности планового периода для модели с выпуклой функцией затрат, вычислите
    значения соответствующих объемов выпуска и уровней запасов
    на конец отрезка и начертите график, аналогичный приведенному
    на фиг. 9.4. Объясните, можно ли найти оптимальный выпуск для
    отрезка 1:
    a) k = 1;
    б) k = 2;
    в) k = 3.
    32. Пусть длительность планового периода N равна 3 отрезкам,
    причем функции производственных затрат и затрат на содержание
    запасов для всех отрезков имеют вид Ct (xt) = х\ и ht ( i t ) = htit.
    В каждом из приведенных ниже пунктов упражнения найдите оптимальную производственную программу и укажите уровень запасов
    на конец каждого из отрезков.
    а) Примите для всех отрезков t ht = О и Dt = 6.
    б) Примите для всех отрезков t ht = 0 и DI = 11, Z?2 = 5,
    £>з = 2.
    в) Примите для всех отрезков t ht = 0 и D^ = 2, Z)2 = 5,
    D3 = 11.
    г) Используйте те же данные, что и в л. в), дополнительно наложив на каждый из отрезков ограничение на объем выпуска xt ^ 5.
    д) Используйте те же данные, что и в п. в), дополнительно ограничив для каждого из отрезков уровень запасов на конец отрезка
    it <3.
    е) Используйте для всех отрезков ht = 3 и те же данные о спросе,
    что и в п. в). Затем примите для всех отрезков ht = 11. Сравните
    результаты, полученные для ht = 0, ht — 3 и ht = 11.
    ж) Примите для всех отрезков ht = О, а также используйте
    =
    Х
    те же данные о спросе, что и в п. в), и С3 (#3) 1>5 1 Затем примите
    ht = 3 и, наконец, ht = 11. Сравните полученные результаты
    с результатами п. е).
    33. Примите функции производственных затрат и затрат на
    содержание запасов такими же, как и в упражнении 32. Пусть совокупный спрос, определяемый в соответствии с (1) из разд. 9.4, удов-

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    87

    летворяет неравенствам

    1 ^ #i < 3, 6 < Rz < 8, 23 < R3 < 29
    л ht = 0. Найдите значения величин Хр (5) и Хр (Т), определенных
    в теореме о длительности планового периода для модели с выпуклой
    •функцией затрат; вычислите значения соответствующих объемов
    выпуска и уровней запасов и начертите график, аналогичный приведенному на рис. 9.4. Объясните, можно ли найти оптимальный
    выпуск для отрезка 1. Выполните те же операции при ht = 3
    и ht = И. 34. Примите, что разрешена задержка в удовлетворении спроса
    и что функции производственных затрат, затрат на содержание
    запасов и штрафов за своевременно неудовлетворенный спрос для
    всех отрезков имеют следующий вид:
    htit

    .
    — ptif

    при

    при

    Для каждого из пп. а) — д) упражнения найдите оптимальную
    производственную программу и укажите уровень запасов или неудовлетворенный спрос на конец каждого из отрезков (спрос должен быть
    полностью удовлетворен к концу планового периода).
    а) Примите для всех отрезков ht = pt = О, а спрос равным соответственно

    А = 2, D2 = 5, £»3 = И.
    б) Примите для всех отрезков ht = pt = О, а спрос равным соответственно

    D! = 11, D, = 5, D3 = 2.
    в) Примите спрос таким же, как в п. б), a ht = 0 и pt = 3 для
    всех отрезков. Затем примите для всех отрезков ht = 0 и pt = 11.
    г) Примите для всех отрезков ht = pt = 0, а спрос равным соответственно

    Di = 2, Dz = 11, D3 = 5.
    д) Примите спрос таким же, как в п. д), a ht = pt — 3 для всех
    отрезков. Затем для всех отрезков примите ht = pt = 11 и, наконец,
    ht — 2 и pt = 4.
    35. Пусть длительность планового периода N равна 8, и для всех
    отрезков функции производственных затрат и затрат на содержание
    запасов имеют следующий вид: Ct (xt) = x\, ht ( i t ) = htit. Примите
    спрос равным соответственно

    А - 4,

    Dz = 20, Da = 2, Dt = О, D5 = 6,

    A «= 1, A = 3.

    D6 = 4,

    ГЛАВА 9

    Для пп. а) — ж) упражнения найдите оптимальную производственную программу и укажите уровень запасов на конец каждого из
    отрезков.
    а) Примите для всех отрезков ht = 0.
    б) Примите для всех отрезков поочередно ht = 1; ht = 3.
    в) Примите для всех отрезков ht ( i t ) = i\.
    г) Примите для всех отрезков ht = 0. Кроме того, примите
    Ct (xt) = 1,5 х\ поочередно для t = 2; t = 4; t = 7.
    д) Примите для всех отрезков ht = 0; длительность планового
    периода N равна 9. Каким может быть наибольшее значение D9r
    при котором оптимальный объем выпуска х7, найденный для п. а),
    остается неизменным? То же для х3? То же для х^
    е) Примите для всех отрезков ht = 1. Ответьте на вопросы,,
    которые поставлены в п. д).
    ж) Примите для всех отрезков ht = 3. Ответьте на вопросы,,
    которые поставлены в п. д).
    36. Функции производственных затрат и затрат на содержание
    запасов остаются такими же, как и в упражнении 35; для всех отрезков ht = 0. Найдите значения величин Хр (S) и Хр (Т), определенных в теореме о длительности планового периода для модели с выпуклой функцией затрат, соответствующие значения объемов выпуска
    и уровней запасов на конец отрезка и начертите график, аналогичный приведенному на рис. 9.4. Объясните, можно ли найти оптимальный выпуск для отрезка 1.
    Р
    а

    V

    ) 2! Dt — & ^ .Rp ^ 2 Dt -\- k. Выполните упражнение для
    i=l

    k = 1 и k = 2.
    V

    i=i

    Р

    б) 2 Dt — pk ^ RP ^ 2 Dt 4- pk. Выполните упражнение для
    *=i
    t=i
    Л = 1 и k = 2.
    в) Выполните такой же анализ, если для всех отрезков ht = 1.
    37. Разрешена задержка удовлетворения спроса; спрос и функция
    производственных затрат остаются такими же, как и в упражнении
    35; функция затрат на содержание запасов и штрафов за своевременно неудовлетворенный спрос имеет следующий вид:
    htit
    .
    —ptit

    при it>0,
    п
    при i 4 <0.

    (Спрос должен быть полностью удовлетворен к концу плановогопериода.) Найдите оптимальную производственную программу для
    вариантов а) —• д) задачи и укажите значение уровня запасов или
    неудовлетворенного спроса на конец каждого из отрезков. Для всех
    отрезков:
    a) ht = pt = 0; б) ht = pt = 1; в) ht = pt = 3; г) Л ( = 1
    и p t = 3; д) /г, = 3 и рг = 1.

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    89

    Упражнения 38 — 43 относятся к модели управления запасами
    с вогнутой функцией затрат, приведенной в разд. 9.5 (напомним, что
    исходный уровень запасов на начало планового периода i0 = 0).
    38. Длительность планового периода N равна 3; функции производственных затрат и затрат на содержание запасов имеют следующий вид:
    при
    С\ (xi) = 12 + 8x1
    при а?! ^ 1,
    С2

    при

    = 2

    С3 (^з) = 5 + 10х3 при х3 > 1
    ht (it) = htit. Спрос равен соответственно DI = О, Z)2 = 3, D 3 =
    = 20. Найдите оптимальную производственную программу для
    пп. а) — в) упражнения и укажите уровень запасов на конец каждого из отрезков.Ддя всех отрезков:
    a) ht = 0; 6)(ht = 1; в) ht = 2.
    39. Длительность планового периода N равна 4, а параметры
    функций производственных затрат приведены в таблице рис. 9.13;
    и

    Затраты на выпуск единицы k
    Выпуск едини- Отрезок 1 Отрезок 2 Отрезок 3
    цы k
    1<*<5
    6 ll 16
    10
    6
    3
    1

    8
    5
    3
    2

    12
    7
    6
    1

    Отрезок 4

    9
    8
    4
    4

    Р и с . 9.13.

    например, для отрезка 1 выпуску х^ = 12 соответствует общая сумма
    затрат 86 (10-5 + 6-5 + 2-3 = 86). Функции затрат на содержание
    запасов имеют вид ht ( i t ) = htit, где /^ = 1, /i2 = 2 и h3 = 1. Спрос
    равен соответственно
    = 3, D3 = 17, £>4 = 23.
    D, = 10,
    а) Найдите оптимальную производственную программу. Укажите
    для всех отрезков объем выпуска xt и уровень запасов it на конец
    отрезка t.
    б) Выявите влияние увеличения на единицу спроса на отрезке 1
    (так что DI = 11); на отрезке 2; на отрезке 3; на отрезке 4.
    в) Найдите оптимальную производственную программу, если
    для всех отрезков ht = 0; ht = 5.
    г) Найдите оптимальную производственную программу при следующих изменениях спроса: DI = 3 и Dz = 10; D3 = 23 и Z>4 = 17;
    D2 = 17 и £> 3 = 3.

    90

    ГЛАВА а

    д) Найдите оптимальную производственную программу, если
    для всех отрезков функция затрат на содержание запасов имеет
    вид ht (it) = Yit40. Пусть исходные параметры задачи остаются такими же, как
    и в упражнении 30, однако разрешена задержка в удовлетворении
    спроса. Для всех отрезков функция затрат на содержание запасов
    и штрафов за несвоевременное удовлетворение спроса имеет следующий вид:
    Г htit
    при 1(>0,
    nt(it) = {
    [ —ptit при ft<0.
    (К концу планового периода спрос должен быть полностью удовлетворен.) Найдите оптимальную производственную программу для
    пп. а) — в) упражнения и укажите уровень запасов или неудовлетворенный спрос на конец каждого из отрезков. Для всех отрезков
    принять:
    a) ht = pt = 0;
    б) ht = pt = 1;
    в) вместо приведенной выше функции затрат на содержание
    запасов и штрафов за неудовлетворенный спрос используйте функцию

    ht (it) = V\ it \ •

    41. Длительность планового периода N равна 8; для всех отрезков функция производственных затрат имеет вид Ct (xt) = Y~Xt>
    спрос равен соответственно:
    Dt = 4, Dz = 20, Z)3 = 2, D 4 = 0, D5 = 6, Du = 4, th = 1, Dt = 3.
    Найдите оптимальную производственную программу для пп. а) — в)
    задачи и укажите уровень запасов на конец каждого отрезка. Для
    всех отрезков функция затрат на содержание запасов равна:

    a) ht (it) = 0; б) ht (it) = it;

    в) ht (it) = 1/7,.

    42. Пусть исходные параметры задачи остаются такими же, как
    в упражнении 41, однако разрешена задержка в удовлетворении
    спроса. Для всех отрезков функция затрат на содержание запасов
    и штрафов за несвоевременное удовлетворение спроса имеет следующий вид:
    ..
    f htit
    при

    \ —Ptit при
    (К концу планового периода спрос должен быть полностью удовлетворен.) Найдите оптимальную производственную программу для
    пп. а) — в) упражнения и укажите уровень запасов или неудовлетворенный спрос на конец каждого из отрезков. Для всех отрезков:
    a) ht = pt = 0;
    б) ht = pt — 1;
    в) вместо приведенной выше функции затрат на содержание
    запасов и штрафов за неудовлетворенный спрос используйте функцию

    ht (it) = Я1ГР

    43. Для пп. а) — ж) упражнения укажите оптимальную производственную программу и соответствующие уровни запасов на конец

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    91

    каждого из отрезков при длительности планового периода N, где
    значения N приведены в условиях для соответствующих пунктов.
    Для всех отрезков функции производственных затрат и затрат на
    содержание запасов имеют следующий вид:
    s (t) -f- CfZt

    при

    xt >- 1

    ,

    а) Пусть ./V = 10 и для всех отрезков st = 36, ct = 5, ht = I ,
    Dt = 8.
    б) Используйте данные для п. а), изменив лишь спрос: примите
    DI = 20 для отрезков 3, 6 и 9 и Dt = 2 для всех остальных отрезков.
    в) Используйте данные для п. а), изменив лишь спрос: примите
    D t = 20 для отрезков 2, 5 и 8 и Dt = 2 для всех остальных отрезков,
    г) Используйте данные для п. а), изменив лишь спрос: примите
    Dt = 20 для отрезков 1,4, 7 и 10 и Z)( =2 для всех остальных отрезков.
    д) Пусть N = 12, ct = 5, /г( = 1; Dt = 8 для всех отрезков,
    st = 100 для отрезков 4, 5, 6, 10, 11 и 12 и st = 36 для всех остальных отрезков.
    е) Используйте данные для п. а), однако считайте, что функция
    затрат на содержание запасов имеет вид ht ( i t ) = У if
    ж) Используйте данные для п. а), однако считайте разрешенной
    задержку в удовлетворении спроса. Для всех отрезков функция
    затрат на содержание запасов и штрафов за своевременно неудовлетворенный спрос имеет вид ht (i) — \ it \ •
    з) Для пп. а) — д) покажите, каким образом вычислительный
    алгоритм можно упростить благодаря использованию теоремы
    о длительности планового периода для модели, учитывающей единовременные затраты (разд. 9.7). Покажите также возможность применения рекуррентного соотношения (7).
    44. Рассмотрите задачу, приведенную в упражнении 44 гл. 8.
    Можно ли получить оптимальную программу, используя:
    а) описанный в разд. 9.3 алгоритм для модели управления запасами с выпуклой функцией затрат;
    б) описанный в разд. 9.6 алгоритм для модели управления запасами с вогнутой функцией затрат.
    в) Дайте истолкование результатам, полученным для пп. а) и б).
    ДОПОЛНИТЕЛЬНЫЕ УПРАЖНЕНИЯ

    45. Рассмотрите модель управления запасами, описанную в
    разд. 9.1. Пусть производственные затраты на отрезке t включают
    два элемента: затраты на .рабочую силу Lt (xt) и стоимость сырья.
    Последняя исчисляется следующим образом: на отрезке г фирма
    может закупать любое количество сырья по цене рт за единицу
    (единица измерения количества сырья выбрана таким образом, что

    92

    ГЛАВА 9

    она совпадает с расходом сырья на выработку единицы готовой
    продукции). Цены рг для всех отрезков известны с начала планового
    периода. При закупке сырья в начале планового периода и его хранении для последующего использования фирма несет расходы по
    содержанию запасов; оплата каждой единицы запаса сырья на конец,
    отрезка г составляет Нг. Предложите рациональный метод учета
    решений о закупке сырья в модели, описанной в разд. 9.3 и 9.5.
    46. Для пп. а) и б) изложите способ модификации алгоритма,
    позволяющий учесть положительный уровень исходного запаса на
    начало планового периода (i 0 > 0). Вначале укажите, какую целесообразно ввести модификацию, в случае когда функции затрат на
    содержание запасов имеют для всех отрезков вид ht ( i t ) = htit.
    Затем покажите, как изменяется подход, если не все функции затрат
    на содержание запасов линейны:
    а) в модели управления запасами с выпуклой функцией затрат,
    описанной в разд. 9.3;
    б) в модели управления запасами с вогнутой функцией затрат,
    описанной в разд. 9.6.
    47. а) Предложите
    модификацию
    алгоритма,
    описанного
    в разд. 9.3, позволяющую учесть наличие верхних границ ut объемов
    выпуска xt и верхних границ уровня запасов bt на конец отрезка t.
    б) Рассмотрите модель с вогнутой функцией затрат, описанную
    в разд. 9.5, и примите, что после хранения в течение К отрезков
    хранимая продукция устаревает, так что ее нельзя использовать.
    Предложите разумное изменение как формулировки теоремы о виде
    оптимальной программы, так и соответствующего алгоритма.
    48. Рассмотрите модель управления запасами, описанную
    в разд. 9.1, приняв запас на начало планового периода i0 = 0. Если
    не учитывать условия целочисленности переменных, ограничения (4)
    и (5) можно представить в следующем виде:
    t
    t
    J\xh>Y<, Dk:
    t = i, 2, ..., N,
    k=l

    h=l

    причем строгое равенство обязательно соблюдается для t = TV и вс&
    xk ^ 0. Пусть минимизируемая функция затрат имеет вид
    С (#!, ж 2 , . . ., X N ; D I , Вг, . . ., DN). Предположим, что эта функция является вогнутой по всем управляющим переменным xk; это
    означает, что если имеются две допустимые программы, а третья
    программа строится как выпуклая комбинация двух этих программ
    (т. е. является их средневзвешенной при любых неотрицательных
    значениях выбранных весов), то затраты, соответствующие третьей
    программе, не превышают величину, полученную взвешиванием
    затрат, отвечающих двум первым программам при тех же весах.
    Можно показать (разд. 14.9), что оптимальная программа соответствует экстремальной точке системы ограничений. (Вспомним, что
    если программа соответствует экстремальной точке, ее нельзя представить в виде выпуклой комбинации других допустимых программ.)

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    93

    а) Проверьте, обладает ли программа, соответствующая экстремальной точке, следующим свойством: если существуют отрезки р
    л q, р < q, такие, что
    Хр ^> U,

    то

    Д^р + 1 — Яф + 2

    =

    > • • •>

    =

    %q-l

    =

    "1

    >

    %"4 ~- "Л

    1

    '-

    б) Покажите, что а) эквивалентно теореме о виде оптимальной
    программы, сформулированной в разд. 9.5. Объясните, почему при
    целых значениях всех Dt оптимальная программа характеризуется
    целыми значениями управляющих переменных.
    в) Покажите, что число допустимых программ, соответствующих
    экстремальным точкам, равно 2IV~1 (при Di > 0). Объясните, как
    этот результат можно использовать при определении оптимальной
    программы.
    В упражнениях 49 — 58 необходимо построить модель на основе
    рекуррентных соотношений динамического программирования. Дайте определения всем используемым условным обозначениям. Предложите адекватную целевую функцию для того случая, когда число
    отрезков до конца планового периода равно 1, а также рекуррентное
    соотношение для случая п отрезков до конца планового периода.
    Объясните, с чего следует начать и чем закончить вычислительный
    процесс.
    49. Рассмотрите модель управления
    запасами, описанную
    в разд. 9.1.
    а) Добавьте ограничение, согласно которому для всех t = 1,
    2, . . ., TV должно выполняться соотношение (it-i + s<)/2 ^ Bt,
    где все Bt — неотрицательные целые числа.
    б) Добавьте ограничение, в соответствии с которым xt.i + xt ^
    -< vt для всех t = 1, 2, . . ., TV, причем все vt — неотрицательные
    целые числа, а х0 = 0.
    в) Добавьте ограничение, согласно которому xt-l -\- xt ^ 1 для
    всех t = 1, 2, . . ., N, причем х0 = 0.
    50. Задача транспортного обслуживания. Несколько фирм, вырабатывающих пищевые продукты, направляют грузы, предназначенные для продовольственного магазина «Радость хозяйки», на один
    из складов того города, где расположен магазин. Магазин платит
    с долл. в сутки за каждые 100 куб. футов складского помещения,
    которые он использует. Предположим, что владельцы магазина
    в каждый день t в течение ближайших TV дней предполагают получать
    груз, объем которого равен Dt сотен куб. футов. Предположим также,
    что ежедневно владельцы магазина могут заказать в транспортной
    фирме грузовик, который доставит со склада хранящиеся там товары. Заказ грузовика стоит s долл., поэтому владельцы магазина
    обычно пользуются им не каждый день. В то же время они не до-

    94

    ГЛАВА 9

    пускают, чтобы какой-либо груз хранился на складе более п дней
    (примем, что грузы поступают на склад по утрам, а грузовик забирает грузы со склада в конце дня; примем также, что плата за арендуемое помещение исчисляется исходя из максимального объема
    помещения, использованного в течение дня). Покажите метод построения такого графика доставки груза со склада, чтобы он был оптимальным для владельцев магазина.
    51. Задача размещения распределительных нефтебаз. Фирма
    «Супернефтепродукты» контролирует значительную часть торговли
    бензином в обширном районе, расположенном на полуострове.
    В районе имеется N городов, соединенных шестиполосной автострадой. Пусть городам присвоены индексы от 1 до N, причем таким
    образом, что из города } в город k (j < k) необходимо проехать по
    автостраде мимо городов у + 1, у -f- 2, . . ., k — 1. Фирма «Супернефтепродукты» собирается разместить распределительные нефтебазы
    в одном или нескольких городах. Годовые расходы по содержанию
    нефтебазы не зависят от ее величины и для города у составляют Sj.
    Прогнозируемый годовой спрос на бензин для города j равен DJ,
    а расстояние между соседними городами j и (у + 1) составляет
    Lj, j+1. Если распределительная нефтебаза, расположенная в городе у, обслуживает город k, то соответствующий годовой расход на
    перевозку бензина будет равен h -Dk -Ljh, Фирма стремится найти
    оптимальную схему размещения нефтебаз. Постройте модель динамического программирования для решения этой задачи:
    а) приняв, что обслуживание города k может осуществляться
    только нефтебазой, расположенной в городе у, причем } <; k;
    б) приняв, что обслуживание города k должно осуществляться
    той нетебазой, которая ближе всего к этому городу.
    52. Задача выбора сортамента продукции. Японская промышленная фирма «Фудзи стил» выпускает строительные балки стандартной
    длины. Прочность балки зависит от ее веса, и фирма «Фудзи стил»
    присвоила балкам разного веса индексы у, принимающие значения
    от 1 до N, где у = 1 соответствует самой тяжелой, a j = N — самой
    легкой балке. В том случае, когда заказчику требуются балки, прочность которых равна k, фирма «Фудзи стил» может, если пожелает,
    удовлетворить потребность в балках большей прочности / (у <С k).
    Фирме «Фудзи стил» приходится решать следующую задачу выбора
    сортамента продукции. Спрос на балки прочности j равен Df, весь
    спрос должен быть полностью удовлетворен. Если фирма «Фудзи
    стил» принимает решение о выпуске балок у, это требует больших
    затрат на переналадку, которые равны s/. Если же фирма удовлетворяет спрос DJ балками k (k ^ у), это влечет за собой потерю выручки,
    равную h (wk — Wj) DJ, где wh и Wj — вес балок k и у соответственно,
    a h — цена единицы веса. Построить модель динамического программирования, которая позволила бы фирме «Фудзи стил» найти оптимальную структуру сортамента и объем выпуска балок каждого
    типа.

    ДИНАМИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ

    95

    53. Рассмотрите модель управления запасами, описанную
    в разд. 9.1. Предположим, что если выпуск на предыдущем отрезке
    был нулевым, то выпуск на следующем отрезке связан с «пусковыми
    затратами». Для конкретности примем, что функция затрат на отрезке t равна
    Ct (xt, i t , xt-i) = Ct (xt) + ht (it) + vt (xt_i, xt),
    где
    ( Kt при xt ^ 1 и xt-.i = 0,
    vt (xt-\, xt) = < n
    [ 0
    в остальных случаях.
    а) Сформулируйте задачу в виде модели динамического программирования. Сравните вычислительные трудности, возникающие при
    решении рекуррентной модели, с аналогичными трудностями для
    модели разд. 9.1 (не делая никаких дополнительных допущений
    о виде функции затрат).
    б) Пусть
    Г 0
    при ж( = 0,

    1 st + ctxt

    при xt>i,

    причем функция ht (it) является вогнутой. Примем для всех t S; ^ О т
    ct ^ ct+i, спрос Dt > 0, запас на начало планового периода г0 = 0.
    Предположим, что существует оптимальная программа, в которой
    для всех отрезков it-\xt = 0. Предложите соответствующую модификацию алгоритма, приведенного в разд. 9.6. Начертите сеть,
    отыскание кратчайшего пути на которой может служить иллюстрацией предлагаемого подхода.
    в) Докажите, что допущения, принятые в п. б), подразумевают
    существование оптимальной программы, для которой it-iXt = О
    (* = 1, 2, . . ., N).
    54. Рассмотрите модель управления
    запасами, описанную
    в разд. 9.1. Пусть при длительности планового периода, равной N
    отрезков, выпуск разрешен в течение не более чем К отрезков; это
    означает, Что не более К объемов выпуска xt (t = 1, 2, . . ., N)
    могут быть положительными. Сформулируйте задачу в виде модели
    динамического программирования. Сравните вычислительные трудности, возникающие при решении рекуррентной модели, с аналогичными трудностями для модели разд. 9.1 (не делая никаких дополнительных допущений о виде функции затрат). Покажите, как изменится решение, если в течение планового периода число отрезков с ненулевым выпуском должно быть в точности равно К.
    В упражнениях 55—58 однопродуктовая модель управления
    запасами, описанная в разд. 9.1, обобщается на случай двух видов
    запасаемых продуктов (для дальнейшего обобщения модели на большее число продуктов требуется лишь простое расширение получаемых
    ниже результатов). Обозначим Dit и Z)2i спрос на отрезке t на продукты 1 и 2 соответственно, £ц и xzt — выпуск этих двух видов
    продукции, 1ц и izt — уровень их запасов на конец каждого из
    отрезков. (Все допущения, не сформулированные в явном виде,

    ГЛАВА 9

    являются соответствующими обобщениями предположений, сделанных в модели разд. 9.1.)
    55. Пусть целевая функция имеет вид
    N

    Минимизировать 2 Ct (xiti

    (=i

    где

    ж

    аь hi, *2<)>

    Ct (xit, xzi: iit, izt) = Ct (xit, xzt) + hit (in) + hzt (izt).

    Постройте модель динамического программирования и сравните
    вычислительные трудности, возникающие при решении этой модели,
    с аналогичными трудностями для модели разд. 9.1 (не делая никаких
    дополнительных допущений о виде функции затрат).
    56. Пусть функции производственных затрат в упражнении 55
    имеют вид
    О
    при
    1

    JJJU,M,

    Ct (xit, xzt) = I

    st + Сухи 4- Cztxzt

    в остальных случаях,

    где S; ^ О, С ^ ^ Ci, t+i и Czt ^ Cz, j+i, а функции затрат на содержание запасов klt (j l f ) и hzt (izt) являются вогнутыми.
    а) Примите исходные уровни запасов на начало планового периода IIQ — Чо = 0. Предположим, что существует оптимальная программа, в которой для всех отрезков (ц, ,_j + iz. г _ 4 ) (xlt + x2t) =
    = 0. Предложите соответствующую модификацию алгоритма, приведенного в разд. 9.6, которая позволила бы найти оптимальную
    программу производства обоих видов продукции.
    б) Докажите существование оптимальной программы, характер
    которой соответствует предположению, сделанному в п. а).
    57. Пусть функции производственных затрат в упражнении 55
    имеют вид
    | 0
    при
    , x2t) = \
    „ .
    „ , ,
    \ st-^-Llt (Xit)-rL2t (Xzt)
    в остальных случаях,
    где st ^ 0, функции Cit ( x i t ) и Czt(xzt), а также функции затрат
    на содержание запасов hlt (iit) и hzt (г 2 ( ) являются вогнутыми.
    а) Считайте, что свойства оптимальной программы, сформулированные в разд. 9.5, сохраняются для каждого из продуктов. Объясните, как можно использовать информацию об этом допущении
    для упрощения вычислений по рекуррентным формулам в случае
    упражнения 55.
    б) Докажите справедливость сделанного в п. а).
    58. Пусть функция производственных затрат в упражнении 55
    имеет вид
    Ct (xit, xzt) = Сit (xit) + Czt (xzt),
    а на объемы выпуска для каждого из отрезков наложены ограничения altxit + a-ztZit ^ bt, где а,ц, azt, bt — неотрицательные целые
    числа. Предложите для упражнения 55 соответствующую модификацию модели динамического программирования.

    ГЛАВА 10

    Еще о динамическом программировании

    10.1. ВВЕДЕНИЕ

    Построение модели, описываемой рекуррентным соотношением
    динамического программирования, является до некоторой степени
    искусством. В связи с этим в разд. 10.2—10.6 приводятся разнообразные примеры, позволяющие читателю полнее прочувствовать приемы,
    используемые при построении таких моделей. Поскольку в гл. 8
    были подробно рассмотрены два примера численного решения моделей динамического программирования, в данной главе вычислительным аспектам, связанным с моделями этого класса, не уделяется
    особого внимания.
    В конце главы, в разд. 10.7—10.10, дается общая оценка динамического программирования. В частности, обсуждаются элементы,
    общие для любых постановок задач динамического программирования, и показывается, что анализ этих элементов позволяет получить
    ценную информацию для принятия организационных решений.
    Дается некоторое представление о различиях между теоретическим
    исследованием моделей динамического программирования и их
    практическим применением. В заключение кратко освещаются реальные промышленные ситуации, рассмотрение которых на основе
    использования моделей этого рода принесло ощутимый экономический эффект, вскрываются также причины, содействовавшие получению положительных результатов.
    В излагаемых ниже примерах использования моделей сначала
    приводятся многие второстепенные подробности, а затем дается
    более схематичное описание и от читателя требуется тщательное
    изучение этих схем, в которые ему следует самостоятельно внести
    необходимые уточнения. Указания, данные в гл. 8, сохраняют силу.
    Читателю надлежит проявить терпение и отвести достаточно много
    времени на проработку разделов этой главы. Нужно предусмотреть
    по крайней мере двукратное прочтение каждого раздела.ГДля проверки понимания каждой из приведенных моделей читатель должен
    дать ответы на следующие вопросы:
    1. Какие переменные описывают стратегию (программу), т. е.
    являются управляемыми переменными?
    2. Каков критерий выбора оптимальной стратегии (какова целевая функция)?
    3. Как описывается, а затем исследуется задача в виде многошагового процесса?
    4. Что характеризует состояние процесса на каждом шаге?
    5. Как влияют ограничения на состояние процесса и допустимые
    значения управляемых переменных?
    7-0734

    98

    ГЛАВА 10

    10.2. МОДЕЛЬ РАСПРЕДЕЛЕНИЯ УСИЛИЙ

    Рассмотрим нижеследующий гипотетический, но тем не менее
    поучительный пример так называемой модели распределения усилий.
    Владелец торговой фирмы «Свежие продукты» должен распределить
    имеющийся у него недельный запас в количестве ./V яиц по s магазинам. Из опыта известно, что если направить yj яиц в магазин },
    то прибыль составит RJ (у^). Владелец фирмы считает, что для максимизации общей прибыли не следует направлять все яйца в один
    магазин и стремиться найти оптимальное распределение имеющихся
    в наличии яиц по магазинам^
    Эту задачу можно сформулировать следующим образом:
    Максимизировать 2 RJ (у^

    (1)

    3=1

    при ограничениях
    2 yj — N

    (наличный запас яиц),

    (2)

    3=1

    yj = О, 1, 2, . . .

    для любого / (учитывая только целые яйца). (3)

    Для преобразования постановки задачи (1) — (3) в задачу динамического программирования примем:
    gj (п) — прибыль яри оптимальном распределении п яиц по магазинам 1, 2, . . . . 1,
    (4)
    п
    У] ( ) — количество яиц, направленных в магазин / и дающих прибыль gj (п).
    Обратим внимание на принятые обозначения *). Буква g (goal)
    определяет значение целевой функции фирмы, т. е. прибыли. Буква п (number) относится к числу яиц, которые нужно распределить.
    Индекс j (just) обозначает просто номер магазина.
    Отметим, что этот пример не относится к разряду динамических
    задач в смысле многошагового принятия решения. Многошаговое
    свойство задачи относится, скорее, к методу оптимизации, основанному на рассмотрении одного дополнительного магазина на каждом
    шаге.
    Рекуррентное соотношение динамического программирования
    можно записать в виде
    ; = 1 , 2 ..... s,
    (5)
    Ы*) = 0,

    / = 0,

    (6)

    где п = О, 1, . . ., N ж максимум берется только по неотрицательным целочисленным значениям г//, удовлетворяющим условию yj ^ п.
    г

    ) Эти обозначения соответствуют начальным буквам английских слов,
    приведенных в скобках.— Прим. перев.

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    99

    При заданных числовых значениях функций прибыли RJ (г/;)
    и известном значении N вычисления при решении задачи начинаются
    с определения значений gi (0), gi (1), . . ., gi (N) при / = 1. Затем
    находятся значения gz (0), gz (1), . . ., gz(N). Вычисления продолжаются по той же схеме при последовательном возрастании значений у, пока в конце концов не определяются значения gs (TV)- Оптимальное распределение в принципе находится путем осуществляемого
    в обратном порядке выбора значений yj, дающих в совокупности
    gs (N).
    Модель общего вида. Пример торговой фирмы «Свежие продукты»
    относится к частному случаю задачи распределения усилий. Этот
    пример имеет частный характер в силу того, что единственное ограничение (2) является линейным. Точно такой же динамический подход в той же мере справедлив и в случае, когда единственное ограничение нелинейно. Предположим для определенности, что модель
    описывается следующими соотношениями:
    s

    Максимизировать 2 R} (Uj)

    (7)

    при ограничениях
    Nt

    yj = О, 1, 2, . . .

    при любом j.

    (8)
    (9)

    Допустим, что каждая функция Hj (y^ есть неубывающая функция,
    принимающая целочисленные значения при любом 1/^ = 0, 1, 2, . . .
    и удовлетворяющая условию Hj (0) = 0. Для упрощения рассуждений примем, что Н1 (г/4) = г/ь вследствие чего допустимое решение
    существует при любом значении N. На каждую величину у^ можно
    также наложить ограничение сверху! как это будет показано в приводимом ниже числовом примере.
    Рекуррентное соотношение динамического программирования,
    соответствующее задаче (7) — (9), имеет следующий вид:
    gj (п) = max {Rj (у,) + gj_t [п-Н3 (у})]}, j = 1 , 2, . , . , s, (10)
    y
    )
    j = О,
    (Ц)
    go (п) = 0,
    где п = О, 1, . . ., TV, а максимум берется только по неотрицательным целочисленным значениям у^, удовлетворяющим условию
    ffj (Уз) ^= п- Отыскивается значение gs (N). Для выполния вычислений нужно определить по выражению (10) значения каждой функции
    gj (п) при п = О, 1, . . ., N, начиная с j = 1 и кончая / = s.
    Числовой пример. Проиллюстрируем вычислительную схему
    решения задачи о распределении усилий, задавшись числовыми
    данными для модели (7) — (9). Примем s = 3 и N = 8. Значения
    7*

    100

    ГЛАВА 10

    функций Rj (yj) и Hj (у^ приведены в таблице рис. 10.1. Заметим, что
    Ri Ы = 2г/ ь
    Щ (У,) = Z/ь

    ,.„.

    Д 2 (уг) = Зг/ 2 ,

    (1

    Я2 Ы = 2у а , Я3 (i/з) = Зг/з.

    Как видно, это линейные функции, но функция R3 (у$)
    Кроме того, наложим ограничение сверху на все
    yj =SC 2 при любом /'.

    ^

    нелинейна.
    (13)

    (В этой задаче можно было бы также принять ограничение ys ^ I ,
    поскольку при г/з = 2 значение целевой функции не возрастает.)

    9 R,(y,} HI (У,}

    /Ш) АЬ(Й)

    *зО&) Нз(Уз)

    0

    0

    0

    0

    0

    0

    и

    1

    2

    1

    3

    2

    *>,5

    3

    2

    4

    2

    6

    4

    \s

    Б

    Р и с . 10.1. Пример задачи о распределении усилий.

    \

    *

    Значения gj (n) и соответствующие им оптимальные решения
    (п) сведены в таблицу рис. 10.2. Проанализируем, каким образом
    получены эти величины.
    Вычисления значений z/t (n) и
    ei (n) тривиальны. Так, например,
    если /г = 2, то из таблицы рис.
    10.1 легко видеть, что Я4 (2) =2,
    откуда г/! (2) = 2 и соответственно gl (2) = Д, (2) = 4.
    Аналогично вычисления значений 1/2 (п) и ёг (п) при » = О, 1
    почти столь же тривиальны, поскольку при этих значениях п огп
    раничение Я2 (z/2) ^ может удов=
    летворяться только при i/2
    ОСледовательно, имеем
    gz (0) = 0, г/2 (0) = 0, (14)
    g, (1) = Д 2 (0)+ft (1) = 0 + 2=2
    и
    у, (1) = 0.
    (15)


    .„ „ _
    Р и с . 10.2. Оптимальные стратегии
    для примера задачи о распределений усилий (N = 8).

    Более типичны по своему характеруJ вычисления значений г/, (2)
    ^ 2,
    о л
    и Кг /0
    ( Х поскольку при тг = 2 оба
    значения г/2 = 2 и j/ 2 = 1, как

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    101

    видно из таблицы рис. 10.1, являются допустимыми. Таким образом,
    из (10) получаем
    gz (2) = max Ш 2 (0) + gi (2), Я 2 (1) + gl (0)] =
    (16)
    = max (0 + 4, 3 + 0) = 4 и г/2 (2) = 0.
    Для проверки усвоения вычислительной схемы читателю рекомендуется самостоятельно определить значения остальных элементов
    таблицы рис. 10.2. (Отметим, что при увеличении п от 0 до 8 оптимальные значения уз колеблются.)
    Оптимальная стратегия при Л^ = 8 находится таким образом.
    Начиная с / = 3, имеем z/3 (8) = 1. Следовательно, для определения оптимального значения г/ 2 нужно вычислить п = 8 — Зг/3 (8) = 5.
    Проделав это, получаем г/2 (5) = 2. Тогда новое значение п =
    = 5 — 2г/2 (5) = 1 и, следовательно, г/4 (1) = 1. В результате оптимальное распределение определяется следующими значениями переменных: г/i = 1, г/ 2 = 2, г/з = 1. Соответствующее этому распределению оптимальное значение целевой функции g3 (8) = 12,5.
    В частном случае, когда целевая функция (7) и ограничение (8)
    линейны, т. е.
    Rj (Uj) = RlVl

    и Hj (г/,) = Hjyj,

    у = 1, 2, . . ., в,

    (I)

    можно провести дальнейшие упрощения. Будем, как и прежде,
    предполагать, что HI = 1 и что при j =И= I Hj есть целое число,
    большее единицы. Вместо (10) и (11) можно применить следующее
    рекуррентное соотношение:
    F(n) = m^lRj + F(n-Hj)],
    п = 1, 2, ..., N,
    (II)
    F (0) = 0,

    п = О,

    (III)

    где максимизация производится по значениям ] = 1, 2, . . ., s,
    удовлетворяющим также неравенству Hj F (2), . . .,• F (N — 1) и, наконец, F (N), представляющее собой
    оптимальное значение целевой функции. В данном случае понятия
    переменных состояния и управляемых переменных совпадают, так
    что индекс не требуется.
    \£\
    Сравнение (10) и (II) сразу показывает, что если в первом случае
    необходимо определять значения gj (п) при и = О, 1, . . ., N л j =
    = 1, 2, . . ., s, то во втором нужно только найти F (п) при п =
    = 0, 1, . . ., N. Таким образом, gs (п) = F (п).
    Различие между двумя подходами (10) и (II) наглядно выявляется
    при рассмотрении модели управления запасами с вогнутой функцией
    затрат из разд. 9.5. Предположим, что функции затрат и спроса
    не меняются во времени, т. е. примем, что они стационарны
    DI = D, Ct (xt) = С (xt) и ht (it) = h (it) для всех интервалов.

    (IV)

    102

    ГЛАВА 10

    Тогда суммарные производственные затраты ch) на отрезке k + 1,
    необходимые для удовлетворения спроса на отрезках k + 1, . . . , / ,
    зависят только от длины отрезка. Поэтому при j — k = p, примем
    P-I
    7
    chj 5= Rp = С (pD) + 2 ^ (mD). Для примера, если Л " = 4, то
    т=1

    с и./ = c o j == c l 2 = c 23 = c34 = Rit
    C

    C
    C

    Aj

    C

    C

    С

    C

    — 02 — 13

    = C

    j — k = 1,

    24 == ^2>

    / - & = 2,

    A/ = зз — i4 == -"3,
    W =

    C

    у — k = 3,

    04 = #4,

    j — k = 4.

    Для этой ситуации из предположения о виде оптимальной стратегии
    следует, что количество продукции, выпущенной на каждом отрезке,
    является целым, кратным D, т. е. ID, 2D, . . ,, ND. Пусть yj есть
    число отдельных включений объема выпуска ]D в календарный
    план, где / = 1, 2, . . ., N. Тогда величины г/,- нужно определить
    N

    таким образом, чтобы суммарный выпуск 2

    (]Щ У) был равен сум-

    2=1

    марному спросу ND. Соответствующую оптимизационную модель
    для планового периода из N отрезков можно записать следующим
    образом:
    JV

    Минимизировать 2 Л7-г/;-

    (VI)

    3=1

    при ограничениях
    N

    ^j-yj = N,

    z/j = 0,l, ...

    при всех /,

    (VII)

    3 =1

    где обе части (VII) разделены на D. [Таким образом, сумма в левой
    части (VII) представляет собой просто общую продолжительность
    календарного плана, которая должна быть равна продолжительности
    планового периода.]
    Заметим, что целевая функция (VI) обеспечивает минимизацию.
    Вместо сведения (VI) к задаче максимизации путем изменения знаков
    RJ можно просто изменить смысл оптимизации в выражении (10).
    В постановке (VI) и (VII) задача сводится к отысканию числа партий
    г/у, которые нужно включить в календарный план для удовлетворения потребностей на j отрезках. В этом случае s = N, поскольку
    существует возможность запланировать выпуск количества продукции N-D на отрезке 1, обеспечивающего спрос на всех отрезках
    планового периода.
    В задаче (VI) и (VII) можно привести (10) и (11) к виду
    / = 1, 2, .... N,
    (VIII)
    go

    (га) =30,

    / = О,

    (IX)

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    103

    где п — О, 1, . . ., N и минимизация осуществляется только по
    неотрицательным целочисленным значениям г/^, удовлетворяющим
    УСЛОВИЮ

    } -l)j ^ П.

    При п = 1, 2, . . ., ./V рекуррентное соотношение (II) принимает
    вид
    =

    min [
    3=1 ..... n

    —j ]

    и

    (X)

    Приняв /п == F (п) и k == n — /, получаем эквивалентное выражение
    для (X)
    (XI)
    /„=
    min
    [fh + Rn-ъ] и /о=0,
    h=0, 1

    n-l

    не отличающееся от рекуррентного соотношения (4) в разд. 9.6 при
    условии, что выполняется допущение (V) о виде функции затрат.
    Для сравнения относительных достоинств постановок (VIII)
    и (X) примем N = 4. Тогда рекуррентное соотношение (X) соответствует отысканию кратчайшего маршрута на ациклической сети,

    Р и с . 10.3. Модель управления запасами с вогнутой функцией затрат
    77, j — обозначение узла.

    имеющей вид сети, показанной на рис. 9.7 (стр. 70). Рекуррентное
    •соотношение (VIII) соответствует задаче о выборе кратчайшего
    маршрута на сети, приведенной на рис. 10.3. В этой сети индексы
    каждого узла (п, /) соответствуют паре значений п и / в выражении (VIII). Каждой дуге, выходящей из узла (п, j), сопоставляется
    значение г/у, такое, что / -г/у ^ п. Очевидно, что для решения задачи
    в постановке (VIII) требуется больший объем вычислений, чем для

    104

    ГЛАВА ю

    решения задачи в постановке (X). [Оба рекуррентных соотношения
    допускают и дальнейшее упрощение, но и после упрощений постановка (X) остается выгодней в вычислительном отношении.]
    10.3. РАСПРЕДЕЛЕНИЕ УСИЛИЙ. ДВА ОГРАНИЧЕНИЯ
    Фирма «Вечный двигатель» планирует проведение радиорекламной кампании по сбыту своих автомобилей в одном из районов страны. В рекламных радиопередачах в течение двух недель будут рекламироваться новые модели фирмы. В зоне расположено s радиостанций. Для каждой /-и радиостанции отдел исследования сбыта фирмы
    определил оценку функции реакции сбыта, связывающей чистый
    доход RJ (г/у-) (объем продаж за вычетом расходов на рекламу) с выделенной суммой г/у- долл. на оплату рекламных передач этой радиостанции. Общая сумма ассигнований на рекламную кампанию составляет N долл. Руководитель отдела рекламы фирмы определил, что
    число рекламных объявлений по радио в дневное время не должно
    превышать М. Радиостанция / включает в свою дневную программу
    Kj (г/у) рекламных объявлений при условии, что фирма выплатит
    ей общую сумму г/у- долл. за рекламные передачи.
    Оптимизационную модель задачи, возникшей перед руководителем
    отдела рекламы, можно записать следующим образом:

    Максимизировать 2 R} (Hi)
    3=1

    при ограничениях
    2 Hi-^N

    (общая сумма ассигнований),

    (1)

    (2)

    3=1

    (число рекламных объявлений в дневное время), (3)
    */у = 0, 1, 2, ...

    при любом /.

    (4)

    Предположим, что N, М и Kj (yj) — неотрицательные целые числа.
    Поскольку ранее для записи одного ограничения типа (2) в рекуррентном виде требовалась одномерная (скалярная) переменная состояния, теперь можно легко и безошибочно догадаться, что нужна
    двумерная (векторная) переменная состояния. Соответствующее рекуррентное соотношение имеет вид
    gj (п, т) = max (Rj (у}) + gM [n — у}\ т — Kj (у,)}},
    У]

    / = 1 , 2 , . . . , *,

    (5)

    где ге = О, 1, . . ., ЛГ и пг = О, 1, . . ., М, а максимизация производится только по неотрицательным значениям г/у-, удовлетворяющим условиям yj ^ п и Kj (yj) ^ т. Читателю следует дать определение функции gj (п, т) в терминах радиорекламной кампании,

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    105

    а также дать ответы на следующие вопросы. В чем существенное
    различие между (5) и приведенным ранее в разд. 10.2 соотношением (10)? Какой вид принимает рекуррентное соотношение, если
    добавить к (2) и (3) третье ограничение в виде суммы?
    Другим примером только что рассмотренной модели может служить распределение капиталовложений. Ежегодно фирма «Большая
    энергетика», выпускающая тяжелое энергетическое оборудование,
    рассматривает значительное число s независимых вариантов капиталовложений в различные виды основных фондов. Для осуществления
    варианта / требуется выделить Kj долл. Общий объем годовых капиталовложений М строго фиксирован. Ожидаемый доход от капиталовложений по j-му варианту составляет RJ долл. Фирма, естественног
    стремится максимизировать общий доход по всем капиталовложениям. Руководители фирмы пришли к выводу, что вследствие ограниченных возможностей организационного управления общее число
    проектов, реализуемых в рамках любого года, не должно превышать N. Каждый вариант уникален, и нужно решить — принимать
    ли его на данный год или отвергнуть. Для отображения этого условия примем, что переменная г//, сопоставляемая ;-му варианту, может
    принимать только значения: у} = 0 (вариант отвергнут) или У} = 1
    (вариант принят). Все перечисленные условия можно формализовать
    в виде следующей задачи:
    S

    Максимизировать 2 К]У}

    (I)

    при ограничениях
    s

    2 l/j^N

    (общее число проектов),

    (II)

    3=1

    s

    (общий объем капиталовложений)
    I
    =^{

    п

    при любом j

    (вариант принят/отвергнут).

    (III)
    (IV)

    В этой задаче
    gj (n, т) есть доход от оптимального распределения т долл.
    капиталовложений по п проектам, выбранным из варианта 1, варианта 2, . . ., варианта ;'.
    (V)
    10.4. РАСПРЕДЕЛЕНИЕ УСИЛИЙ. ПОГРУЖЕННАЯ ЗАДАЧА

    Фирма «Чудесные химикалии», организационная структура которой построена на базе отделений, ежегодно распределяет ассигнования на выполнение научно-исследовательских и опытно-конструкторских работ (НИР — ОКР). Каждое из s отделений представляет руководству фирмы данные трех видов. Информация первой

    106

    ГЛАВА 10

    труппы относится к проведению поисковых исследований весьма
    неопределенного характера. Если на исследования такого рода
    в отделении / выделяется Vj тыс. долл., то оценка ожидаемого долгосрочного дохода равна Pj (Vj) млн. долл. Информация второй группы
    относится к продукции, по которой поисковые исследования уже
    завершены и для выпуска которой требуется проведение опытноконструкторских работ и испытаний. Для таких проектов ассигнования в объеме Wj тыс. долл., согласно имеющейся оценке, дадут в конечном счете доход в размере Qj (wj) млн. долл. К третьей группе относится информация, связанная с улучшением качества уже выпускаемой в промышленных масштабах продукции. Затраты xj тыс. долл.,
    согласно сделанным оценкам, должны принести всего RJ (х}) млн.
    долл. дополнительного дохода.
    Совет директоров фирмы утверждает общую сумму ассигнований
    на все проекты НИР — ОКР в размере N тыс. долл. , а президент фирмы
    устанавливает верхний предел LJ ассигнований на НИР — ОКР, которые может получить отделение /. Вице-президент фирмы, ответственный за НИР — ОКР, должен распределить ассигнования между отделениями таким образом, чтобы обеспечивалась максимизация общего
    дохода фирмы при наложенных ограничениях.
    Математическая модель задачи вице-президента описывается следующими соотношениями:
    s

    Максимизировать 2J [Pj (vi) + i—i
    при ограничениях
    v

    w

    2 ( i + i -\~Х])-^,Н

    J=1

    Vj + Wj -f- Xj ^ LJ,

    7 = 1, 2, . . ., s
    Vj, Wj, Xj

    (1)

    (общая
    сумма
    ассигнований фирмы на НИР —
    ОКР),
    (2)
    (верхний
    предел
    ассигнований, выделенных отделению фирмы),
    (3)
    (неотрицательные
    целые
    при любом /').
    (^

    Поскольку на все управляемые переменные наложено только
    одно ограничение (2), а остальные бюджетные и целочисленные ограничения (3) и (4) относятся только к отделению /, можно ожидать,
    что в данном случае имеет место задача распределения усилий с одним
    ограничением. Рассуждая таким образом, получаем следующее рекуррентное соотношение:
    (п) = max [Pj (Vj) + Q3 (w}) + RJ (xj) + g;M (n — Vj — w} — Xj}\,
    / = 1,2, ...,s,
    (5)

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    107

    где п = О, 1, . . ., N и максимизация производится только по
    неотрицательным целочисленным значениям Vj, Wj и xj, удовлетворяющим условию Vj + Wj + Xj ^ min (Lj, n).
    Заметим, что в (5) появляется новое для нас затруднение. Если
    в предыдущих примерах задач о распределении усилий для поиска
    максимума на каждом шаге нужно было изменять только одну переменную У}, то теперь приходится решать оптимизационную задачу
    с тремя переменными. Разумеется, можно было бы попытаться решить
    задачу методом полного перебора, однако в этом нет необходимости.
    В рассматриваемом частном примере на каждом шаге отыскания
    максимума можно использовать метод решения задачи о распределении усилий, представив этот пример в следующем виде:
    Максимизировать Р;- (t>;-) ~f- Qj (wj) -f- Rj (xj)

    (6)

    при ограничениях
    V

    J

    +

    W

    J

    +

    X

    J

    < У'

    (7)

    где Vj, Wj и Xj должны быть неотрицательными целыми числами.
    Необходимо получить решение для каждого значения у = О, 1, . . .
    . • -, LJ.
    Чтобы использовать рекуррентный подход к задаче (6) — (7),
    примем
    Р}(У) = PU(VJ),

    z/ = 0, 1, . . ., LJ,

    9] (У) = max [Q} (w}) + ps (y — w})],

    у = 0, 1, ..., LJ,

    (8)

    (9)

    где максимизация производится только по неотрицательным целым
    значениям Wj ^ у, и
    r j ( y } = mas.[R}(x))-]rq}(y — x)')\,
    х
    )

    z/ = 0, 1, ..., Lh

    (10)

    где максимизация осуществляется только по неотрицательным целым
    значениям Xj ^ у.
    В итоге для каждого j используется PJ (у) из (8) и (9) для отыскания qj (у), а функции г/ (у) при у = О, 1, . . ., L/ определяют по
    функциям qj (у) и (10). Далее преобразуется соотношение (5) и находится решение по соотношению
    gj (п) = max [г,- (у) + gj^ (п — у)],
    у

    / = 1 , 2 , . . ., s,

    (И)

    где п = О, 1, . . ., N и максимизация осуществляется только по
    неотрицательным целочисленным значениям у, удовлетворяющим
    условию у ^ min (Lj, п). Следовательно, для решения этой задачи
    нужно связать s расчетов распределения усилий с общей моделью
    распределения усилий.

    108

    ГЛАВА 10

    10.5. ЦЕЛОЧИСЛЕННОЕ ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ

    Приведенные примеры моделей распределения усилий непосредственно обобщаются следующей моделью:
    s

    при ограничениях

    Максимизировать 2 cjyj
    j=i
    Ьм

    » = 1, 2, ...,*,

    (1)

    (2)

    3=1

    ijj = О, 1, 2, . . . при любом /,

    (3)

    где каждый коэффициент ац и свободный член bt являются неотрицательными целыми числами. Рекуррентное соотношение, которое
    можно применить для этой модели, имеет вид
    F (HI, гс2, . .., 7iJl) = max[cj- + F(ra 1 — а1}, пг — a2j, . .., nk — akj)],

    (4)

    где для каждого i = 1, 2, . . ., k рассматривается nt = О, 1, . . •
    . . ., 6j и максимизация производится по каждому значению / =
    = 1, 2, . . ., s, удовлетворяющему условию а,ц ^ nt при i =
    = 1, 2, . . ., k.
    Этот подход к решению задач ЦЛП, разумеется, совершенно
    не пригоден с вычислительной точки зрения, когда речь идет о задачах реальной размерности, так как нужно определять значение
    функции (4) при каждом допустимом состоянии (п^ /г 2 , . . ., nk).
    В качестве примера приведем случай, когда каждый коэффициент а,/
    может принимать только два значения — 0 или 1, а любой свободный
    член bj = 1. При этих условиях каждая величина nt может принимать также только два значения — 0 или 1. Следовательно, перебор
    (геь п2, . . ., nk) при каждом nt, равном 1 или 0, требует просмотра
    ft
    в общей сложности 2 вариантов. Если k = 100, что характеризует
    задачи линейного программирования не очень большой размерности,
    то существует более 1030 возможных вариантов наборов («j, nz, . . .
    . . ., nk), для оценки которых требуется объем вычислений, намного
    превышающий возможности любой ЭВМ. Поэтому многошаговый
    метод динамического программирования практически нереализуем,
    если только значение k не является очень небольшим. Рассмотрению
    моделей ЦЛП будет целиком посвящена гл. 13 книги.
    10.6. МОДЕЛЬ ЗАМЕНЫ ОБОРУДОВАНИЯ

    В разд. 6.5 на стр. 230 было показано, как можно использовать
    ациклическую сеть для описания задачи определения стратегии
    замены оборудования, минимизирующей затраты в рамках планового
    периода из (N — 1) отрезков. Читателю следует повторить этот
    материал, прежде чем приступить к проработке данного раздела.

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    109

    В разд. 6.5 величина с^ представляла собой полные эксплуатационные затраты, начиная с отрезка i и кончая отрезком /, на котором это оборудование заменяется. Хотя пример разд. 6.5 относится
    к случаю, когда оборудование берется в аренду, модель полностью
    пригодна и в ситуации, когда фирма приобретает оборудование.
    В последнем случае величина ci} представляет собой сумму покупной
    цены и эксплуатационных затрат нового оборудования, за вычетом
    остаточной стоимости этого оборудования на начало отрезка /'.

    Р и с . 10.4. Сеть замены оборудования.

    Задача относится к категории задач о восстановлении в том смысле,
    что определение стратегии замены равносильно составлению списка
    отрезков, в которых производится закупка нового оборудования.
    Примем следующее обозначение:
    fn — стратегия замены, минимизирующая затраты на отрезках п, п + 1, . . ., N — 1, в предположении, что но- (1)
    вое оборудование приобретется в начале отрезка п.
    Тогда отыскивается значение fi и рекуррентное соотношение, соответствующее этому условию, имеет вид

    /„ = min
    h=n+l

    N

    [cnk + Д],

    п = N - 1, N - 2, . . ., 1, (2)

    IN = 0.
    (3)
    Читателю полезно описать словами выражение (2). Соответствующая
    ациклическая сеть при N — 1 = 5 приведена на рис. 10.4.
    К этой задаче можно подойти с несколько иной точки зрения.
    Предположим, что затраты, отвечающие некоторой стратегии замены,
    включают две составляющие:
    Pin — чистая стоимость замены оборудования возраста i ,на
    отрезке п новым оборудованием при условии продажи
    на этом отрезке старого оборудования по его остаточной
    стоимости;
    (I)
    knt — стоимость эксплуатации оборудования на отрезке тг, возраст
    которого в конце этого отрезка равен t.
    Примем, что
    fn (0 — стратегия, минимизирующая затраты на отрезках и,
    . га + 1, . . ., ./V — 1, при условии, что в начале отрезка п
    возраст оборудования равен i годам.
    (II)

    110

    ГЛАВА 10

    Отметим, что смысл, придаваемый индексу в (II), в данном примере отличается от смысла, который придавался ему в предыдущих
    примерах. В самом деле, здесь п относится к отрезку п и всем последующим отрезкам до конца планового периода. (В примерах задач

    Р и с . 10.5. Модель замены оборудования,
    i, п — обозначение узла (г — возраст машины; i_n — номер отрезка)

    управления запасами индекс п относится к шагу, на котором до
    конца планового периода оставалось п отрезков.)
    Если оптимальное решение сводится к сохранению оборудования
    и попадает на отрезок и, то

    /л (О = **

    t+1

    +/„+1 (*Ч 1),

    (III)

    но если оптимальное решение сводится к его замене, то
    fn (0 = Pin + knl + fn+1

    (1).

    (IV)

    Таким образом, имеем
    fn (i) = min [kn. г+i + / n+1 (i + 1), piinn + kni + fn+i (1)],
    n = 1, 2, . . . .
    N-i,
    где
    IN (0 = 0.

    (V)
    (VI)

    Мы ищем значение / 4 (i 0 ), где i 0 — возраст оборудования на начало
    планового периода. Если в это время рассматриваемая единица
    оборудования отсутствует, то величина Pi0i представляет собой просто покупную цену нового оборудования и решение сохранить
    оборудование при п — 1 не имеет смысла.

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    Щ

    Рис. 10,5 представляет собой графическое изображение соотношения (V). В этом примере принято, что N — 1 = 5 и что при п = 1
    оборудование отсутствует. Узлы помечены индексами (i, n), соответствующими индексам, принятым в формуле (V). Читателю следует
    ответить на вопрос: какие дуги отображают решения о закупке
    оборудования, и сравнить относительные достоинства (2) и (V),
    используя рис. 10.4 и 10.5 для обоснования своего мнения.
    10.7. СТРУКТУРА

    МНОГОШАГОВОГО АНАЛИЗА

    Рассмотрев различные примеры применения метода динамического
    программирования, часть которых была тщательно проанализирована, целесообразно дать общую оценку отличительных особенностей
    этого метода. В заключительных разделах этой главы приводится
    общая характеристика моделей динамического программирования.
    Оптимизационные задачи с ограничениями, охватываемые динамическим программированием, по существу содержательно не отличаются от задач, изложенных до гл. 8 и изучаемых в дальнейшем.
    Лишь подход к анализу модели, несомненно, является совершенно
    новым. В основе метода динамического программирования, используемого для решения оптимизационных задач с многими ограничениями и большим числом переменных, лежит разбиение задачи на
    последовательность шагов, на каждом из которых решается оптимизационная задача меньшей размерности. В отличие от этого метода
    в большинстве методов линейного и нелинейного программирования
    предпринимаются попытки решения таких задач путем одновременного учета всех ограничений.
    В методе динамического программирования задача сводится
    к следующему виду:
    I) Управляемые переменные и соответствующие ограничения
    группируются по шагам, и многошаговый процесс принятия решений
    исследуется в определенной последовательности.
    II) Единственная информация о предыдущих шагах, которая
    используется для выбора оптимальных значений переменных на рассматриваемом шаге, заключена в так называемой переменной состояния, представляющей собой иногда n-мерный вектор.
    III) Рассматриваемое решение, принимаемое при заданном текущем состоянии системы, оказывает прогнозируемое влияние на
    состояние системы на последующем шаге.
    IV) Оптимальность текущего решения оценивается в терминах
    прогнозируемого экономического эффекта для рассматриваемого
    шага и всех последующих шагов.
    В отличие от модели линейного программирования, относящейся
    к специальному классу математических моделей, которые позволяют
    получить решение различными методами (среди этих методов самым
    универсальным является симплексный), динамическое программирование представляет собой особый аналитический метод, примени-

    112

    ГЛАВА 10

    мый к самым различным математическим моделям. Существует каноническая форма записи задачи в терминах динамического программирования, наглядно иллюстрирующая перечисленные в п. I) — IV)
    структурные свойства.
    Обозначим символом s некоторое состояние системы и символом
    Sn — множество всех возможных состояний на шаге п. Далее примем, что dn обозначает решение, выбранное на шаге п, a Dn (s) — все
    допустимые значения dn при условии, что система находится в состоянии s. Наконец, пусть функция Rn (s, dn) обозначает непосредственный экономический эффект, достигаемый в результате выбора решения dn при заданном состоянии системы s, a Tn (s, dn) — преобразованное состояние системы на шаге п — 1. Тогда рекуррентное соотношение динамического программирования (РДП) запишется в следующем виде:
    /п (5) = optimum {fin (stdn) -f- /n-i I^n (Mn)]}
    dn в Dn (s)

    при любом s в Snt

    где «optimum» означает максимум или минимум в зависимости от
    постановки задачи. Все рекуррентные формулы в гл. 8—10 имеют
    такой вид. Читателю следует рассмотреть все перечисленные выше
    п. I) — IV) и показать, какое влияние оказывает каждое из указанных в них свойств на вид РДП. Свойство (II) иногда называют марковским. Укажите, какой из пунктов содержит принцип оптимальности, описанный в гл. 8: оптимальная стратегия (программа)
    должна обладать таким свойством, что независимо от того, каким
    образом система оказалась в рассматриваемом конкретном состоянии,
    последующие решения должны составлять оптимальную стратегию,
    привязывающуюся к этому состоянию.
    Нужно учитывать важную особенность РДП. Для принятия оптимального решения на шаге п не требуется значения управляемых
    переменных, обусловливающих эффект /„_i [Tn (s, dn)]. Такой характер рекуррентных соотношений означает, что на каждом шаге оптимизация проводится лишь по отношению к ограниченному числу
    управляемых переменных и в последующих вычислениях используются только значения целевой функции. Именно эта простота
    вычислительной схемы обусловливает привлекательность метода
    динамического программирования. Если пользоваться понятиями
    линейного программирования, то вычисления, выполняемые при
    использовании метода динамического программирования, можно
    рассматривать как последовательное определение значений двойственных переменных. Эта аналогия для примеров, изложенных
    в данной главе, является совершенно точной в силу разъясняемых
    ниже причин.
    Во всех приведенных примерах управляемые переменные, а также
    переменные состояния и шага принимали только целочисленные
    значения. (Задачи такого рода называют задачами дискретного программирования.) Кроме того, процесс принятия решений относился

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    ИЗ

    к конечному промежутку времени или конечному числу шагов.
    Наконец, на результаты и переходы из одного состояния в другое
    не оказывали никакого влияния случайные фактору
    При всех этих допущениях оказалось возможным анализировать
    РДП в терминах задачи отыскания кратчайшего маршрута на ациклической сети, изложенной в гл. 7. Для построения такой сети каждому
    возможному значению s и п в рекуррентном соотношении сопоставляется узел с параметрами Is, n]. Каждому значению dn в Dn (s)
    ставится в соответствие дуга из узла [s, п] в узел [Тп (s, dn), n — 1]
    с весом Rn (s, n). Состояние s системы на последнем шаге определено
    (например,- «конечный запас должен быть равен нулю»). Поэтому
    этот узел рассматривается в качестве конечного пункта сети,
    а функция /n (s) определяет длину кратчайшего (оптимального)
    маршрута из узла [s, n] в конечный узел.
    При описании сетевой задачи в терминах линейного программирования функция /n (s) представляет собой значение двойственной
    переменной в уравнении сохранения потока для узла [s, n]. Разумеется, для решения РДП никогда не возникает необходимость графического изображения ациклической сети, однако сетевая аналогия
    позволяет сделать два важных вывода. Во-первых, анализируя
    сложность соответствующих ациклических сетей, можно оценить
    эффективность вычислительной схемы различных динамических постановок задач. Хотя и приближенно, но обычно достаточно надежно
    можно утверждать, что постановка, которой соответствует сеть
    с минимальным числом дуг, является в этом отношении предпочтительной. (Использование этого признака вполне оправдано, ибо
    при некоторых постановках требуется, выполнение значительного
    объема вспомогательных вычислений для определения цены прохождения дуги, прежде чем применить алгоритм отыскания оптимального маршрута.) .
    Во-вторых, если модель уже описана каким-либо конкретным
    рекуррентным соотношением, то для получения решения не нужно
    находить нового метода. Правда, в задачах динамического программирования, не обладающих свойством целочисленности и не являющихся детермированными, а также не относящихся к конечному
    промежутку времени, возникают дополнительные затруднения, которые изучаются в гл. 11, 12, 17 и 18.
    10.8. СУЩНОСТЬ ДИНАМИЧЕСКИХ ПРОЦЕССОВ

    По самой своей природе метод динамического программирования
    приводит к идее исследования чувствительности решения по отношению к продолжительности планового периода. Рассмотрение различных моделей управления запасами, приведенных в гл. 8 и 9, показывает, что оптимальная стратегия может существенно зависеть от
    продолжительности планового периода. Анализ этой связи приводит
    к нескольким важным выводам.
    8-0734

    114

    ГЛАВА 10

    Прежде всего уточняется понятие стратегии. Отыскивая решение
    рекуррентного уравнения динамического программирования, по
    существу определяют набор оптимальных решений при каждом
    допустимом значении переменной состояния на каждом шаге. Таким
    образом, получают предписание о выборе линии поведения в любой
    возможной ситуации. Рассмотрим модель календарного планирования производства, чтобы выяснить, к каким последствиям приводит
    этот результат. Предположим, что выбрана линия поведения, основанная на допущении, что функции спроса и затрат не меняются
    во времени и что плановый период всегда содержит ./V отрезков,
    относящихся к последующему временному интервалу. Тогда требуется определение оптимального календарного плана для каждого
    состояния s при условии, что до конца планового периода осталось ./V
    отрезков. На каждом отрезке определяется состояние s и выбирается
    соответствующий календарный план. Существенный вывод здесь
    заключается в том, что при рассмотрении оставшихся п отрезков
    единственный фактор, который нужно принимать во внимание,— это
    текущее состояние системы s, а не предшествующие шаги, которые
    привели к этому состоянию. Поэтому если принятое решение не приводит к желаемым результатам, то при принятии следующего решения можно «махнуть рукой на прошлое». В гл. 11 и 12 понятие стратегии будет играть важнейшую роль. Кроме того, в этих главах
    изучается проблема отыскания оптимальной стратегии при условиях,
    когда допущение о неограниченном плановом периоде непосредственно влияет на выбор аппарата решения задачи.
    ' Еще одним существенным понятием является определение формы
    оптимальной стратегии. При удачном представлении динамического
    процесса в виде последовательности шагов иногда удается использовать особые свойства ограничений и целевых функций для определения оптимальной формы стратегии. Одним из примеров такого
    процесса может служить пример замены оборудования, .р/аосмот.рен(
    иый' вгр&зд-. 1СЫ). В любой точке восстановления можно разбить
    промежуток времени на две части: «предшествующую» и «последующую» и рассматривать каждую часть независимо друг от друга.
    Два таких понятия, как определение стратегии и форма оптимальной стратегии, тесно связаны с третьим. Теорема о продолжительности планового периода в случае, когда ее можно применить,
    иногда позволяет получить необходимые данные о влиянии динамических свойств процесса на/ оптимальную стратегию.
    В разд. 9.4 и 9.7 приведены два примера, показывающие, как
    конкретный вид целевой функции позволяет обнаружить свойства
    планового периода. В случае выпуклой функции затрат было показано, что единственным следствием увеличения продолжительности
    планового периода является увеличение значений управляемых переменных. В случае вогнутой функции затрат можно установить длину
    планового периода, соответствующего оптимальной стратегии, не
    обращаясь к периоду, предшествующему точке восстановления.

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    115

    10.9. ВЫЧИСЛИТЕЛЬНЫЕ ВОЗМОЖНОСТИ МЕТОДА
    ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

    При решении задач, изложенных в гл. 8—10, использование метода динамического программирования позволяет достичь весьма существенной экономии по сравнению с методом полного перебора. Эффективность динамического программирования определяется прежде
    всего размерностью переменной состояния, что является одной
    из причин, требующих творческого подхода к постановке задач.
    Неудачная или удачная постановка может решающим образом повлиять на работоспособность вычислительной схемы динамического
    программирования.
    Как показывают приведенные в этой главе примеры, метод динамического программирования можно успешно применять для решения нелинейных целочисленных задач небольшой размерности.
    Поскольку общей канонической формы представления таких задач
    (даже для случая дискретных детерминированных моделей с ограниченным плановым периодом) не найдено, не существует общей
    эффективной программы решения на ЭВМ всех задач динамического
    программирования. Тем не менее вид рекуррентного соотношения
    динамического программирования обычно достаточно прост, в связи
    с чем составление программы решения конкретной задачи на ЭВМ
    не вызывает особых затруднений. Правда, при разработке таких:
    программ приходится преодолевать ряд технических трудностей,
    но они относятся к специфическим особенностям программирования
    для ЭВМ и поэтому здесь не рассматриваются. Достаточно отметить,
    что при программировании большинства практических задач, в которых размерность переменной состояния не превышает двух, не возникает непреодолимых препятствий. Если не считать редких случаев
    (например, модель управления запасами с выпуклой функцией затрат,
    приведенная в разд. 9.3, алгоритм решения которой чрезвычайно
    прост), то для отыскания решения задачи динамического программирования требуется применение ЭВМ. При отсутствии более веских
    причин использование ЭВМ целесообразно уже потому, что освобождает человека от необходимости выполнения однообразных
    и утомительных вычислений.
    В гл. 8—9 вопросы сходимости алгоритмов не возникали, поскольку любая из рассмотренных моделей в сущности сводилась к задаче
    о выборе кратчайшего маршрута. Однако эти вопросы появятся
    в двух последующих главах, где изучаются модели с бесконечным
    плановым периодом и используются методы решения, основанные
    на последовательных приближениях.
    В связи с разнообразием моделей, для решения которых используется метод динамического программирования, не удается найти
    какого-либо универсального метода анализа чувствительности. Большинство факторов, учитываемых при анализе чувствительности
    моделей динамического программирования, оказывают влияние на

    116

    ГЛАВА 10

    несколько ограничений или параметров целевой функции одновременно. Поэтому для каждой конкретной задачи приходится выводить
    особые формулы анализа чувствительности.
    10.10. ОБЛАСТЬ ПРИМЕНЕНИЯ ДИНАМИЧЕСКОГО
    ПРОГРАММИРОВАНИЯ

    Материал, содержащийся в гл. 8—10, можно разбить на две части.
    Одна из них относится к углублению знаний читателя относительно
    явлений, встречающихся в динамических оптимизационных моделях.
    Другая описывает примеры применения метода динамического программирования для решения важных производственных задач.
    Наиболее широко этот метод используется для решения задач пополнения запасов, календарного планирования и задач восстановления,
    включающих замену оборудования. Поскольку в ряде задач динамического программирования фигурируют случайные факторы
    и рассматривается неограниченный плановый период, приведенные
    примеры следует считать лишь иллюстрацией к введению в этот
    метод. В последующих главах содержится еще много примеров
    иного рода, отвечающих более общей трактовке метода.
    В этих заключительных замечаниях стоит повторить соображения, приведенные в начале главы. Практические ограничения,
    обусловленные размерностью переменной состояния, сужают класс
    задач, которые удается решать методом динамического программирования. Лишь в довольно редких случаях все существенные факторы
    экономической задачи достаточно большой размерности удается
    преобразовать таким образом, что численное решение задачи, сформулированной в терминах динамического программирования, оказывается практически возможным. Это обстоятельство не снижает
    ценности метода, оно лишь позволяет провести границу между
    областями практического приложения динамического и линейного
    программирования.
    В частности, многие реальные примеры применения динамического программирования относятся к принятию оперативных решений:
    когда заказывать изделия или материалы для пополнения запасов,
    когда налаживать оборудование, когда заменять оборудование
    и т. п. Большинство таких решений, как правило, относится к компетенции низших уровней руководства. Поэтому практическое использование моделей динамического программирования связано либо
    с применением ЭВМ с целью принятия оперативных решений в реальном масштабе времени, либо с обеспечением руководителей соответствующих уровней правилами или таблицами, основанными на
    результатах вычисления оптимальной стратегии. Основными условиями успешного применения метода динамического программирования являются ограниченная сфера влияния отдельного решения,
    найденного с помощью этого метода, и простота отыскания' такого
    решения. Метод динамического программирования позволяет освобо-

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    Ц7

    дить руководство высших уровней от обязанности оценки огромного
    количества повседневных решений, каждое из которых не оказывает
    принципиального влияния на деятельность организации. Вместе
    с тем этот метод дает возможность руководителю высшего звена
    эффективно осуществлять стратегическое руководство, так как он
    сам выбирает модель, учитывающую наиболее важные, по его мнению, экономические и технические факторы, предоставляя право
    использования этой модели руководителю нижестоящего уровня.
    КОНТРОЛЬНЫЕ У П Р А Ж Н Е Н И Я

    1. Предположим, что ограничение (2) в разд. 10.2 распространено
    S

    на линейное ограничение ^ Hji/j

    = N (где Ht = 1). Измените (5)

    5=1

    соответствующим образом и укажите наибольшее значение у^, которое нужно учитывать при отыскании максимума на шаге /.
    2. Предположим, что известно решение задачи (1) — (3) разд. 10.2
    при заданном значении N и нужно найти решение при значении
    N + 1. Укажите, какие дополнительные вычисления необходимы,
    предполагая, что для получения ответа используется рекуррентное
    соотношение (5).
    3. Задача торговой фирмы «Свежие продукты» (разд. 10.2).
    Предположим, что при отправке яиц в магазин некоторая их доля
    /;- (0 < fj < 1) разбивается при перевозке. Измените соответствующим образом рекуррентное соотношение (5).
    4. Задача торговой фирмы «Свежие продукты» (разд. 10.2). Предположим, что, пользуясь накопленным опытом, владелец фирмы
    установил, что функция прибыли Rj (yj) возрастает при возрастании
    У; до определенного значения, а затем убывает при больших значениях yj (слишком большой запас яиц в магазине приводит к возникновению значительных затрат, связанных с их хранением и сортировкой). Укажите, как следует изменить постановку задачи
    и получающееся в результате ее решения рекуррентное соотношение
    динамического программирования, чтобы во все магазины допускалась отправка менее N яиц (если такое изменение вообще необходимо).
    5. При описании задачи распределения усилий в разд. 10.2 для
    простоты предполагалось, что каждая функция Я,- (у^ является
    неубывающей, целочисленной при yj = О, 1, 2, . . . и удовлетворяет
    условию HJ (0) = 0. Кроме того, было принято допущение HI (j/ t ) =
    — !/i. Объясните, какие усложнения возникнут, если отказаться
    от каждого из этих четырех допущений, и как нужно изменить
    рекуррентную формулу (10) при условии, что в этом действительно,
    имеется необходимость.
    Упражнения 6—12 относятся к численным примерам (12) и (13)
    разд. 10.2 и к решению, приведенному в таблице рис. 10.2.

    118

    ГЛАВА 10

    6. а) Проверьте результаты вычислений, приведенные в таблице рис. 10.2 при / = 2 и п = 3, 4, 5, 6, а также при / = 3 и п =
    = 0, 1, . . ., 8.
    б) Укажите все оптимальные решения при N = 4, 5, 6, 7.
    7. Предположим, что ограничения сверху изменены следующим
    образом: z/i ^ 3, z/2 ^ 3, у3 ^ 2. Найдите все оптимальные решения
    при: а) N = 4, 5, 6, 7, 8; б) N = 9, 10.
    8. Для упрощения изложения материала трем магазинам были
    произвольно присвоены индексы (номера) 1, 2, 3 и к принятой нумерации применялось рекуррентное соотношение (10). Если магазины
    перенумеровать, то вычисления будут выполняться в ином порядке,
    неокончательные результаты не изменятся. Пусть первые два столбца таблицы рис. 10.1 относятся к магазину А, следующие два —
    к магазину В и последние два — к магазину С. Рекуррентное соотношение (10) и результаты, приведенные в таблице рис. 10.2. соответствуют следующим условиям: / = 1 относится к магазину А,
    / = 2 — к магазину В и / = 3 — к магазину С. Примените формулу
    (10) при следующих комбинациях номеров, присваиваемых магазинам:
    а) ;' = ! — магазин А, / = 2 — магазин С, / = 3 — магазин В.
    б) 7 = 1—магазин С, 7 = 2 — магазин В, / = 3 — магазин А.
    в) 7 = 1 — магазин В, 7 = 2 — магазин А, / = 3 — магазин С.
    г) 7 = 1—магазин С, 7 = 2 — магазин А, / = 3 — магазин В.
    д) / = 1—магазин В, / = 2 — магазин С, / = 3 — магазин А.
    9. Предположим, что функция прибыли для 7 = 3 равна R3 (уя) =
    = 5г/з- Используйте рекуррентное соотношение (10) для определения
    всех оптимальных решений при следующих условиях:
    а) N = 4, 5, 6, 7, 8; б) N = 9, 10.
    в) Дайте ответы на вопросы, касающиеся п. а) и б) в случае,
    когда все ограничения сверху на yj сняты.
    10. Решите задачу п. в) упражнения 9, используя рекуррентное
    соотношение (II), приведенное в конце разд. 10.2. Сравните объем
    вычислений, требующийся при использовании формулы (10), с объемом вычислений при использовании формулы (II).
    И. По каждому из указанных ниже пунктов запишите задачу
    определения оптимального размера партии в виде выражений (VI)
    и (VII), приведенных в конце разд. 10.2. Укажите соответствующее
    значение каждой величины RJ. Решите задачу, пользуясь рекуррентным соотношением (VIII). Решите также эту задачу, пользуясь
    формулой (X), и укажите соответствие между формулами (X) и (XI).
    Используйте числовые данные следующих упражнений гл. 9.
    а) Упражнение 13; б) Упражнение 15; в) Упражнение 43, п. е);
    г) Упражнение 14; д) Упражнение 43, п. а).
    12. Предположим, что в примерах (12) — (13) разд. 10.2 введено
    дополнительное ограничение z/j + Зг/ 2 + Уз ^ 4, а ограничение (8)

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    119

    записано в виде неравенства (5). Найдите все оптимальные решения
    при N = 4, 5, 6, 7, 8.
    13. При рассмотрении задачи распределения усилий в разд. 10.3
    для упрощения рассуждений предполагалось, что ограничения (2)
    и (3) являются неравенствами и что каждая функция Kj (УЗ) неотрицательная и целая. Объясните, какие усложнения возникнут, если
    снять все эти допущения, и как это повлияет на вычисление решения
    по рекуррентному соотношению (5).
    14. а) Предположим, что ограничение (2) в разд. 10.3 заменено
    S

    ограничением "У Hj (у^ ^ N, где значения Я,- (у^ — неотрицатель3=1

    ные целые при yj = О, 1, . . . . Укажите, каким образом нужно изменить формулу (5) и вычислительную процедуру.
    б) Предположим, что в задаче (1) — (4) разд. 10.3 введено дополs

    нительное ограничение ^ Я,- (у^) ^ Р, где значения Hj (у^ —
    /=1
    неотрицательные целые при г/7- = О, 1, . . ., а Р — положительное
    целое число. Укажите, как следует изменить рекуррентное соотношение (5), и рассмотрите, как увеличивается объем вычислений.
    15. Пример фирмы «Чудесные химикалии» (разд. 10.4). Представим, что совет директоров фирмы выбрал нового президента, который
    считает целесообразным расширение фундаментальных исследований.
    Пусть у^ тыс. долл. есть размер ассигнований, выделенных отделению / для проведения таких исследований, a Tj (у^ млн. долл.—
    максимальная оценка окончательного эффекта, который, по мнению
    экспертов, получит фирма в результате вложения этой суммы в фундаментальные исследования. Общий фонд ассигнований на фундаментальные исследования выделяется из фондов фирмы, предназначенных на финансирование всех видов НИР—ОКР, а величина yj
    составляет часть от ассигнований, выделенных рассматриваемому
    отделению. Покажите, как нужно изменить постановку задачи (1) —
    {4), чтобы учесть в ней ассигнования на фундаментальные исследования. Укажите также, какие изменения нужно внести в рекуррентное
    соотношение (5) и в задачу (6) и (7). Покажите, как следует изменить
    постановку задачи (8) — (11). (Обязательно определите все принятые обозначения.)
    16. Пример фирмы «Чудесные химикалии» (разд. 10.4). Представим, что один из членов совета директоров фирмы является человеком с консервативными взглядами, настаивающим на том, чтобы
    общая сумма денег, выделяемая на проведение прикладных и поисковых исследований, не превышала V тыс. долл. Покажите, как при
    этом условии следует изменить постановку задачи (1) — (4). Запишите соответствующее рекуррентное соотношение, измените должным
    образом (6) и (7), а также (8) — (11). (Обязательно определите все
    принятые обозначения.)

    120

    ГЛАВА 10

    17. Объясните, как используются линейные свойства целевой
    функции и ограничений в рекуррентном соотношении (4) разд. 10.5.
    Рассмотрите, например, вопрос, почему формула (4) была бы неприs

    годной, если бы целевая функция имела вид ^ cj (Uj) и по крайней
    ;=1
    мере одна из функций с/ (г/,-) была бы нелинейной.
    18. а) Используйте рекуррентное соотношение (4) из разд. 10.5
    для решения задачи
    Максимизировать Зг/j + 4i/ 2 -J- 6г/ 3 + 8г/4 + 6г/5
    при ограничениях

    1?1 + 2z/ 2 + 2у3 + Зу, + iyt < 3,
    где каждое z/7- — неотрицательное целое число.
    б) Насколько уменьшается значение целевой функции, если
    значение постоянного члена в правой части первого ограничения
    равно не 3, а 2? Тот же вопрос для случая, когда постоянный член
    в правой части второго ограничения равен не 4, а 3. Тот же вопрос
    для случая, когда в обоих ограничениях постоянные, стоящие
    в правых частях, уменьшены на 1.
    в) Насколько возрастает значение целевой функции, если значение постоянного члена в правой части первого ограничения не 3,
    а 4? Тот же вопрос для случая, когда постоянный член в правой части
    второго ограничения равен не 4, а 5. Тот же вопрос для случая, когда
    в обоих ограничениях постоянные, стоящие в правых частях, увеличены на 1.
    19. Задача замены оборудования. В обоих указанных ниже пунктах найдите оптимальную стратегию замены, используя рекуррентное
    соотношение (V), приведенное в конце разд. 10.6. (Обязательно
    укажите значения каждой величины pin и knt.) Примите, что замена
    должна быть произведена в начале отрезка 1. Сравните работу алгоритма с рекуррентным соотношением (2).
    а) Задача фирмы «Таксолюкс», приведенная в п. г) упражнения 15
    гл. 6 и упражнения 68 гл. 7.
    б) Задача фирмы «Резвая фреза», приведенная в упражнении 41
    гл. 6 и упражнении 69 гл. 7.
    20. Рассмотрите рекуррентное соотношение динамического программирования, приведенное в разд. 10.7.
    а) Укажите, каким образом каждое из свойств (I) — (IV) влияет
    на вид рекуррентной формулы.
    б) Покажите соответствие между каждым символом в РДП
    и соответствующим символом в рекуррентной формуле (5) разд. 10.2;
    в рекуррентной формуле (10) разд. 10.2; в рекуррентной формуле (5)
    разд. 10.3; в рекуррентной формуле (5) разд. 10.4.

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    121

    в) Начертите ациклическую сеть, соответствующую рекуррентному соотношению (10) разд. 10.2 и числовым данным таблиц рис. 10.1
    и 10.2. [Дайте надлежащие обозначения узлам и ценам дуг, укажите
    смысл всех величин Dn (s) и отобразите все величины Тп (s, d,,).]
    21. Объясните, как вы понимаете следующие термины:
    задача распределения усилий;
    многошаговый анализ;
    задача дискретного программирования;
    стратегия.
    УПРАЖНЕНИЯ НА ПОСТРОЕНИЕ МОДЕЛЕЙ
    И РАЗВИТИЕ ВЫЧИСЛИТЕЛЬНЫХ НАВЫКОВ

    Во многих из приведенных ниже упражнений от читателя требуется построить модель на основе рекуррентных соотношений динамического программирования. Обязательно дайте определения всех
    используемых обозначений и ответы на пять вопросов, сформулированных в конце разд. 10.1. Приведите выражение целевой функции
    для случая, когда до конца планового периода остался один отрезок,
    а также рекуррентное соотношение для шага п. Объясните, с чего
    начинаются и где заканчиваются вычисления.
    22. Задача о ранце (рюкзаке). Д. готовится к длительному
    подъему на опасную вершину. В рюкзаке он может нести груз не
    более W фунтов. Этот груз может включать N видов предметов, причем
    каждый предмет вида } весит Wj фунтов. Для каждого предмета вида j
    альпинист рассчитывает число EJ, определяющее ценность предмета
    этого вида. Так, например, если он кладет в рюкзак пять предметов
    вида 3 и семь предметов вида 9, то «ценность» такого выбора содержания рюкзака составляет 5ES + 1Е$. Сколько предметов каждого
    вида целесообразно положить в рюкзак?
    а) Сформулируйте задачу в терминах динамического программирования. Объясните, почему принятие решения было бы тривиальным, если бы в рюкзак можно было бы паковать не только целые
    предметы, но и их произвольные части. Укажите, каково будет оптимальное решение в каждом случае.
    б) Измените ответ, полученный в п. а), предположив, что альпинист устанавливает ограничение сверху LJ на число единиц по
    каждому виду предметов /, которое он кладет в рюкзак. Объясните,
    почему решение тривиально, если можно брать не только целые
    предметы, но и их любые части. Укажите алгоритм отыскания решения в каждом случае.
    в) Предположим, что альпинист хочет взять самый легкий рюкзак, ценность которого для него не менее Е. Покажите, как нужно
    изменить постановки задач, приведенных в пп. а) и б).
    23. Студент К. заканчивает институт. Чтобы получить диплом,
    он хочет добиться наилучших оценок на выпускных экзаменах.
    Он делит имеющееся у него в конце недели учебное время на 10 от

    122

    ГЛАВА 10

    резков равной длины. Ему надо сдать экзамены по четырем предметам, два из которых он считает легкими, два трудными. По оценке
    студента, он не получит ни одного выпускного балла, если совсем
    не будет заниматься легкими предметами, два балла, если отведет
    на такой предмет один или два отрезка, три балла, если посвятит
    им три отрезка, и четыре балла, если будет заниматься легким предметом четыре отрезка. Аналогичные оценки для трудных предметов
    равны нулю, одному, двум и трем баллам. Кроме того, при изучении
    трудного предмета в течение пяти отрезков он считает, что получит
    четыре балла. Не вдаваясь в вопрос о том, являются ли эти оценки
    излишне оптимистическими, как бы вы посоветовали студенту распределить его время, чтобы максимизировать число баллов, которое
    он может набрать на экзаменах? Постройте соответствующую модель
    динамического программирования и найдите ее оптимальное решение. Какова оценка в баллах одного дополнительного отрезка времени для подготовки? Каковы потери в баллах при условии, что студент
    не будет готовиться к экзаменам в течение одного отрезка?
    24. Приятельница студента К., положение которого рассматривалось в упр. 23, приехала в город, где он учится, и назначила ему
    свидание. Студент пересмотрел свое положение и решил, что для
    получения диплома ему достаточно набрать девять выпускных баллов. Теперь он стремится так распределить свое время, чтобы минимизировать число временных отрезков, необходимых для подготовки
    к экзаменам с гарантией получения не менее девяти выпускных баллов. Сформулируйте стоящую перед студентом задачу в виде модели
    динамического программирования и найдите ее оптимальное решение. (В случае если имеется более одного оптимального распределения временных отрезков, укажите все такие распределения.)
    25. Благотворительное общество «Объединенный фонд» должно
    выделить 10 своих членов для сбора пожертвований на трех фирмах,
    конторы которых расположены в трех крупных административных
    зданиях. По оценке директора, выделив г/, человек на здание /,
    можно добиться получения обязательств на взносы в фонд общества
    общей суммой RJ (у,) сотен долл., где RJ (0) = 0 и
    Д, (1) = 5, R, (2) = 10, Rt (3) = 15, Д 4 (4) = 25, R, (5) = 35,
    Л 2 (1) = 3, Д а (2) = 6, R, (3) = 12, Д 2 (4) = 18, Д 2 (5) = 30,
    Й 3 (1) = 20, R3 (2) = 35, R3 (3) = 45, R3 (4) = 55, R3 (5) - 60,
    R! (6) = 50.
    RZ (6) = 55.
    Д 3 (6) = 65.
    (Никаких дополнительных пожертвований не удастся получить,
    если направить в здание 1 более семи человек, в здание 2 — более
    пяти и в здание 3 — более шести человек.) Сколько членов общества
    нужно направить в каждое здание? Постройте соответствующую
    модель динамического программирования и найдите ее оптимальное

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    123

    решение. Покажите, как изменится решение, если всего для сбора
    взносов направляется 9, 11 или 12 членов общества.
    26. Рассмотрите случай общества «Объединенный фонд», описанный в упражнении 25. Предположим, что у директора фонда не хватает людей и он формулирует задачу следующим образом: минимизировать число членов общества, направляемых для сбора взносов,
    при условии, что в трех зданиях удастся получить обязательства
    на взносы в благотворительный фонд не менее R сотен долл. Сформулируйте задачу в терминах динамического программирования
    и найдите оптимальное решение при условиях: a) R = 80; б) R —
    = 90; в) R = 100.
    27. Рассмотрите еще раз случай общества «Объединенный фонд»,
    описанный в упражнении 25. Предположим, что директор стремится
    выделить не более М человеко-дней на сбор пожертвований в трех
    зданиях. Ему известно, что если направить в любое здание от одного
    до трех человек, то всего для сбора пожертвований потребуется
    1 человеко-день. Если же направить в здание более трех человек,
    то они истратят 2 человеко-дня. Какое количество людей при общей
    численности в 10 членов общества нужно направить в каждое здание
    при условиях: а) М = 3; б) М = 4?
    28. Рассмотрите следующую задачу:
    Максимизировать /?i (j/i) + R2 (г/ 2 ) + ^з (УЯ)
    при ограничениях
    2yi + 3z/2 + 4г/ 3 < W
    каждое г/;- = 0, 1, 2, 3,
    где любое RJ (0) = 0 и

    R, (1) = 3, Rt (2) = 2,
    R, (3) = 8.
    R, (1) = 5, R, (2) = 11, R, (3) = 9.
    Лз(1) = 9, Д 3 (2) = 14, Д 3 (3)=15.
    а) Найдите оптимальное решение при W — 8. Укажите также
    оптимальные решения при Т47 = 6 и И / = 7 и все отличные от найденных оптимальные решения.
    б) Начертите ациклическую сеть, соответствующую использованному рекуррентному соотношению. Проставьте на узлах нужные
    номера и значения переменных на дугах.
    29. Рассмотрите задачу определения оптимального размера партии для случая изделий одного вида, описанную в разд. 1.6. Предположим, что фирма использует N видов изделий и намерена пополнять их запасы, пользуясь правилом выбора оптимального размера
    партии. Примем, что еженедельно фирма потребляет Mj изделий
    вида /, что Kj — постоянные затраты на размещение заказа, GJ —
    покупная цена одного изделия и hj — недельные затраты на хране-

    ГЛАВА 10

    ние одного изделия. Кроме того, положим, что QJ — размер партии,
    пополняющий запас изделий вида j. Средние еженедельные затраты
    по всем видам изделий представляют собой сумму N выражений,
    каждое из которых имеет вид (12) из разд. 1.6. Предположим, что
    фирма устанавливает верхний предел L на среднее значение наличного уровня запасов всех изделий, где изделия каждого вида дают
    составляющую, равную CjQj/2. Покажите, как можно использовать
    постановку задачи в терминах динамического программирования
    для определения оптимального размера партий по каждому виду
    изделий.
    30. Рассмотрите случай фирмы «Большая энергетика», описанный в конце разд. 10.3. Примем s = 8, Kj = /, / = 1, 2, . . ., 8 и
    RI = 16, Д 2 = 28, Д 3 = 45, Я 4 = 48,
    Н& = 65, R6 = 66, R-, = 79, Н8 = 80.
    Найдите оптимальный набор проектов при следующих условиях:
    а) Верхний предел числа проектов N — 4, верхний предел
    ассигнований М = 10. Укажите решение при N = 2 и N = 3.
    Определите также решение при N = 3 и М = 9.
    б) N = 3, М = 11.
    31. Рассмотрите пример фирмы «Чудесные химикалии», описанный в разд. 10.4. Примем s = 4, каждое LJ = 5, N = 10 и
    Pi (Ч) = ajP ( V j ) ,

    где Р (0) = P (1) = P (2) - О, Р (3) = 1,
    P (4) = 8,
    P (5) = 17;
    где Q (0) = 0,

    QJ (u>i) = bjQ (wj),
    x

    C

    Rj ( i) = .M

    г

    Д

    Q (w) = 3 + w,

    w > 1;

    е R

    (°) =°'
    R (!) = 8, Д (2) = 9,
    Л (3) = 9,5, R (4) = 9,75, R (5) = 10.

    Найдите оптимальное распределение ассигнований при следующих условиях:
    а) все uj — bj = Cj =- 1;
    б) я 4 = bi = q = 1, «2 = i 2 = в) a t = 6 2 = с 3 = 1, bi = с2 = и з = 2, с4 = а 2 = &з = 3.
    г) Определите, как повлияет на решение изменение значения N
    в каждом из вышеуказанных пунктов (принять N = 7, 8, 9).
    д) Определите, как повлияет на решение изменение значения N
    в п. а) [принять N = 11].
    е) Определите, как повлияет на решение изменение значения
    всех LJ в пп. а) — в), приняв LJ = 4 для всех /.
    32. Три брата управляют скотоводческой фермой в штате Аризона, принадлажащей их отцу. В начале планового периода продолжительностью в N лет у фермеров имеется S сотен голов скота.
    Затраты на уход за s головами скота и их прокорм в течение года п
    равны сп (s). Если фермеры решат отправить уп голов на продажу
    в конце года и, то они получат Rn (yn) долл. дохода. Число голов

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    125

    в стаде, оставшемся у фермеров, увеличивается в 1,6 раза в течение
    следующего года. (Так, например, если в конце первого года ни одна
    из S голов скота не продана, то в конце второго года число голов
    в стаде составит 1,6 S.)
    Напишите рекуррентное соотношение динамического программирования, с помощью которого можно определить, сколько голов
    скота выгодно продавать ежегодно в течение N лет.
    33. Задача расширения производственной мощности. Фирма
    «Большой Билл» планирует реализацию программы расширения
    производственных мощностей, рассчитанную на период в N лет,
    В начале отрезка 1 производственная мощность фирмы составляет
    с0 единиц. По имеющимся оценкам фирма должна иметь мощность
    не менее Rt единиц на отрезке £, где t = 1, 2, . . ., N. Если фирма
    увеличит свои производственные мощности на xt единиц на отрезке t, то связанные с этим затраты составят Kt (с, xt), где с представляет собой производственную мощность на начало отрезка,
    a xt принимает только целочисленные значения. Если некоторых
    уровней xt достичь невозможно, то соответствующее значение
    Kt (с, х^ можно принять произвольно большим. Предположим,
    что новые мощности вводятся в эксплуатацию настолько близко
    к началу рассматриваемого отрезка, что их можно использовать
    для удовлетворения потребностей Rt. Предположим также, что
    расходы фирмы на эксплуатацию оборудования на отрезке t при
    выпуске R равны Ht (С, R), где С определяет мощность в конце
    отрезка и R ^ С. Наконец примем, что при наличии С единиц
    мощности на конец отрезка только D (С) единиц можно использовать
    в начале следующего отрезка, что обусловлено амортизацией оборудования. Постройте модель расширения производственной мощности
    на основе рекуррентного соотношения динамического программирования.
    34. Акционерное общество «Биржевик» славится своими успехами на бирже, которые обусловлены тем, что маклеры общества
    способны точно прогнозировать цену на отдельные акции. Несмотря
    на это, общество все-таки вынуждено прибегнуть к помощи операционистов для определения оптимальной стратегии покупок и продаж. Предположим, что pt есть цена акций некоторой фирмы на
    отрезке t и что маклеры «Биржевика» знают цены этих акций в течение периода из Т отрезков. Пусть xt число акций, которые «Биржевик» имеет в конце отрезка t, где xt ^? 0. Предположим далее, что
    в начале отрезка 1 «Биржевику» не принадлежит ни одной акции,
    котирующейся на бирже. Общество должно выплачивать сумму
    С (xt — #f_i) при покупке и продаже акций, где С (0) = 0. Общество
    не может заниматься спекуляцией в том смысле, что суммарная
    стоимость купленных акций не должна превышать общей суммы
    наличных денег, которой располагает общество (где в начале отрезка 1 эта сумма равна М), а также не имеет права продавать акции,
    которыми не владеет в начале соответствующего отрезка.

    126

    ГЛАВА 10

    Сформулируйте задачу в терминах динамического программирования при следующих предположениях:
    а) Общество «Биржевик» стремится максимизировать общую сумму наличных денег к концу планового периода.
    б) «Биржевик» приписывает цену vt (dt) сумме наличных денег dt
    на отрезке t, изымаемой для выплаты дивидендов, и стремится
    максимизировать vt (dt) в пределах всего планового периода.
    35. Диспетчер транспортного агентства должен
    обеспечить
    доставку xt грузов, каждый из которых занимает st единиц объема,
    и хг грузов, каждый из которых занимает s2 единиц объема. (Таким
    образом, общий ежедневный объем доставляемых грузов равен
    s±Xi + s 2 x 2 .) В его распоряжении имеется N различных автомашин.
    Емкость машины i составляет Ct единиц, а стоимость ее эксплуатации — EI. (Предположим, что С4 + . . . + Сп > s^ -f- s2a;2 и что
    имеется допустимое решение.) Диспетчер стремится выбрать автомашины для доставки всех грузов таким образом, чтобы минимизировать эксплуатационные затраты. Сформулируйте проблему принятия решения в виде модели динамического программирования
    и укажите, каким образом рекуррентная формула позволяет выбирать машины оптимальной емкости и распределять между ними
    грузы.
    36. Задача автомобильной компании «Гигант» (разд. 2.6). Сформулируйте оптимизационную задачу на основе рекуррентного соотношения динамического программирования.
    37. Рассмотрите случай спартанской армии, описанный в упр. 31
    гл. 2. Сформулируйте оптимизационную задачу, воспользовавшись
    рекуррентным соотношением динамического программирования.
    ДОПОЛНИТЕЛЬНЫЕ

    УПРАЖНЕНИЯ

    В целом ряде приведенных ниже упражнений от читателя требуется построить модель на основе рекуррентного соотношения динамического программирования. Читателю следует обязательно определить значение всех используемых обозначений и дать ответы на
    пять вопросов, приведенных в конце разд. 10.1. Запишите выражение оптимизируемой функции для случая, когда до конца планового
    периода остается один отрезок, и рекуррентную формулу для шага п.
    Объясните, с чего надо начинать и чем заканчивать вычисления.
    38. Задача выбора места или времени производства (разд. 1.6).
    Рассмотрите модель, описанную в разд. 1.6:
    N
    £4

    Минимизировать ^ ~
    3=1

    при ограничениях
    2 X] = D

    и

    все Xj > О,

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    127

    где все Cj > 0. Используйте рекуррентное соотношение динамического программирования, чтобы получить результат (11), т. е. при
    заданных значениях ж ь ж 2 , . . ., xt_i соответствующее оптимальное
    значение xt = ct (D — xt — . . . — xt-i)/(ct + CN)39. Рассмотрите задачу
    Максимизировать J£L
    . £L
    ...££.
    c
    C
    C
    l

    2

    N

    при ограничениях
    N

    2 Xj = D и все Xj > 0,
    где все с;- > 0. Используйте постановку задачи в терминах динамического программирования для определения вида оптимального
    решения. Укажите зависимость оптимального значения целевой
    функции от D.
    40. Рассмотрите задачу
    s

    Максимизировать 2 Rxj
    3=1

    при ограничениях
    s

    2 Xj — N,

    причем все Xj — неотрицательные целые.

    Заметим, что все функции, входящие в целевой функционал,
    идентичны.
    а) Предположим, что s является степенью 2 (например, 4, 8,
    16, 32, ...). Найдите способ вычисления оптимального решения,
    пользуясь методом динамического программирования, не требующим
    вычислений gj (п) при всех значениях / = 1, 2, . . ., s.
    б) Как нужно изменить подход, предложенный в п. а), чтобы
    его можно было использовать при любом значении s?
    41. Предположим, что законодательное собрание штата состоит
    из R членов. Штат административно разделен на s округов. Население округа / составляет PJ человек, s < R. При строго пропорциональном представительстве округ / выбирает Rlpj == г,- членов
    законодательного собрания, однако такое распределение может
    оказаться нереализуемым, поскольку г/ может быть нецелым числом.
    Необходимо найти такое распределение представительства г// от
    округов 7, / = 1, 2, . . ., s, чтобы минимизировать максимальное
    отклонение yj от г,-, т. е. минимизировать [max (yi — гь . . ., ys—rs)].
    а) Постройте модель на основе рекуррентного соотношения динамического программирования.
    б) Используйте эту модель для отыскания решения при R — 4,
    s = 3, rl = 0,4, r 2 = 2,4, г э = 1,2. Рассмотрите, имеет ли смысл
    решение, если учесть содержание задачи.

    ГЛАВА 10

    42. Рассмотрите задачу выбора величин у; = 1 , 2 , . . . , s, таких,
    что достигается
    max{min [Ri (у}), Я 3 ( у г ) , . . ., Rs (ys)],
    при ограничениях
    s

    11 Н](Уз)-^М,

    у} = 0,1,2,...

    при любом /,

    где все Hj (у3) — неубывающие целочисленные функции при yj =
    = 0, 1, . . ., удовлетворяющие условию Hj (0) = 0. Найдите рекуррентное соотношение динамического программирования, позволяющее решить эту задачу.
    43. Минимаксный маршрут на сети. Студент из Англии, обучающийся в США по обмену, купил подержанный автомобиль и собирается провести лето, путешествуя из Нью-Йорка в Сан-Франциско.
    Для упрощения условия задачи примем, что он может выбрать
    маршрут, пользуясь той же картой, которая показана на рис. 8.1.
    Студента беспокоит возможность отказа двигателя в случае выбора
    маршрута, который проходит между двумя такими городами, где
    летом бывает сильная жара. По имеющимся у студента оценкам величина c t j равна максимальной температуре, которая может встретиться при проезде из штата i в штат /. Он стремится выбрать маршрут, минимизирующий максимальную температуру в течение всей
    поездки.
    а) Сформулируйте задачу в терминах динамического программирования и примените рекуррентную формулу к величинам с г / ,
    заданным на рис. 8.1.
    б) Запишите рекуррентную формулу в достаточно общем виде,
    чтобы ее можно было применить к ациклическим сетям, подобным
    сетям, рассмотренным в разд. 7.7 (иными словами, выразите это
    соотношение в виде, аналогичном выражениям (1) и (2) разд. 7.7).
    44. Следующий за оптимальным маршрут на сети. Рассмотрите
    задачу отыскания кратчайшего маршрута, изложенную в разделах 7.6 и 7.7. Сформулируйте эту задачу в терминах динамического программирования и найдите следующий по протяженности маршрут из источника в сток. Для упрощения задачи примите,
    что сеть ациклическая и что кратчайший маршрут является единственным. Если вам удастся предложить более одного метода решения, то укажите все альтернативы. [Указания: следующий за оптимальным маршрут должен отличаться от кратчайшего хотя бы одной
    дугой. Докажите также, что следующий за оптимальным маршрут
    из узла / в сток должен проходить по некоторой дуге (/, k),
    а затем либо по самому короткому, либо по следующему за ним
    маршруту из узла k в сток; кроме того, укажите вытекающее из
    этого следствие.] Какие трудности возникают при решении этой
    задачи из сети, содержащей циклы?

    ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ

    <|29

    45. Рассмотрите задачу отыскания кратчайшего маршрута из
    источника в сток, изложенную в разд. 7.6 и 7.7. Сформулируйте
    задачи отыскания кратчайшего маршрута из источника в сток в терминах динамического программирования при условии, что этот
    маршрут содержит в точности К дуг и в предположении, что по
    крайней мере один такой маршрут существует. (Может ли этот
    маршрут содержать контур или цикл?)
    46. Задача о ранце. Рассмотрите оптимизационную задачу,
    приведенную в упражнении 22. Предположите, что для предметов
    вида k наибольшее значение отношения EJ/WJ равно Ehlwh. Докажите, что существует некоторое значение величины W*, такое, что
    если ограничение по весу равно W ^ W*, то имеется оптимальное
    решение, включающее по крайней мере один предмет вида k.
    47. Замена и ремонт оборудования. Рассмотрите модель, приведенную в разд. 10.6. Предположим, что имеется возможность замены
    либо ремонта оборудования в течение любого отрезка после его
    приобретения на отрезке 1 и до отрезка N, когда заканчивается
    полный срок амортизации. Примем далее, что продолжительность
    ремонта пренебражимо мала по сравнению с продолжительностью
    отрезка. Следовательно, машина, отремонтированная в начале отрезка, уже может эксплуатироваться в течение всего этого отрезка.
    Рассмотрим машину, купленную в начале отрезка п, отремонтированную в начале отрезков ^ tp. Предположим, что соответствующие затраты равны
    On (re, *i) + On (ti, tz) + . . . + On (tp.i, tp) + bnh (tp).
    Величина ап (h, /), где п^.Тг<Ц, представляет собой затраты
    на эксплуатацию машины в течение всех отрезков от h до / плюс
    затраты на ее ремонт в начале отрезка / при условии, что машина
    была куплена на отрезке п и отремонтирована в последний раз на
    отрезке h (либо была куплена при h = п). Величина Ъп^ (tp) соответствует чистым общим затратам, включающим покупку машины
    на отрезке п плюс эксплуатационные затраты на отрезках от tp до /г,
    т. е. между последним ремонтом и продажей, за вычетом ее остаточной стоимости на отрезке k. Величина bnh (п) представляет собой
    затраты на покупку машины и ее эксплуатацию на отрезках от п
    до k при условии отсутствия ремонтов.
    Покажите, как можно использовать рекуррентное соотношение
    динамического программирования для вычисления значений c njt ,
    которые затем соответствующим образом используются в рекуррентной формуле (2) разд. 10.6.
    48. Рассмотрите классическую транспортную задачу, подобную
    задаче, приведенной в разд. 6.2, где число поставщиков т = 2
    и суммарная мощность поставщиков равна суммарному спросу
    потребителей [соотношение (6)]. Предположим, что транспортные
    затраты на доставку хц единиц груза из пункта отправления j

    130

    ГЛАВА 10

    в пункт назначения j описываются нелинейной функцией сц (хц).
    Примем, что все величины Sj и DJ целые, и наложим такое же ограничение на все хц.
    а) Сформулируйте задачу в терминах рекуррентного соотношения динамического программирования. (Указание: для получения
    одномерной переменной состояния можно использовать равенство
    общей мощности поставщиков общему спросу потребителей.)
    б) Покажите, как изменится постановка задачи п. а) при т = 3.
    49. Задача владельца ресторана. Рассмотрите случай фирмы
    «Общепитторг», описанный в упражнении 48 гл. 6. Сформулируйте
    оптимизационную задачу в терминах рекуррентного соотношения
    динамического программирования.
    50. Задача о раскрое материала. Рассмотрите случай фирмы
    «Паутинка», которой нужно разрезать большой рулон шириной
    70 см на меньшие рулоны шириной 22, 20 и 12 см. Предположим,
    что при решении модели линейного программирования в рассматриваемое подмножество включены все допустимые варианты. Пусть
    z/j, г/2 и г/з—полученные в результате оптимальные значения двойственных переменных для ограничений, отвечающих рулонам
    шириной 22, 20 и 12 см соответственно. Примените теорему двойственности и рекуррентное соотношение динамического программирования, включающее величину г/ г , для проверки оптимальности
    решения задачи линейного программирования. (Может ли какойлибо вариант, не включенный в подмножество, улучшить найденное
    решение задачи линейного программирования?)

    ГЛАВА 11

    Принятие решений при бесконечном
    плановом периоде
    11.1. МОДЕЛИ С БЕСКОНЕЧНЫМ ПЛАНОВЫМ ПЕРИОДОМ
    Не вызывает сомнения, что большинство принимаемых решений,
    если не все, представляют собой часть бесконечной цепи действий.
    Сделанный ранее выбор влияет на настоящее, принимаемые в данный момент решения влияют на будущее и т. д. В свете такого подхода все модели можно рассматривать как элементы бесконечного
    планового периода. Будущее, находящееся за пределами заранее
    установленного планового периода, в некоторых рассмотренных выше
    динамических моделях попросту не принималось во внимание;
    иногда (например, в гл. 9) удается доказать теорему о длительности
    планового периода, которая показывает, что такая процедура может
    обеспечить оптимальность текущих решений. В других моделях
    попытка учесть будущее связана с выбором тех или иных «конечных»
    условий (таких, например, как установление нижних границ для
    численности работающих или для производственной мощности).
    В отличие от этих моделей в настоящей главе длительность планового периода предполагается бесконечной.
    Для того чтобы в моделях с бесконечным плановым периодом
    получить определенные решения, необходимо дополнительное ограничительное допущение, которое, вообще говоря, можно назвать
    допущением о стационарности. В простейшем случае предполагается,
    что все функции экономического эффекта, выбираемой программы
    и внешние условия (например, объем спроса) для каждого из отрезков одинаковы. Все приводимые ниже примеры относятся к этому
    случаю, и необходимо учитывать, что получаемые результаты основаны на таком допущении о стационарности. В гл. 11 и 12 рассматриваются только детерминированные модели; вероятностным моделям посвящены гл. 17 и 18, где постулируется стационарный характер вероятностных закономерностей. При использовании более
    сложных методов анализа могут быть получены решения и для таких
    ситуаций, где допущения о стационарности являются не столь
    сильными, например для случая циклического изменения таких
    показателей, как сезонный спрос (условный пример приведен в конце
    гл. 12).
    Поскольку в реальной действительности стационарность редко
    сохраняется в течение длительных периодов времени, то возникает
    следующий вопрос: имеют ли практическое значение модели, в которых предполагается стационарность в течение бесконечного планового периода? Наш ответ будет утвердительным, что иллюстрирует
    рассмотрение ситуаций двух типов.

    9*

    132

    ГЛАВА 11

    В ситуациях первого типа динамические оптимизационные модели
    используются для улучшения текущих оперативных решений —
    скажем, решений о пополнении запасов и разработки графиков производства. В качестве примера рассмотрим фирму, осуществляющую
    ежедневный контроль своих запасов и заказывающую некоторые
    изделия раз в несколько недель, когда уровень соответствующего
    запаса достигнет установленного «критического» значения. Пусть,
    как это часто бывает в действительности, спрос на данное изделие,
    а также затраты на его закупку и хранение являются устойчивыми
    в течение периода, не меньшего 12 месяцев. Тогда для фирмы целесообразно сохранить действующие правила пополнения запасов еще
    на 3—6 месяцев, а в конце этого срока пересмотреть их на основе
    нового 12-месячного прогноза. (Такой способ действий оправдан
    и другими важными соображениями. Если фирма имеет запасы
    сотен видов различных изделий, частое изменение правил пополнения
    запасов каждого вида изделий требует слишком больших затрат
    времени и вызывает отрицательный эффект —• связанные с ним
    издержки могут намного превысить экономию, вызванную улучшением решений.)
    Как же должна фирма устанавливать правило пополнения запасов для каждого конкретного вида изделий? Один из возможных
    подходов заключается в использовании методов, описанных в гл. 8
    и 9: для планового периода длительностью 365 дней определяются
    минимальные затраты fN (i) и оптимальная программа для исходного
    уровня запасов i, а затем в течение нескольких первых месяцев
    применяются правила пополнения запасов, установленные для N =
    = 365. Однако модель с бесконечным плановым периодом, основанная на допущении о стационарности, может дать превосходные
    результаты и, как правило, требует намного меньшего объема вычислений.
    В соответствии с этим одно из оснований для использования стационарной модели с бесконечным плановым периодом состоит в том,
    что при выполнении текущих операций в начале планового периода
    такой подход является эффективным и относительно простым способом получения оптимальных решений.
    К ситуациям второго типа относится использование динамических оптимизационных моделей при принятии повторяющихся важных решений о распределении капитальных вложений, например
    в случае замены дорогостоящего оборудования. Крупные машинные
    агрегаты иногда заменяются не чаще чем раз в 15—20 лет. В связи
    с этим к моменту очередной замены, вероятно, появятся совершенно
    новые типы оборудования. Каким же образом принимать текущее
    решение о капиталовложениях? Разумеется, одна из возможных
    альтернатив состоит в том, что необходимость замены оборудования
    попросту не учитывается. Как очевидно из следующего далее примера, который взят из реальной действительности, такой подход
    может ввести в заблуждение и оказаться весьма рискованным.

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    133

    Одна из фирм пищевой промышленности столкнулась с наличием
    «узкого места» в производстве. Возможны два пути разрешения
    периодически возникающих трудностей: либо накопление в течение
    периода затишья достаточных запасов продукции для покрытия
    спроса в «часы пик», либо приобретение нового оборудования для
    увеличения производственных мощностей. Если сравнивать прирост
    затрат в связи с увеличением запасов только с начальной стоимостью
    дополнительного оборудования, приобретение последнего представляется предпочтительным. Если же учесть и затраты на будущие
    повторные замены оборудования, его приобретение покажется гораздо менее привлекательным — даже при оптимистической оценке
    затрат, связанных с последующими заменами.
    Таким образом, вторым доводом в пользу применения стационарных моделей с бесконечным плановым периодом является то
    обстоятельство, что в ситуациях с регулярно повторяющимися во
    времени капиталовложениями использование подобного подхода
    может привести к лучшим решениям, чем полной отказ от учета
    будущего.
    Оптимальное поведение при стационарности. Сделав допущение
    о стационарности, можно интуитивным путем прийти к раскрытию
    содержания такого понятия, как «принятие текущего решения
    в условиях бесконечного планового периода». Однако читатель,
    возможно, удивится, узнав, что интуиция способна оказать лишь
    ограниченную помощь при выяснении способа определения оптимального решения.
    Для иллюстрации рассмотрим вначале модель динамического
    программирования с конечным плановым периодом. В начале любого
    отрезка необходимо знать лишь состояние системы и остающееся
    число отрезков. Об оптимальности программы можно судить по
    сумме конечной последовательности эффектов. Теперь перейдем
    к бесконечному числу отрезков; по определению, «оставшееся число
    отрезков» здесь всегда одинаково, и любая программа, или стратегия, применяемая в течение всего планового периода, обусловливает
    бесконечную последовательность значений эффекта. Поскольку для
    любой стратегии эта последовательность растет с увеличением планового периода, необходим способ сравнения стратегий. Разумеется,
    если одна из стратегий обеспечивает больший эффект, чем другая
    для любой фиксированной длительности планового периода, проблема сравнения не вызывает затруднений. Однако одна и та же стратегия обычно представляется лучшей для одной длительности планового периода и худшей — для другой, так что решение ни в коей
    мере нельзя считать очевидным. Следовательно, при бесконечном
    плановом периоде возникают два важных вопроса выбора оптимального решения:
    I) Каким критерием воспользоваться для оценки сравнительной
    предпочтительности различных бесконечных последовательностей
    значений эффекта?

    134

    ГЛАВА 11

    II) Можно ли в условиях бесконечного планового периода считать оптимальными только стационарные стратегии, т. е. стратегии,
    зависящие исключительно от состояния системы в настоящий момент?
    В настоящей главе внимание сосредоточено на вопросе I). Критически рассматривается несколько часто применяемых критериев
    оценки бесконечных последовательностей. Будет показан также
    способ использования этих критериев применительно к простой,
    но важной модели восстановления. При анализе решения этой модели
    читатель обнаружит несколько численных методов последовательного приближения, применимых и к обобщенным оптимизационным
    задачам с бесконечным плановым периодом.
    В гл. 12 рассматривается большой класс моделей, для которых
    ответ на вопрос II) положителен, т. е. всегда можно отыскать такую
    стационарную стратегию, которая является оптимальной. Для разработки такой стратегии необходимо знать только текущее состояние
    системы, а не последовательность событий, приведших к этому
    состоянию. Таким образом, мы будем принимать одно и то же решение всякий раз, когда придем к тому же состоянию. В частности,
    в гл. 12 изучается метод построения оптимальной стационарной
    стратегии. Построение соответствующих правил или таблиц обеспечивает возможность удобного их применения в рамках динамического программирования для принятия текущих решений.
    11.2. ТОНКОСТИ, СВЯЗАННЫЕ С ОЦЕНКОЙ БЕСКОНЕЧНЫХ
    ПОСЛЕДОВАТЕЛЬНОСТЕЙ

    Возможно, читатель удивится, узнав, что деловые люди, экономисты и математики уже несколько столетий спорят о методах оценки
    бесконечных последовательностей значений эффекта. Приводимые
    ниже примеры выявляют причины этих споров, и следует четко
    разъяснить экономический смысл примеров и их важность с точки
    зрения теории управления.
    Опыт показал, что большинство лиц, принимающих решения,
    не способны на основе интуиции давать непротиворечивые оценки
    сравнительной предпочтительности различных бесконечных последовательностей значений эффекта. Вследствие этого большинство
    бизнесменов прибегают к формулам, дающим возможность выполнить хотя бы предварительный отсев или ранжирование альтернативных вариантов. Мы также используем формулы, позволяющие
    преобразовать бесконечную последовательность значений эффекта
    в одно число, характеризующее «относительное качество» соответствующего варианта. Однако, прежде чем приступить к этому,
    мы хотим убедиться в том, что читатель разбирается в некоторых
    существенных вопросах, имеющих отношение к различным методам
    выбора одной из бесконечных последовательностей. Только обладая
    такими познаниями, читатель сможет оценить как сильные стороны,
    так и ограничения простых в приложении формул.

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    135

    Приводимое далее обсуждение не может служить исчерпывающим
    обзором осложнений, возникающих в связи с использованием бесконечных последовательностей, а также предлагаемых способов
    их разрешения. Мы надеемся лишь на то, что приводимые примеры
    заставят читателя в дальнейшем проявлять осторожность и воздержаться от некритического принятия, казалось бы, заманчиво простых решений.
    В настоящем разделе рассматриваются два вопроса, являющихся
    основными при динамической постановке оптимизационных проблем:
    I) В каких случаях формула оценки является адекватной для
    сравнения различных стратегий?
    II) Всегда ли такая формула позволяет свести бесконечную
    последовательность к одному числу, которое можно использовать
    в качестве основы для сравнения?
    Эти вопросы и рассматриваются далее весьма подробно, поскольку связанные с ними проблемы могут быть чрезвычайно трудными.
    Анализируются три «критерия качества». Первым из них является
    средний эффект за отрезок. В практике этот критерий возникает
    чаще всего в тех случаях, когда экономический эффект измеряется
    уровнем затрат. Тогда рекомендуется следующее правило выбора:
    избирать следует вариант, которому отвечают наименьшие средние
    затраты за отрезок. Второй критерий именуется интегральным
    эффектом, дисконтированным к настоящему моменту времени,
    или же интегральным дисконтированным эффектом. Как читатель
    вскоре увидит, при использовании этих двух критериев не всегда
    выбираются одинаковые стратегии — иногда возникают технические
    трудности весьма неприятного характера.
    Третий критерий именуется эквивалентным средним эффектом 1).
    Вероятно, его идея окажется новой для читателя; она имеет большое
    значение в исследовании операций, поскольку обеспечивает математическую увязку двух других упомянутых выше критериев.
    При использовании этого критерия часто удается определить вид
    оптимальной стратегии; затем, располагая этим результатом, можно
    вычислить конкретные численные значения — либо среднего дохода
    за отрезок, либо интегрального дисконтированного эффекта.
    Еще одним из критериев является внутренняя норма эффективности, которая, к сожалению, часто используется в деловой практике. Здесь этот критерий не рассматривается, потому что такой
    подход часто приводит к неправильным решениям.
    При изучении приведенных ниже численных примеров читатель
    обнаружит, что большинство необходимых для них алгебраических
    преобразований уже выполнено. При первом чтении следует без
    доказательства принять, что формулы являются правильными —
    экономическое содержание этих примеров не связано с выполняемыми
    L
    ) Этот критерий в известной мере аналогичен широко применяемому
    в отечественной практике критерию «приведенных затрат».—• Прим. перев.

    ГЛАВА 11

    136

    в них алгебраическими преобразованиями. Позже читатель может
    возвратиться к ранее прочитанному материалу и проверить, сумеет
    ли он вывести формулы самостоятельно.
    Полезность денег. Часто приходится слышать, что доллар, которым располагают в настоящий момент, через год будет стоить больше
    доллара. Почему? Эта формулировка опирается на несколько соображений. Так, иногда обнаруживается, что простая «полезность»
    или «личная ценность» доллара выше в настоящий момент, чем
    спустя некоторое время. Предположим, что фирма в течение 25 лет
    регулярно выплачивает акционерам дивиденды раз в квартал.
    С большим нежеланием такая фирма пойдет на отказ от очередной
    выплаты дивидендов, даже обещая выплатить их позже, причем,
    быть может, с процентами. Замеченная разница между полезностьюденежных поступлений и затрат в разные моменты времени и является основой проблемы соизмерения бесконечных последовательностей
    значений эффекта.
    По существу, точно такая же проблема соизмеримости возникает
    и в моделях с конечным плановым периодом. В условных примерах
    задач динамического программирования, приведенных в предыдущих главах, различные стратегии, или программы, обусловливали
    и разные временные последовательности прибылей или затрат.
    Однако трудности соизмерения ранее просто не принимались во
    внимание. Поскольку при конечном плановом периоде всегда можносуммировать прибыли или затраты за весь период, имеющаяся целевая функция позволяла исчислить для каждой стратегии одно конечное число, что и упрощало оптимизацию. Однако теперь мы более
    не можем игнорировать трудности соизмерения, даже если бы мы
    этого и хотели. Поскольку суммирование осуществляется на бесконечном плановом периоде, общая сумма эффекта для большинства
    стратегий также будет бесконечной. Нетрудно понять, что при
    сравнении нескольких бесконечных последовательностей значений
    эффекта любой безыскусственный подход окажется успешным только
    в простейших случаях. Так, какой-либо метод сравнения стратегий
    Отрезок

    Р и с . 11.1.

    Стратегия

    1

    2

    3

    4

    5

    А
    В
    С
    D
    Е
    F
    G

    3
    3
    1
    2|
    1
    1
    4

    2
    1
    6
    2
    3
    1
    0

    1

    3
    1
    1
    2
    3
    1
    4

    2
    3
    6
    2
    1
    1
    0

    3

    -1

    2
    1
    1
    0

    6

    1
    1
    —1
    2
    3
    1
    0

    ...

    . . .

    Примеры бесконечных последовательностей значений

    эффекта.

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    137

    для любой фиксированной конечной длительности планового периода
    не всегда приносит результаты; продемонстрируем это на следующем
    примере.
    Пусть требуется выбрать один из приносящих прибыль альтернативных вариантов, которые на рис. 11.1 характеризуются показателями эффекта (в данном случае приравненными прибыли) для
    последовательности временных отрезков, начинающейся с настоящего момента. На первом отрезке варианты А и В дают прибыль
    3 единицы, вариант G — 4 единицы и т. д.; на втором отрезке
    вариант А дает прибыль 2 единицы, вариант В — всего лишь 1 единицу и т. п.
    Разумно сразу же исключить вариант F, поскольку вариант А
    для каждого из отрезков обеспечивает лучшие (или по меньшей
    мере не худшие) результаты — иными словами, А доминирует над F.
    Вероятно, можно также обосновать исключение варианта Е,
    поскольку вариант D для любого отрезка обеспечивает большую
    совокупную прибыль, т. е. прибыль с начала планового периода.
    Вместе с тем нельзя исключить вариант G. Хотя совокупная
    прибыль на конец отрезка 2 при этом варианте не столь велика, как
    аналогичная величина в вариантах А и В, прибыль для отрезка 1
    в случае варианта G определенно превышает прибыль всех остальных вариантов. Если требуется максимизировать прибыль текущего
    отрезка, вариант G является оптимальным.
    По какому принципу выбрать лучший из вариантов А, В, С и D?
    На конец отрезка 2 наиболее эффективным представляется вариант С.
    Для всех четных отрезков вариант D обеспечивает большую совокупную прибыль с начала планового периода, чем вариант В. Для отрезка 3 вариант В обеспечивает совокупную прибыль, равную 7 едини2
    цам — по сравнению с 6 единицами для вариантов А и С и 6 / 3 единицы для варианта D. Более того, вариант В «опережает» варианты А,
    С и D по состоянию на конец каждого отрезка с индексом (3 + 6и),
    где п = О, 1, 2, . . . . Выбор из числа подобных последовательностей в моделях с бесконечным плановым периодом является скорее
    правилом, чем исключением.
    Критерий среднего эффекта за отрезок. Утверждать, что один
    из вариантов А, В, С, D или G является лучшим, можно только
    на основе дополнительных допущений. Так, можно дополнительно
    постулировать, что для нас имеет одинаковое значение получение
    единицы эффекта на любом из отрезков. Это означает, что получение
    эффекта на более раннем отрезке не дает каких-либо преимуществ
    по сравнению с его получением позже. К какому решению приводит
    это допущение?
    При сделанном допущении целесообразно рассмотреть средний
    эффект за отрезок при бесконечно возрастающем числе отрезков,
    выбирая вариант с наибольшим средним эффектом. Для варианта А
    последовательность таких показателей имеет следующий вид: 3/1,
    (3 + 2)12, (3 + 2 + 1)/3, . . .; для варианта В: 3/1, (3 + 1)/2,

    138

    ГЛАВА 11

    (3 -f- 1 -f- 3)/3 и т. д. Результаты подобных вычислений приведены
    в таблице рис. 11.2. Как показано далее для вариантов А, В, С и D,
    средний эффект за отрезок стремится к 2, а для варианта G — к 11/3.
    Иными словами, при достаточно большом числе отрезков для вариантов А, В, С и D средний эффект будет сколь угодно близок к 2, а для
    Отрезок
    Стратегия

    1

    2

    А

    3

    4

    В

    3

    2

    С

    1

    '1

    D
    G

    1

    2

    4

    3

    1

    4

    5

    1

    2

    2

    4
    2

    44
    4
    2

    Т
    2

    4

    Т

    2

    1

    6

    2

    6

    t
    2

    ~5
    1
    2

    2
    2

    8

    7

    п

    1

    •**

    2

    ...

    l

    А

    2

    4

    9

    8"

    2

    4

    4
    4 2! 4 4
    4 'т *т 4 4
    22

    2

    2

    Т

    Й

    Р и с . 11.2. Средний эффект за отрезок.

    варианта G — к 1V3. Следовательно, если дополнительно сделать
    особое допущение об отсутствии временной предпочтительности
    эффекта, варианты А, В, С и D представляются одинаково привлекательными (несмотря на то, что для любого конечного планового
    периода их эффективность различна), а вариант G — менее привлекательным.
    Как читатель может проверить, общие члены последовательностей средних эффектов за отрезок можно представить следующим
    образом:
    А:
    В:

    1 + Зге' 2 + Зге' 3 +3ft
    3 -f 4п 4 -f 4га
    1 + 2л' 2 + 2ге

    ...,

    гага

    0
    1 2
    U A
    ' > Z' ••"

    и = 1,2,3, ...;

    + 3^'
    4 + 4ге

    и, А , ^,


    о \1, р^, . . . ,
    ге и,

    1 + 6л 7 + бп. 6 6
    +"
    1 + Зл' 2 + Зге' 3+ 3л'

    D:



    4 + 4ге

    4

    +

    4п

    п.

    П 1 9.. .

    V)

    (II)
    (III)

    (IV)
    (V^

    Таким образом, при тг ->• схэ любой член последовательности
    стремится к 2 для вариантов А, В, С и D и к 1V3 — для варианта G.

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    139

    Наиболее очевидным недостатком использования среднего эффекта за отрезок в качестве критерия выбора для бесконечного планового
    периода является полная нечувствительность этого критерия к эффекту за конечное число отрезков. Для иллюстрации предположим, что
    имеется вариант (будем называть его «альтернативным»), показатели
    которого полностью идентичны показателям варианта А, за одним
    лишь исключением, что прибыль на отрезке 1 для альтернативного
    варианта равна не 3, а 100 единицам. Если пользоваться исключительно критерием среднего эффекта за отрезок, то вариант А
    и альтернативный вариант представляются одинаково предпочтительными, поскольку для бесконечного периода преимущество
    альтернативного варианта на первом отрезке оказывается несущественным. Этот критерий обладает и другими недостатками, которые
    рассматриваются ниже.
    Предположим, что принято решение использовать критерий
    среднего эффекта за отрезок; всегда ли можно быть уверенным в том,
    что данная последовательность имеет определенный предел при
    возрастании числа отрезков до бесконечности? Пусть, например,
    две последовательности значений прибыли для вариантов А* и В*
    получаются путем умножения показателей прибыли первого цикла
    отрезков на одинаковые для обоих вариантов коэффициенты:
    вариант А*: 3 , 2 , 1 , 3 , 2 , 1 ; 6 , 4 , 2 , 6 , 4 , 2 ; 9 , 6 , 3 , 9 , 6 , 3 . . . ;
    вариант В*: 3 , 1 , 3 , 1 , 3 , 1 ; 6 , 2 , 6 , 2 , 6 , 2 ; 9, 3, 9, 3, 9, 3 . . . . ( )
    Хотя по аналогии с прежними примерами можно говорить, что
    обе последовательности одинаково предпочтительны, правило сравнения на основе среднего эффекта за отрезок здесь неприменимо,
    поскольку при бесконечном возрастании числа отрезков бесконечно
    возрастает и средний эффект за отрезок.
    Следовательно, если в качестве критерия оптимальности используется средний эффект за отрезок, необходимо допустить, что для
    сравниваемых конкретных последовательностей существует единственный и конечный предел этого среднего эффекта. Во многих случаях такое допущение является оправданным.
    Критерий интегрального дисконтированного эффекта. Другой
    подход к соизмерению бесконечных последовательностей состоит
    в исчислении так называемых интегральных показателей эффекта,
    дисконтированных к настоящему моменту времени.
    Если для некоторого варианта последовательность значений
    эффекта имеет вид
    RII RZI RS, • • •> -^ш • • •»
    (2)
    то о предпочтительности этого варианта здесь судят по значению
    интегрального дисконтированного эффекта, равного следующей
    сумме:
    RI + <*й2 + «2Я3 + • • • + а^Лп + . . . = = S амД| ,
    4=1

    (3)

    140

    ГЛАВА 11

    где i — процентная ставка за отрезок, а а = [1 + (i/100)] 1 есть
    коэффициент дисконтирования за отрезок. Чем больше значение i,
    тем меньше а. Величина нормы процента, которой фирма должна
    пользоваться при принятии решений, сама по себе является важнейшим вопросом и служит предметом оживленного обсуждения
    как учеными, так и финансистами-практиками. Здесь предполагается, что для данной фирмы может быть определено адекватное значение i.
    Такое предположение можно обосновать учетом внешних условий.
    Пусть фирма может как брать взаймы, так и ссужать любую требуемую сумму денег при оплате по правилу сложных процентов при
    фиксированной процентной ставке, равной i% за отрезок. (Разумеется, также требуется возмещать и саму полученную ссуду.)
    Пусть, например, процентная ставка равна 5% в год. Тогда, взяв
    взаймы 1 долл., через год приходится вернуть (1 + 0,05) долл.,
    через два года (1 + 0,05)2 долл., через п лет (1 + 0,05)" долл. Аналогично этому 1 долл., который будет получен через п лет, в настоящий момент эквивалентен всего лишь (1 + 0,05)~п долл. Если
    в настоящий момент имеется (1 + 0,05)"п долл. и они даны взаймы
    под сложные проценты при 5% годовых, через п лет ссуда будет
    возвращена в размере 1 долл.
    Вот почему учет внешних условий оправдывает использованиекритерия интегрального дисконтированного эффекта. Рассмотрим
    выбор одного из двух вариантов, характеризуемых различными значениями этой величины. Поскольку полезность денежных поступлений и затрат в разные моменты времени может оказаться неодинаковой, для перераспределения эффекта во времени фирма, возможно,
    на одних отрезках пожелает брать ссуды, а на других — давать
    взаймы.
    Пусть, например, поступление RZ желательно использовать
    в настоящий момент, а не спустя один отрезок. Тогда в данный
    момент мы можем одолжить сумму, равную a.Rz, а при получении R2
    оплатить полученную ссуду вместе с процентами из дохода. Аналогично этому можно дать взаймы ссуду на несколько отрезков, а позже
    получить возвращаемую ссуду вместе со сложными процентами.
    Обдумав эту ситуацию, читатель поймет, что общая ценность некоторой последовательности эффектов по существу характеризуется
    числом, показывающим, какую ссуду можно получить в настоящий
    момент, направляя каждый из этих эффектов на погашение ссуды.
    Теперь предположим, что выбран вариант, обеспечивающий
    наибольший интегральный дисконтированный эффект. Согласно сделанному допущению, можно брать и давать взаймы, погашая обязательства ресурсами, которые создаются последовательностью эффектов для этого варианта, так что будут получены все те выгоды,
    которые дают другие варианты; кроме того, от интегрального эффекта
    дополнительно останется некоторая сумма. Иными словами, при
    выборе варианта с наибольшим интегральным дисконтированным

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    141

    эффектом можно построить и любую последовательность, соответствующую варианту с меньшим интегральным эффектом; оставшаяся
    разница представляет собой чистую выгоду. Подводя итоги, можно
    сказать, что, какова бы ни была система предпочтений денег во времени, наилучшим выбором всегда является выбор варианта, которому
    соответствует наибольший интегральный дисконтированный эффект.
    \«, %
    5
    10
    20
    Разумеется, допущение о неограП \v
    ниченной возможности брать и давать
    взаймы весьма редко соответствует дей1
    0,952 0,909 0,833
    ствительности, однако часто оно является достаточно хорошим приближением к ней, позволяющим получить адек5
    0,783 0,621 0,402
    ватные ответы. В пользу критерия интегрального дисконтированного эффекта можно привести и другие доводы.
    10
    0,614 0,385 0,161
    Так, при практическом применении в
    пользу формулы (3) говорит то обсто15
    0,481 0,239 0,065
    ятельство, что эффект для отдаленного
    будущего умножается на малые коэффициенты дисконтирования и соответствен20
    0,377 0,149 0,026
    но в меньшей степени влияет на принимаемое решение. Из таблицы, приведен40
    0,142 ,0,022 0,001
    ной на рис. 11.3, видно, как быстро
    уменьшаются значения а™ при увеличении как процентной ставки £, так и Р и с . 11.3. Коэффициенты
    числа отрезков п. Однако следует помдисконтирования а™ =
    нить, что использование формулы (3)
    или любой другой формулы может быть
    оправдано лишь в том случае, если
    сделаны некоторые специфические допущения о характере предво времени для лица, принимающего решения.
    : .почтении денег
    \
    Теперь рассмотрим формулу исчисления интегрального дисконтированного эффекта и проверим, необходимы ли для применимости
    этого критерия дополнительные допущения. Начнем с проверки
    того, всегда ли является конечной сумма бесконечного числа членов
    в формуле (3). Пусть сперва значения эффекта для всех отрезков
    •одинаковы. Тогда интегральный дисконтированный эффект (обозначим его ИДЭ) равен
    т. е.

    ИДЭ = R

    (4)
    (5)

    Коэффициенты при R в формуле (4) попросту являются членами
    геометрической прогрессии, что и позволяет получить формулу (5).
    -Заметим, что налагается ограничение а < 1. При значениях а,

    142

    ГЛАВА 11

    близких к единице, интегральный дисконтированный эффект является большим числом — однако числом конечным. При а = 1 значение
    интегрального эффекта в формуле (4) бесконечно велико, если R Ф О,
    а в формуле (5) не определено. Этот случай рассматривается далее.
    Теперь исчислим (при 0 -^ а < 1) значения интегрального дисконтированного эффекта для вариантов А, В, С, D и G, экономическая характеристика которых отражена в таблице, приведенной
    на рис. 11.1.
    Вариант А: 3 + 2сс + let2 + За3 + 2а4 + 1а5 + .. . =

    Jo&pIIflHT

    D*

    О —j— J.C6 ~у~ OCC -j- iCC ~j~ "ОС ~т~ iCu ~j~ . . .

    ===

    (6)

    (^/

    Вариант С: 1 + 6а — 1а2 + 1а3 + 6а4 — 1а5+ ... =

    Вариант D: 2 - + 2а + 2се2 + . . . = 2
    Вариант G:

    (11)

    + 2^-.
    .

    — ОС

    4 + 4а3 + 4а 6 + - - . = г
    - 1 — С6"

    ( 12 )

    Для сопоставления вариантов А и В можно рассмотреть разность между соответствующими значениями интегрального дисконтированного эффекта:

    для всех а, заключенных в пределах 0 < а <С 1.
    Таким образом, несмотря на то, что на отрезках с индексами
    (3 + 6п) при п = О, 1, 2, . . . вариант В имеет большую сумму
    совокупной прибыли, чем вариант А, интегральный дисконтированный эффект для варианта А больше при всех а, если 0 < а < 1.
    Соответственно на основе этого критерия исключается вариант В.
    Используя аналогичный подход, убедимся в том, что
    ИДЭ [А] - ИДЭ [С] = -

    ,

    (14)

    ИДЭ [А] - И ДЭ ф1 =
    Какой вывод можно сделать о сравнительной эффективности
    варианта А, с одной стороны, и вариантов С или D — с другой?

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    143

    Сравнив варианты В и D получим, что

    (16)
    Отсюда следует, что вариант В более предпочтителен, чем D, при
    а < 1, и менее предпочтителен при а > 11%. Рассмотрим случай
    а = V 2 ; согласно (16), оба варианта равноценны. Как показано
    далее, для любой конечной длительности планового периода, составляющей п отрезков, интегральный дисконтированный эффект варианта В строго больше, чем эффект варианта D, при нечетных п (п =
    = 1, 3, 5Л . . .) и меньше при четных п (п = 2, 4, 6, . . .). Следовательно, равноценность вариантов В и D возникает только при бесконечной длительности планового периода.
    Пусть п = 2t, где t — О, 1, 2, . . . Тогда интегральный дисконтированный эффект для вариантов В и D при конечной длительности
    планового периода составляет:
    при четном числе отрезков п

    (I)
    при нечетном числе отрезков (п -f- 1)
    ИДЭ [В | 2t + 1] = ИДЭ [В | 2t] + За',
    ИДЭ [D 2t + 1] = ИДЭ [D I 2t] + 2а2',

    t = О, 1, 2, . . . Л
    t = О, 1, 2, . . . ./

    (

    }

    Соответственно при а = V 2 сопоставление вариантов приводит
    к следующим результатам:

    ИДЭ [В | 2t] - ИДЭ [D | 2t } = - \ (\ } 2t< О,

    (III)

    (IV)
    При сравнении вариантов А и G выясняется, что

    0-,

    (17)

    эта разность больше нуля при а> 1/^2 — 1 « 0,414.
    Таким образом, вариант А оказывается более предпочтительным
    только при а > У 2 — 1, в противном случае предпочтителен
    вариант G. Если процентная ставка очень высока, так что значение а соответственно мало, то получение при варианте G 4 единиц
    прибыли на первом отрезке оказывает большее влияние, чем получение более поздних выгод при варианте А. В общем случае, чем
    меньше а, тем больше значение ранних эффектов, а в пределе при
    а = 0 оказывает влияние исключительно лишь прибыль первого
    отрезка R^.

    144

    ГЛАВА 11

    До сих пор использование критерия интегрального дисконтированного эффекта в отдельных случаях позволяло отыскать совершенно неожиданные различия между последовательностями, однако
    сравнение всегда давало определенный ответ, поскольку результатом
    суммирования по формуле (3) всегда было конечное число. Явилось
    ли это всего лишь следствием удачного подбора численных значений
    членов последовательностей? Ответ на этот вопрос будет положительным.
    Трудностям, возникающим при использовании критерия среднего
    эффекта за отрезок, отвечают в той или иной мере аналогичные
    трудности при использовании критерия интегрального дисконтированного эффекта. (Соответствующие примеры приводятся далее.)
    В то же время при дисконтировании могут и отпасть трудности,
    возникающие в ряде случаев приложения критерия среднего эффекта. Так, выше [см. (1)] приводилась последовательность В* с возрастающими значениями эффекта, для которой средний эффект за
    отрезок не является конечным числом. Между тем для этой последовательности интегральный дисконтированный эффект составляет

    ИДЭ [В*] = (3 + 1« + За2 + 1а3 + За4 + 1а5) X
    X [1 + 2 (а8) + 3 (а«)2 + . . . ] ,

    ,(18)

    т. е.

    что при 0 ^ а < 1 есть конечное число. Можно убедиться в том'
    что и в случае варианта А*, последовательность значений эффектов
    для которого приведена в (1), интегральный дисконтированный
    эффект также является конечным числом.
    Критерий эквивалентного среднего эффекта. Прежде чем завершить обсуждение методов оценки бесконечных последовательностей
    значений эффекта, необходимо рассмотреть еще один подход, связывающий понятия средних и дисконтированных значений.
    Этот подход основан на идее построения бесконечной последовательности значений эффектов, для которой значение интегрального
    дисконтированного эффекта является таким же, как для исходной
    последовательности. Однако во вновь построенной последовательности значения эффектов (до дисконтирования) на всех отрезках
    одинаковы; это общее значение можно интерпретировать как эквивалентный средний эффект данной последовательности. В частности,
    пусть интегральный дисконтированный эффект для варианта X
    при некотором фиксированном значении ее составляет Р (а). Рассмотрим новую последовательность, в которой недисконтированный
    эффект для любого из отрезков п равен

    Д„ = (1 - о) Р (а).

    (20)

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    145

    Для этой последовательности
    = (1 - а) Р (а) (1 + а + а 2 + . . .) = Р (а).

    (21)

    Последовательность, соответствующая (20), характеризуется тем
    же значением интегрального дисконтированного эффекта, что
    и вариант X, а (1 — а) Р (а) есть эквивалентный средний эффект.
    При любом фиксированном значении а(0<:а<1) использование
    критерия эквивалентного среднего эффекта приводит к выбору
    тех же вариантов, что и критерий интегрального дисконтированного
    эффекта, потому что показатель эквивалентного среднего эффекта
    попросту есть показатель интегрального эффекта, умноженный на
    коэффициент (1 — а), одинаковый для всех вариантов.
    Применив данный подход к приведенным выше примерам, получим следующие значения эквивалентного среднего эффекта, или
    сокращенно ЭСЭ:
    ЭСЭ[А] = '
    ЭСЭ[В] = !

    1 —ее3

    I
    1 —а

    2

    3+1а
    1 +а '

    \

    . (22)

    Важно отметить то обстоятельство, что во всех случаях, когда
    средний эффект за отрезок определен, его всегда можно получить
    в формуле эквивалентного среднего эффекта, устремляя значение а
    к 1 снизу.
    Так, приняв в (22) а = 1, получим:
    ЭСЭ [А] = 2;

    ЭСЭ [В] = 2;

    ЭСЭ[В] = 2;

    ЭСЭ [С] = 2;

    ЭСЭ[0] = у.

    (23)

    Эти же значения среднего эффекта за отрезок для вариантов А, В,
    С, D и G были получены ранее. Иногда эквивалентный средний
    эффект при а = 1 бывает определен, тогда как средний эффект
    за отрезок не определен (пример этого — вариант Н, рассматриваемый ниже). К сожалению, эквивалентный средний эффект не всегда
    определен при а = 1, примером чего может служить вариант В*.
    При использовании критерия эквивалентного среднего эффекта
    и при а = 1 варианты А, В, С и D будут в равной степени предпочтительными. Действительно ли это так? Ответ на этот вопрос
    10-0734

    146

    ГЛАВА 11

    зависит от личного мнения, и ответить на него может только лицо,
    принимающее решение о выборе. Однако можно привести веские
    доводы в пользу того, что при а = 1 оптимальным следует считать
    вариант А, варианты С и D — близкими к оптимуму, а вариант В
    исключить из рассмотрения. В самом деле, рассматривая (13), (14)
    и (15), можно прийти к выводу, что при значении а, близком к 1,
    дисконтированный эффект для варианта А больше, чем для вариантов В, С и D. При ос = 1 из (14) и (15) следует, что разности между
    ИДЭ [А] и ИДЭ [С], а также ИДЭ [А] и ИДЭ [D] равны нулю, так что
    можно говорить, что варианты С или D почти столь же хороши,
    как и вариант А. Что же касается варианта В, то при а = 1 из (13)
    следует, что ИДЭ [А] — ИДЭ [В] = V 6 . Таким образом, несмотря
    на то, что варианты А и В имеют одинаковые эквивалентные средние
    эффекты, при а, близком к 1, значения интегрального дисконтированного эффекта для этих вариантов различаются на V 6 . Именно
    по этой причине будет целесообразно исключить вариант В.
    В целом отметим, что если значение среднего эффекта за отрезок
    определено, его можно получить на основе эквивалентного среднего
    эффекта. Критерий последнего типа часто используется как в настоящей главе, так и в последующих главах; однако не следует забывать
    о том, что он применим для выбора оптимального варианта при
    бесконечном плановом периоде лишь при сделанных допущениях.
    (В приведенных выше примерах вариант В обеспечивает больший
    совокупный эффект по состоянию на конец отрезков 3, 9, 15 и т. д.—
    через каждые 6 отрезков, однако при использовании критерия
    эквивалентного среднего эффекта это достоинство варианта совершенно не учитывается.) Кроме того, требуются дополнительные
    допущения, чтобы обеспечить представление интегрального дисконтированного эффекта для каждого варианта в виде единственного
    и конечного числа. Наконец, следует помнить и о том, что, даже
    если при а = 1 нескольким вариантам соответствует одно и то же
    значение эквивалентного среднего эффекта, могут все же найтись
    веские доводы в пользу предпочтительности одного из этих вариантов.
    Приведенные выше условные примеры были простыми, трудности
    возникали только в случае вариантов А* и В*, описанных выражением (1). Однако нетрудно построить другие примеры, показывающие,
    почему при рассмотрении бесконечных последовательностей все
    время наталкиваешься на неожиданности и трудности. Приведем
    несколько таких патологических примеров.
    Пусть последовательность значений прибыли для некоторого
    варианта Н имеет следующий вид:
    4, -4, 12, -12, 20, -20, 28, -28, . . ., 4га, -4гс, . . .,
    где п — нечетные целые числа.
    Какая величина, по мнению читателя, является разумной оценкой среднего эффекта за отрезок для этой колеблющейся последовательности? Для более ясного понимания рассмотрим частичные

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    147

    суммы конечного числа первых членов последовательности; они
    имеют вид
    4, 0, 12, 0, 20, 0, 28, 0, . . ., 4ге, 0, . . . (п — нечетные целые числа).
    Рассмотрим также последовательность значений среднего эффекта
    за отрезок:
    4 0? ^М
    4 ^1
    0 ^1
    4 ^0•} ^?
    4 0?


    и

    и

    • • •>

    4 01

    ^?

    W

    . . .

    .

    Здесь проблема заключается в том, что хотя все средние показатели для конечного планового периода конечны, они колеблются
    и не сходятся. Следовательно, в отличие от средних показателей,
    приведенных в таблице рис. 11.2, поведение которых можно оценить,
    относительно варианта Н нельзя сказать, что средний эффект
    сколь угодно близок к некоторой постоянной величине, если число
    отрезков достаточно велико. При любой фиксированной длительности планового периода средний эффект за отрезок равен либо 4,
    либо 0. Можно модифицировать критерий среднего эффекта за отрезок, так чтобы он был применим и к подобным колеблющимся последовательностям. Например, можно выбирать вариант по наибольшей
    верхней границе (или по наименьшей нижней границе) соответствующей последовательности. Для варианта Н числа 4 и 0 есть
    верхняя и нижняя границы последовательности значений среднего
    эффекта за отрезок.
    Теперь исчислим для варианта Н интегральный дисконтированный эффект:

    ИДЭ [Н] = 4 - 4а + 12а2 (I)
    При 0 <;«< эффекта равно

    9C9[H] =41iig?)

    (П)

    так что при а = 1 значение ЭСЭ [Н] определено и равно 2 единицам.
    Является ли это среднее значение для рассматриваемой последовательности приемлемым?
    Рассмотрим последовательность, общий член которой имеет вид
    D _ JПП-1
    t
    п —
    i

    ±1

    где п = 1, 2, 3, . . ., а R > 1. Интегральный дисконтированный
    эффект для этой последовательности равен

    ИДЭ [R] = 1 + a.R + (аД)2 + (аЯ)3 + . . .

    (III)

    и неограниченно возрастает при R ^ I/a. Для того чтобы руководствоваться здесь критерием интегрального дисконтированного
    10*

    148

    ГЛАВА 11

    эффекта, необходимо сделать допущение, что прибыль возрастает
    не так быстро, чтобы превысить влияние дисконтирования.
    Наконец, предположим, что а равно фиксированному числу а
    (а — а) и что общий член рассматриваемой последовательности
    имеет следующий вид:
    ^=(^ 1 ) П " 1 '

    «=1,2,3,....

    (IV)

    Тогда, согласно формуле (6), интегральный дисконтированный
    эффект равен
    .,

    1-1 + 1-1 + 1-1 + , ... .

    (V)

    Несомненно, частичные суммы последовательности (V) ограничены, но чему они равны?
    Отвечая на этот вопрос, следует остерегаться, казалось бы,
    правдоподобных доводов, на самом деле приводящих к нелепостям.
    Для иллюстрации рассмотрим при а < а интегральный дисконтированный эффект, исчисляемый по формуле (V), и выясним, что
    произойдет, когда а возрастет до а. При а <С а
    •••

    1+( а /а) '

    Таким образом, возникает искушение утверждать, что сумма
    последовательности (VI) равна V 2 , поскольку таким является значение правой части (VI) при а = а. Ошибка такого «подхода по аналогии» может быть обнаружена при рассмотрении ряда

    где а < а.
    Хотя последовательности (VI) и (VII) при 0 < а <С а различны,
    левые их части при а = а идентичны. Однако в (VII) значение
    правой части при а = а равно 2 / 3 .
    Имеется ряд способов разрешения проблемы однозначного определения суммы членов последовательности (1), однако при использовании каждого из этих способов необходимо в явном виде высказывать некоторое допущение о том, как интерпретировать рассматриваемый ряд. [Попутно отметим, что в случае большинства обычно
    делаемых допущений значение суммы последовательности (V)
    равно Va-l
    Выводы. На основе обсуждения, проведенного в настоящем разделе, получены следующие выводы о выборе критерия оптимальности
    в динамических моделях:
    I) метод соизмерения последовательностей значений эффекта
    должен включать то или иное допущение о предпочтительности
    денежных поступлений и затрат во времени;

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    149

    II) метод сведения бесконечных последовательностей к некоторому конечному числу не обязательно применим к любой такой
    последовательности;
    III) даже если с помощью некоторого метода две различные
    последовательности сводятся к одному и тому же числу, соответствующие варианты не обязательно являются одинаково предпочтительными, если учитывать другие соображения экономического
    порядка.
    Здесь читатель может усомниться — насколько реалистичны приведенные выше условные численные примеры. Разумеется, все они
    «придуманы», но это еще не причина, чтобы они вызывали недоверие.
    Как читателя могут уверить специалисты по налоговому обложению и по капиталовложениям, каждой фирме приходится принимать
    важнейшие стратегические решения, которые по существу сводятся
    к выбору одной из ряда альтернативных бесконечных последовательностей, характер которых аналогичен характеру приведенных примеров. В таких ситуациях — с ними обычно сталкиваются те фирмы,
    которые быстро расширяются или действуют в условиях постепенно
    возрастающих затрат,— рассмотренные трудности или их модификации возникают во всей полноте.
    Для иллюстрации этого положения обратим внимание на некоторые вопросы, встающие уже при бухгалтерском учете движения
    денежных средств и основных фондов промышленных фирм. Фирма
    может выбрать один из нескольких методов исчисления амортизационных отчислений для списания стоимости оборудования, оценки
    текущих запасов и исчисления налоговой скидки ввиду создания
    балансового резерва в связи с истощением недр. В каждой из этих
    ситуаций выбор того или иного метода может ежегодно оказывать
    существенное влияние на размер отчетной прибыли.
    Рассмотрим другую ситуацию — фирма должна принять решение
    о замене основного оборудования. Иногда такую замену можно
    отсрочить, производя достаточно большие затраты на ремонт. Если
    требуются существенные капиталовложения, фирма, вероятно, попробует оценить и варианты, связанные с арендой оборудования. Финансирование затрат также можно осуществлять на основе разных сочетаний таких способов, как увеличение нераспределенной прибыли,
    увеличение кредиторской задолженности, привлечение капитала
    посредством выпуска акций. Для того чтобы осуществить выбор,
    необходимо сравнить все эти варианты в свете их влияния на движение денежных средств фирмы и временную последовательность
    ее прибылей.
    В остальной части настоящей главы и в следующей главе мы
    не будем рассматривать парадоксы, возникающие при оценке бесконечных последовательностей (за исключением разве лишь отдельных кратких упоминаний), а сосредоточим внимание на вопросах
    использования критериев выбора и на методах отыскания вариантов,
    оптимальных при заданном критерии.

    150

    ГЛАВА 11

    11.3. МОДЕЛЬ ЭКСПЛУАТАЦИИ ЛЕСНОГО ХОЗЯЙСТВА

    Приводимая в настоящем разделе иллюстративная модель выполняет двоякую цель. С одной стороны, идеи, изложенные в предыдущем разделе, используются для решения конкретной оптимизационной задачи. С другой стороны, анализируется структура широко
    применимой модели; эта структура рассматривается в последующих
    разделах настоящей главы.
    Фирма «Самосад» намечает засадить лесом новый участок земли.
    Дерево, сваленное в начале отрезка k (k отсчитывается с момента
    посадки дерева), по оценке фирмы приносит чистую прибыль Nh
    единиц (Nh > 0). Предположим, что затраты на посадку и содержание леса пренебрежимо малы по сравнению с затратами на
    валку и транспортировку деревьев в начале отрезка k. Далее,
    предположим, что все деревья должны быть срублены одновременно.
    Следовательно, Nh представляет собой выручку от продажи леса
    за вычетом затрат на валку и транспортировку. Пусть JV& поступает
    в начале отрезка /с, a k = 1 соответствует текущему отрезку,
    т. е. отрезку, на котором начинаются лесопосадки.
    Однократное принятие решения. Для исчисления интегрального
    дисконтированного эффекта используются коэффициенты дисконтирования за (k — 1) отрезков, равные ah~1. Таким образом, оптимизационная задача состоит в том, чтобы отыскать
    max

    fe==l 2 3

    «"-Wft.

    (1)

    В выражении (1) предполагается, что после валки леса не будут
    произведены новые посадки. Иными словами, сформулированная
    выше задача включает однократное принятие решения: в какой
    момент свалить деревья.
    Пусть К есть то значение k, которое является решением (1),
    и пусть последовательность aW 4 , afiNz, &2N3 обладает следующим
    свойством:
    a°/V t < aW 2 < . . . < a K -W K _! < aK'lNK ^
    . . .,
    (2)
    так что значение интегрального дисконтированного эффекта возрастает при увеличении k от 1 до К, а при больших k снова убывает.
    Тогда неравенства aK'2NK^ <. а,к~^Нк и a.K~lNK ^ a,KNK+ i сводятся к условиям (3), имеющим более простой вид:
    ^z! J^L.
    a
    NK ^ ^ J V K + i

    (3)
    ^ '

    Следовательно, значение К можно найти, вычисляя отношения
    Nh/N h+l — начав с k = 1 и завершив расчеты, как только это
    отношение станет не меньше чем а. [Интерпретируйте неравенства (2)
    и критерий прекращения расчетов (3) при a = 1.1

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    151

    Пример. Рассмотрим случай, когда

    Nh = а ~ Ь\

    (4)

    где 0 < С б < 1 и а ^ & . (Вычертите график значений Nh при а = 0,75
    и b = 0,5.) Тогда, как можно проверить посредством небольших
    алгебраических преобразований, неравенства (3) можно упростить,
    сведя его к

    а

    а

    О
    тт
    л
    одесь
    возникает новая трудность. Пусть
    а = 1,
    так что .(1__—г-)
    равно нулю. Тогда не может существовать конечного значения К,
    удовлетворяющего условиям (5), поскольку bh >> 0 для есеа; А".
    Однако bh оказывается сколь угодно близким к нулю при достаточно
    больших k. Таким образом, если Nh имеет вид (4), а а = 1, в выражении (1) максимизация не имеет смысла. Читатель должен объяснить,
    почему при этих обстоятельствах не существует конечный максимум
    {полезно обратиться к графику значений Nh).
    Продемонстрируем вид условий (5) на численном примере. Пусть
    Nh = 0,85 - (0,78)" и а = 0,8.
    (6)

    Можно убедиться, что условиям (5) соответствует К = 4. Обозначим
    дисконтированный эффект ak~lNk как ИДЭ [k]; тогда (как читатель
    может проверить хотя бы для /с = 1 и k = 2)
    ИДЭ [1] = 0,070, ИДЭ[2]=0,193, ИДЭ [3] = 0,240, 1
    (7)
    ИДЭ [4] = 0,246, ИДЭ [5] = 0,230.
    J
    Эти значения будут использованы в последующих разделах.
    Бесконечный плановый период. Теперь рассмотрим, что произойдет, если в следующем после валки леса отрезке снова проводятся
    лесопосадки, причем такой процесс повторяется бесконечное число
    раз. Если каждый раз валка леса осуществляется в начале &-го отрезка после посадки, интегральный дисконтированный эффект последовательного ряда прибылей в течение бесконечного планового
    периода равен
    F (k) = ИДЭ [k] (I + ctft + a 2ft + . . .)
    F (k) = ИДЭ [k] + ИДЭ [k] (ctft + ctaft + .
    F (k) = ИДЭ [k] + а"ИДЭ [k] (1 + a" + .
    F (k) = ИДЭ [k] + ahF (k),
    так что
    """"?.

    (9)

    Оптимальной для бесконечного планового периода является
    такая стратегия, при которой максимизируется величина F (k).

    152

    ГЛАВА 11

    Обозначим максимальное значение F (k) через F, причем значение F
    можно найти из (10):

    =

    max

    поскольку F (k) определяется по формуле (9). Непосредственным
    следствием (10) является (И):
    всех

    или, что эквивалентно этому,
    F > ahF + ИДЭ [Л]

    для всех k,

    (12)

    причем строгое равенство в (11) и (12) соблюдается только для оптимальной стратегии. В свою очередь это указывает на то, что значение F должно удовлетворять условию
    F=
    max
    (aftF + Hfl9[fc]).
    (13)
    ft=l, 2, 3, ...

    Пусть из (10) следует, что оптимальным является k = k', и пусть,.
    далее, последовательность ИДЭ [!]/(! — а), ИДЭ [2]/(1 — а2), . . .
    обладает следующим свойством:
    ИДЭ|1]
    ИДЭ[А')
    ИДЭ [

    -

    Тогда на основе неравенств (14) для (&' — 1), k' и (&' + 1) можнопостроить условия, аналогичные (3), а именно
    ..+a»')J\r f t ,

    ,, ~

    ------- ,-з-• .
    1

    +a"- )^^!

    Значение k' можно найти, вычисляя величину отношения в правой
    части условий (15) — начав с k = 1 и прекратив расчеты, как толькоэто отношение станет не меньше чем а. Для каждого k значение
    этого отношения будет превышать Nh/Nh+l, которое исчислялось
    при нахождении К на основе (3). Следовательно,
    (16)

    k'^K;

    это означает, что обычно при бесконечном плановом периоде лес
    валят чаще — но никак не реже, чем при однократном принятии
    решения о валке.
    Если при использовании (15) a = 1, то неравенства можно переписать в следующем виде:

    '-l

    fc'

    '

    k

    ±П

    (17).

    ^

    Это значит, что стратегия, основанная на k' , дает наибольший средний эффект за отрезок.

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    153

    Для численного примера (6) оптимальным является k' = 2, в
    F (1) = 0,350, F (2) = 0,536, Р (3) = 0,492,
    F (4) = 0,417, F (5) = 0,342,
    (18)
    где F (k) определяется выражением (9). Таким образом, если при
    бесконечном плановом периоде ошибочно использовано значение
    К = 4 (взятое из задачи с однократным принятием решения), то
    «Г
    ТО
    будет
    получена величина, равная всего лишь •О'-„„ = А1),7о
    от оптимального значения интегрального дисконтированного эффекта.
    417

    11.4. МОДЕЛЬ ВОССТАНОВЛЕНИЯ
    С БЕСКОНЕЧНЫМ ЧИСЛОМ ЭТАПОВ

    Читателю уже приходилось иметь дело с некоторыми применениями так называемых моделей восстановления. Каждый раз, когда
    проводится валка леса, в процессе происходит восстановление в том
    смысле, что фирме «Самосад» необходимо снова принимать решение
    о сроке следующей валки. Другим примером может служить задача
    замены оборудования, рассмотренная в разд. 10.6, где период восстановления начинался всякий раз, когда заменялось оборудование.
    Соответственно управляющими переменными по существу являются
    последовательные интервалы между моментами замены. Вместо того
    чтобы рассматривать какой-либо конкретный пример более детально т
    будем анализировать все такие примеры в свете общей модели.
    Предположим, что в процессе принятия решений момент восстановления можно выбирать из ./V альтернативных вариантов,
    которым присвоены индексы k = 1, 2, . . ., N. Пусть, далее, если
    вариант k выбран в момент восстановления t, то следующий момент
    восстановления наступит на отрезке (t + k); кроме того, введем
    обозначение:
    Rk = Затраты варианта k при их оценке 1
    в начале его периода восстановления. J
    Отметим, что (1) включает допущение о стационарности: Rk не
    зависит от того, о каком именно периоде восстановления идет речь.
    Отметим также, что, поскольку Rh интерпретируется как затраты,
    целью оптимизации является достижение минимума.
    Конечный плановый период. Введем обозначение:
    /„, = Интегральные дисконтированные затраты для оптималь-^
    ной стратегии восстановления, при которой один из
    альтернативных вариантов должен быть выбран за '
    п отрезков до конца планового периода.
    Пусть выбран альтернативный вариант k. При таком выборе
    немедленно возникают затраты R^', если предположить, что в еле-

    154

    ГЛАВА 11

    дующий момент восстановления, т. е. на отрезке (п — k), также
    принимается оптимальное решение, то в дальнейшем возникают
    затраты a f e / n _ f t , где коэффициент a h используется для дисконтирования будущих затрат к настоящему моменту. Следовательно, за
    п отрезков до конца планового периода оптимальной является такая
    стратегия, при которой минимизируется сумма членов, имеющих вид
    (a f t / n _ft + Rh); обозначим соответствующее минимальное значение fn.
    Приняв п 5=: N, можно представить /п с помощью рекуррентного
    соотношения

    /„=

    min

    ft=l, 2, ...

    (3)

    (При п <. N минимум отыскивается на ограниченной совокупности k,
    k = 1, 2, . . ., га.) В действительности, если затраты варианта k
    рассредоточены по всем k отрезкам, то каждое из Д^ зависит также

    Р и с . 11.4. Модель восстановления при конечной длительности
    планового периода (п = 6, N = 3, a = 1).

    и от а; однако мы не будем стремиться отобразить это обстоятельство
    в явном виде и по-прежнему используем сокращенное обозначение R^
    вместо Rk (а). На рис. 11.4 приведена сеть, отображающая рекуррентное соотношение (3) при a = 1.
    Для того чтобы разобраться в операциях, выполняемых на основе
    соотношения (3), допустим, что для всех плановых периодов длительностью п отрезков значение k = 1 является оптимальным. Тогда
    из (3) получаем
    fn = а/„_1 + RI = a [a/ n _ 2 + RJ + Ri =
    = a [ a ( a / n _ 3 + Л О +Ri\ + Ri =
    n l
    = . . . =Ri + aRl + . . . + a - Rt.

    (4)

    Бесконечный плановый период. Предположим, что плановый
    период для процесса восстановления является бесконечным. Каждый
    раз, когда наступает очередной момент восстановления, принятие
    очередного решения осуществляется в условиях бесконечного планового периода. Можно строго доказать, что существует оптимальная стратегия, которая является стационарной: в каждый из моментов восстановления выбирается один и тот же вариант /с. Тогда,
    при a ^= 1, соответствующим обобщением (3) является рекуррентное

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    соотношение (5):
    /=

    ft=l,2

    min

    N

    [aft/ + -ftfeh

    0<;а<1.

    155

    (5)

    [Вспомним, что в соотношении (13) разд. 11.3 рассматривался
    пример аналогичного оптимизационного соотношения — единственным существенным различием является то, что целью оптимизации
    будет достижение максимума, а не минимума. В разд. 11.3 ИДЭ [k]
    есть интегральный дисконтированный эффект, который зависит от а.
    Заметим также, что наибольшее допустимое значение k принято
    априорно равным ./V.]
    Соотношение (5) является примером так называемого функционального или экстремального уравнения. Неизвестным является
    значение /, и (5) представляет собой оптимизационное соотношение,
    которому должно удовлетворять /, если принято, что используется
    стационарная стратегия. Используя экстремальные уравнения, всегда
    необходимо определить:
    I) имеется ли у данного уравнения конечное решение;
    II) если имеется, является ли это решение единственным;
    III) если решение единственно, является ли / максимальным
    значением дисконтированного эффекта для всех (не обязательно стационарных) стратегий.
    Для того чтобы понять важность этих вопросов, примем а = 1,
    хотя это и противоречит ограничению сверху на значение а, установленному в (5). Если допустить, что все Rh > 0, то ни одно конечное значение / не удовлетворяет (5); объясните, почему? Однако
    если вместо этого допустить, что все R^ = 0, тогда любое конечное
    значение / удовлетворяет (5); также объясните, почему? Следовательно, функциональное уравнение (5) неприменимо при а = 1.
    Можно рассматривать (5) как утверждение о том, что / должно
    удовлетворять условию
    и

    (6)

    f
    для всех k, причем (6) должно быть строгим равенством хотя бы для
    одного значения k. Отсюда следует, что экстремальное уравнение (5)
    имеет однозначное конечное решение, которое равно
    /=

    min
    h=i.2

    г--ь.
    .....

    tfU-aM

    (7)
    v
    '

    Оптимальная стационарная стратегия соответствует выбору любого
    альтернативного k, которое позволяет получить оптимальное значение /.
    Выражение (7) можно также вывести исходя из соображений стационарности. Поскольку в каждый из очередных моментов восстановления оптимальным является выбор одной и той же альтернативы А, интегральный дисконтированный эффект для этой стратегии

    156

    ГЛАВА 11

    равен
    h

    a

    Rh + a Rh + a*Rb + a *Rh + . . . =-~T.

    (8)

    Таким образом, оптимальной является такая стратегия, в которой
    эта величина минимизируется, как указано в (7).
    До сих пор задача с бесконечным плановым периодом решалась
    в предположении а =И= 1 , причем было выявлено, что при а = 1
    соотношение (5) неприменимо. Однако можно распространить анализ
    и на случай ос = 1, используя критерий эквивалентного среднего
    эффекта, предложенный в разд. 11.2. Для этого / заменим g, гдеg = (1 — а) /. После простых алгебраических преобразований
    выражение (7) принимает вид
    8=

    min

    Гтп-, Д * , k-i
    ы1-

    v

    (9)
    '

    Если значение а удовлетворяет условиям 0 ^ а < 1, стратегият
    оптимальная согласно (7), является оптимальной и согласно (9),
    и наоборот. Однако, приняв в (9) а = 1, можно убедиться в том,.
    что решением является
    g=

    min

    k=i,Z, ...,N

    Г^1,

    L

    k

    J

    а = 1.

    .(10)

    Как и следовало ожидать, альтернатива k является оптимальной^
    если при ней минимизируются средние затраты за отрезок.
    Для того чтобы проверить, как читатель понял изложенный
    материал, ему предлагается модифицировать (6), (7), (9) и (10) для
    случая, когда целью оптимизации в выражении (5) является достижение не минимума, а максимума.
    Поскольку структура описанной модели восстановления чрезвычайно проста, оптимальную стационарную стратегию легко
    построить, выполнив расчеты в соответствии с соотношением (7)
    или (10). Следовательно, для любых практических целей метод решения задачи является тривиальным. Задачи, структура которых
    имеет более общий вид, нельзя решить столь же легко — для них
    требуются более сложные методы. В рамках динамического программирования эти методы обычно именуются методами последовательного приближения. Для того чтобы помочь читателю понять
    основные идеи, лежащие в основе возможных альтернативных подходов, в следующих трех разделах демонстрируется применение
    таких методов к анализу простой модели восстановления. Это позволяет установить, что для применения подобных методов к задачам
    более общего вида требуется только изменить систему обозначений.
    Одним из возможных направлений использования соотношения (10) является такой важный частный случай, как «модель управления производством и запасами с вогнутой функцией затрат»,
    рассмотренная в разд. 9.5. Пусть функции затрат на производство

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    157

    продукции и содержание запасов являются стационарными и имеют
    следующий вид:

    {
    ht (it) = hit

    s-\-cxt при #t>0

    О

    (затраты на переналадку и
    пропорциональные затраты),


    прии = 0,
    Для всех t

    (затраты, на содержание запасов
    линейны),

    где s ^0, с ^ 0 и / г > 0 ; а : ( — объем выпуска продукции на отрезке t или размер заказа в начале отрезка t, a it — уровень запасов
    на конец отрезка t. Предположим, далее, что спрос является стационарным, так что Dt = D для всех t, и что спрос должен быть
    полностью и своевременно удовлетворен.
    Обозначим Q объем выпуска в момент восстановления, если
    исходный запас на начало планового периода равен нулю. При
    конечном плановом периоде, как читателю известно из разд. 9.5,
    Q = kD,
    (II)
    где k — положительное целое число. Предположим, что такой же
    характер решения сохраняется и для бесконечного планового периода. Тогда оптимизационная задача заключается в том, чтобы найти
    множитель А;, позволяющий минимизировать средние затраты за
    отрезок.
    Заметим, что R^ равно сумме затрат на переналадку, производство
    продукции и содержание запасов:

    т. e.

    Rh = s + ckD + hD [(k - 1) + . . . + 2 + 1],

    D &=£>*.

    (III)

    (IV)

    Следовательно, средние затраты за отрезок составляют
    -

    Найти приближенное значение k можно, дифференцируя Rk/k
    no ft и приравняв производную нулю. Отсюда

    так что
    Q^kD^-/^-.

    (VII)

    Это выражение, определяющее размер Q, часто называют формулой экономически выгодного размера партии. Отметим, что (VI ) и (VII)
    являются приближенными потому, что получаемые величины в общем
    •случае не обязательно целочисленны. Вместе с тем, если найденное

    158

    ГЛАВА 11

    по формуле (VI) значение k не есть целое число, оптимальную стратегию можно найти, вычисляя средние затраты за отрезок по формуле (V) для двух ближайших к k целых чисел — одного большего
    и одного меньшего, а затем выбирая лучшее из вычисленных значений.
    11.5. МЕТОДЫ ПОСЛЕДОВАТЕЛЬНЫХ

    ПРИБЛИЖЕНИЙ

    В настоящем разделе начинается рассмотрение численных методов
    решения экстремальных уравнений, возникающих в моделях динамического проградширования с бесконечным плановым периодом.
    В качестве исходного прототипа используем функциональное уравнение предыдущего раздела:

    /=

    min

    ft=l, 2,. .., JV

    b

    la f + Rh],

    0
    (1)

    Напомним, что отыскание решения (1) по существу означает
    отыскание такого значения /, которое удовлетворяет (1); кроме
    того, хотелось бы найти такое /с, которое позволяет достичь этого
    значения /. Обычно предлагается три подхода к решению задачи.
    Первый подход основан на динамическом характере рассматриваемой модели. Он заключается в выяснении — не будет ли стратегия, оптимальная для очень длительного, но конечного планового
    периода, одновременно и оптимальным решением для бесконечного
    периода. Второй подход состоит в том, чтобы попытаться угадать
    некоторое значение /. Затем на основе этого значения вычисляется
    величина в правой части (1) и проверяется выполнение уравнения.
    Если уравнение не выполняется, результат вычислений рассматривается в качестве скорректированного значения /, и процесс повторяется снова. Третий подход заключается в попытках отгадать стратегию, оптимальную для бесконечного периода. Для предполагаемой
    оптимальной стратегии вычисляется соответствующий интегральный дисконтированный эффект, который и используется в качестве
    проверяемого значения /; затем производится проверка справедливости уравнения (1) при этом значении. Если уравнение не
    удовлетворяется, в качестве новой пробы используется та выбранная
    программа, при которой достигается наименьшее значение правой
    части (1), и процесс повторяется снова. В настоящем разделе рассматривается первый подход, а два остальных подхода — в следующих разделах.
    Во всех этих методах каждую догадку можно толковать как
    некоторое приближение к решению. Если она удовлетворяет экстремальному уравнению, решение найдено, если нет — следует попы-.
    таться снова. Такой итеративный процесс именуется методом последовательных приближений.
    Бесконечный период как предел конечного периода. Вероятно,
    наиболее очевидный подход к отысканию такой стратегии, которая

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    159

    удовлетворяет функциональному уравнению (1), заключается
    в нахождении решения для модели с конечным плановым периодом:

    /„=

    min

    lahfn^h + Rk},

    ft=l, 2,. . ., IV

    0<а<1,

    (2)

    где ге принимает очень большие значения. Примеры, рассмотренные
    в гл. 8 и 9, заставлют нас проявить особую осторожность в отношении того, можно ли в данном конкретном случае полагаться на
    применимость такого подхода. Можно ли быть уверенным в том,
    что при любом достаточно большом п получаемое из (2) kn будет
    также удовлетворять уравнению (1)? Остается ли одно и то же k
    оптимальным при переходе ко все большим значениям ге? Если
    длительность планового периода п достаточно велика, является ли
    стратегия, оптимальная для бесконечного периода, оптимальной
    и для конечного периода? Очень важно, чтобы в случае рассматриваемой модели восстановления ответы на эти вопросы были положительными.
    Теорема о длительности планового период а д л я м о д е л и в о с с т а н о в л е н и я . Существует такое
    конечное значение п*, что для любого конечного планового периода
    длительностью п отрезков, п > п* , выполняются следующие соотношения:
    если /„ = anfn_hn + Rkn, то / = сЛ/ + Rhn,
    (3)
    K
    K
    если / = a f + RK,
    то /„= a fn_K + RK.
    (4)
    Из (3) следует, что любая стратегия kn, являющаяся оптимальным текущим решением при достаточно большой длительности п
    планового периода (п > ге*), одновременно есть оптимальная стационарная стратегия для бесконечного планового периода. Напротив, (4) является обратным утверждением. Выполнив по определенной схеме расчеты в соответствии с (2), можно найти значение ге*.
    Подробности этого подхода не имеют отношения к цели настоящего
    обсуждения и потому опускаются.
    11.6. МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ
    ПРИБЛИЖЕНИЙ
    В ПРОСТРАНСТВЕ ФУНКЦИЙ (МЕТОД ИТЕРАЦИЙ ПО КРИТЕРИЮ)

    Основная идея в предыдущем методе была связана с нахождением
    оптимальной стационарной стратегии N дл(я бесконечного планового
    периода посредством анализа ряда возрастающих значений ге. Напротив, идея описываемого ниже метода состоит в последовательном
    приближении к значению функции f в экстремальном уравнении.
    Соответственно процесс именуется методом итераций по критерию.
    Пусть /° — первоначально выбранное значение /. Метод заключается в построении последовательности приближений f1, /2, /3, . . .
    на основе рекуррентного соотношения
    / n+1 =
    min
    [ a h f n + Rh], 0<а<1,
    (1)
    h=l, 2 ..... N

    160

    ГЛАВА И

    где /n — пробное значение / на итерации п. [Если целью оптимизации в экстремальном уравнении является достижение максимума,
    то в выражение (1) вносятся соответствующие изменения.] Ниже
    приводится пример решения задачи с помощью описываемого метода.
    Хотя алгоритм (1) четко сформулирован, возникает три вопроса
    относительно его применимости:
    I) Всегда ли значение /" стремится к тому /, которое удовлетворяет экстремальному уравнению?
    II) Если всегда, то существует ли такое конечное гс, для которого
    fn равно /?
    III) Если в соответствии с (1) на двух итерациях подряд выбрано
    одно и то же k. то является ли оно оптимальным?
    Для того чтобы ответить на все эти вопросы, предположим, что
    все Нъ >> 0. Если принять /° = 0, то можно доказать, что /™+1 > /",
    так что совокупность /п представит собой монотонно возрастающую
    последовательность приближений. Тогда, при достаточно большом п, fn явится сколь угодно близким к оптимальному значению /.
    Однако в общем случае не существует конечного п, такого, что /п
    равно /. Более того, некоторая альтернатива может быть выбрана
    в качестве значения правой части (I) на двух последовательных
    итерациях, однако она не обязательно является оптимальной для
    бесконечного планового периода. (Если решение для модели восстановления отыскивается методом приближения в пространстве функций, то мы никогда не возвращаемся к ранее отвергнутой стратегии.)
    Пример. Приводимый пример показывает действие метода приближений при Rh > 0. Пусть N = 5 и
    RI = 8,7; Я 2 = 12,7; Я 3 = 14,7; Я 4 = 19,7; Я5 = 28,7; а = 0,8.
    (2)
    Можно определить, что решением является

    /=

    min

    h=l, 2

    Г j-^5_] = min [43,50; 35,28; 30,00; 33,39; 42,841=30,00,

    5

    L1 —U,«"J

    (3)

    так что k = 3 является оптимальным значением.
    Вычисления на основе рекуррентного соотношения (1) в пространстве функций дают при п = 1, 2, 3 и /° = 0:
    Л=1, 2

    5

    /2 = min [0,8-8,7+ 8,7; 0,64-8,7 + 12,7; 0,51-8,7-1-14,7;
    0,41-8,7 + 19,7; 0,33-8,7 + 28,71 = 15,66 для /с = 1;
    3
    / = min [0,8-15,66+ 8,7; 0,64-15,66 + 12,7; 0,51-15,66 +
    + 14,7; 0,41-15,66 + 19,7; 0,33-15,66 + 28,71 =
    = 21,23 для fc = l.

    (4)

    161

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    Читателю следует проверить отдельные слагаемые в (4), для того
    чтобы убедиться, что он полностью понимает сущность вычислительного процесса. Для итераций п, где п > 3,
    /4 = 25,53; f = 27,57; /6 = 28,76; /7 = 29,37;
    f = 29,68; f = 29,84; /10 = 29,91; /п = 29,95;
    /12 = 29,97; /13 = 29,98; /14 = 29,99; /15 = 29,99,
    (5)
    причем на всех итерациях k = 3. (Вычислите /16 и убедитесь, что
    по-прежнему k = 3.)
    Замечания. На основе вычислений (4) по материалам приведенного примера видно, что некоторая стратегия (k = 1) может быть
    выбрана на нескольких последовательных итерациях, но при этом
    она не будет являться оптимальным решением для бесконечного
    планового периода. Можно так изменить условия примера, что
    k = 1 выбирается в течение сколь угодно большого числа итераций;
    для этого примем Ri достаточно близким к 6. Расчеты (5) показывают, что /" быстро сходится к /, однако /" не равно / ни для какого
    конечного п.
    Заметим, что при а = 1 процесс прекращается. Для каждого п
    выбирается такое k, для которого /?д минимально. Однако это значение k обычно не совпадает с решением, минимизирующим средние
    затраты за отрезок Rk/k.
    Метод итераций по стоимости, описываемый уравнением (1),
    фактически применим при любых значениях Rh и любом начальном
    приближении /°. Однако в общем случае последовательность значений /п не всегда является монотонной. Альтернативный подход
    к выбору /° всегда приводит к монотонно убывающей последовательности приближенных значений, т. е. к обязательному выполнению
    неравенства /n+1 =sC /". Идея состоит в том, чтобы угадать оптимальную стратегию', пусть /° — соответствующие интегральные дисконтированные затраты для этой стратегии.
    Если угаданная стратегия оказалась оптимальной при вычислении f-, то /° = f1 = /. Однако если новая стратегия при вычислении f1 оказалась определенно лучше, то расчеты на основе рекурентного соотношения (1) продолжаются и / n+1 < /". Этот метод
    описывается ниже.
    Сходимость сверху. Рассмотрим пример (2); предположим, что
    исходной догадкой является k — 1. Тогда

    а для п = 1
    f = min [0,8-43,50 + 8,7; 0,64-43,50 + 12,7;
    0,51 -43,50 + 14,7; 0,41 -43,50 + 19,7;
    0,33-43,50 + 28,7] = 36,88 для k = 3.

    >

    (7)

    162

    ГЛАВА 11

    Для последующих итераций (п > 1)
    ^
    4
    f = 33,50, f = 31,78, / = 30,90, f = 30,45, f = 30,22, I (8>
    /7 = 30,11, f = 30,05, f = 30,02, /10 = 30,01,
    J
    причем на всех этих итерациях k — 3. Можно изменить условия
    примера, приняв /?4 близким к 17,7, так что для сколь угодно большого числа приближений будет выбираться k = 4. Проверьте, чтоесли вы начнете вычислительный процесс с k = 3, то / = 30,00
    для k = 3.
    При использовании рекуррентного соотношения (1) /° принималось равным нулю лишь ввиду удобства вычислений. Словесное
    описание процесса последовательных приближений, начатого в этой
    исходной точке, не приводит к более глубокому пониманию. Однако,
    если в качестве /° принимаются интегральные дисконтированные
    затраты для выбранной вначале стратегии, идея метода проясняется. Значение /° в (6) представляет собой интегральные дисконтированные затраты, соответствующие выбору варианта k = 1 при
    бесконечно большом плановом периоде. Предположим, что вместо
    k = 1 первоначально выбирается k = 3, а после этого k всегда принимается равным 1. Интегральные дисконтированные затраты для
    такой стратегии отображены f1 в (7). Аналогично этому /2 в (8) по
    существу представляет собой интегральные дисконтированные затраты для стратегии, в которой первым двум решениям о восстановлении соответствует k = 3, а затем принимается k = 1. Эти замечания
    подсказывают нам еще один метод последовательных приближений,
    рассматриваемый в следующем разделе.
    Что означает утверждение «метод итераций по критерию на
    основе рекуррентного соотношения (1) всегда применим»? Необходимо показать, что выполняются три условия. Два из них уже упоминались, а именно то, что экстремальное уравнение имеет конечное
    решение и что это решение является единственным. Поскольку
    модель восстановления имеет столь простую структуру, соображения о существовании и об единственности, приведенные в разд. 11.4,
    являются достаточными. В случае моделей более общего вида эти
    два момента необходимо доказывать с большей тщательностью.
    Третье условие состоит в том, что последовательность /п сходится
    к истинному решению при любых Rf, и исходном приближении /°.
    Здесь учитываются следующие соображения. Пусть К есть оптимальная стационарная стратегия для бесконечного планового периода, a k — вариант, выбранный на данной итерации п в соответствии
    с рекуррентным соотношением (1). Тогда
    / = ак/ + RK,

    (I)

    поскольку К является оптимальным для бесконечного периода, и
    Г < а*/"'1 + Вк,

    .

    (II)

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    163

    п

    поскольку при k возникает / . Таким образом,
    в

    к

    / - / < а (Г

    1

    1

    - /X ее /"- - / ,

    (III)

    так как 0 ^ а <. I .
    Аналогично этому

    Г = а"/"-1 + Rh,
    ft

    / < a / + Дд,

    (IV)
    (V)

    так что
    1

    / _ /» <^ а" (/ - /"- ) < a /"-1 - / |.

    Совмещая

    (III) и (VI), получим
    /» _ / | <^ a /»-i _ / | ^a" | /о _ / .

    (VI)
    (VII)

    Поскольку а < 1 , при достаточно больших и правая часть (VII)
    является сколь угодно малой. Поэтому /" в пределе стремится к /.
    Отметим, что скорость сходимости не меньше, чем у экспоненты.
    11.7. МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ
    В ПРОСТРАНСТВЕ СТРАТЕГИЙ (МЕТОД ИТЕРАЦИЙ ПО СТРАТЕГИЯМ)

    Предположим, что при вычислении значения правой части рекуррентного соотношения (1) предыдущего раздела обнаруживается
    стратегия, определенно лучшая, чем та, которая соответствует /".
    Это означает, что выбор найденной стратегии в случае непосредственно принимаемого решения является улучшением по сравнению
    с выбором ранее рассматривавшейся стратегии. Тогда весьма вероятно — и это действительно оказывается правильным,— что использование новой стратегии в течение всего бесконечного планового
    периода даст даже лучшие результаты, чем выбор этой стратегии
    только в случае непосредственно принимаемого решения. Следовательно, /п+1 можно вычислить как интегральные дисконтированные
    затраты при многократном повторном выборе новой стратегии.
    Этот процесс известен под названием приближения в пространстве
    стратегий, или попросту метода итераций по стратегиям, поскольку
    на каждой итерации рассматривается новая проверяемая стационарная стратегия для бесконечного планового периода.
    Возникающая последовательность /™ является монотонно убывающей, с п на каждой итерации происходит определенное улучшение; следовательно, мы никогда не возвращаемся к однажды отвергнутой стратегии. Поскольку имеется конечное число N различных
    стационарных стратегий, расчеты при данном подходе должны
    завершаться за конечное число итераций. Как только какая-либо
    стратегия остается оптимальной в течение двух итераций подряд,
    вычисления можно прекратить, причем /" равно оптимальному /,
    удовлетворяющему экстремальному уравнению. Как увидит читатель, за получение конечного алгоритма приходится платить

    164

    ГЛАВА 11

    увеличением объема расчетов по определению /n+1 для новой стратегии на каждой итерации.
    Алгоритм имеет следующий вид:
    Шаг 1. Выберем произвольную исходную стратегию и примем
    п = 0.
    Шаг 2. Для заданной пробной стратегии k вычислим интегральные дисконтированные затраты в течение бесконечного планового периода:
    П

    Шаг 3. Проверим возможность дальнейших улучшений, вычислив
    min

    h = l , 2 ..... N

    [ah/n + Rh] = aft'/n + Rv,

    (2)

    т. е. выбрав k'.
    Шаг 4. Прекратим расчеты, если ah'fn + Rv = fn. В противном
    случае изменим стратегию на k'. Перейдем от итерации п к итерации (п -+- 1) и обратимся к выполнению шага 2 на основе новой проверяемой стратегии.
    Отметим, что если хорошие пробные значения / получаются
    непосредственно в процессе аппроксимации в пространстве функций,
    то при описываемом методе эти значения должны исчисляться дополнительно, по формуле (1). Отметим также, что условие прекращения
    расчетов на шаге 4 выполняется в том случае, когда k' — тот же
    вариант, который рассматривался на шаге 2. Иными словами, расчеты прекращаются, если k' не изменяется в течение двух итераций
    подряд. [Как нужно преобразовать (2), если целью оптимизации
    на основе экстремального уравнения является максимизация?]
    Пример. Для того чтобы продемонстрировать описанный подход,
    примем
    Rt. = 8,7, Д 2 = 12,7, R3 = 14,7, Я 4 = 19,7, R6 = 28,7; (3)
    это условия примера (2) в предыдущем разделе.
    Как и ранее, пусть исходной предполагаемой стратегией является k = 1, так что /° = 43,50. Контрольные расчеты по формуле (2)
    в точности повторяют расчеты (7) предыдущего раздела. Таким
    образом, на основе формулы (1) теперь получаем f1 = 30,00 для
    k = 3. Вторичное применение проверочной формулы (2) приводит
    к вычислению:
    min (0,8-30,00 + 8,7; 0,64-30,00 + 12,7; 0,51 -30,00 + 14,7;
    0,41 -30,00 +.19,7; 0,33-30,00 + 28,7) = 30,00 для k' = 3, (4)
    так что расчеты прекращаются.
    Средний эффект за отрезок. Как обычно, при разработке соответствующего метода для а = 1 удобно переформулировать вычислительную процедуру на основе использования эквивалентного

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    165

    среднего эффекта. Аналогом формулы (1) для а = 1 является

    ^

    Ь'_1

    _51
    г,'

    (5>/
    V



    Отметим, что если Rh зависит от а, то значение Rk при a = 1
    используется для исчисления отношения в правой части (5).
    Выражение в левой части проверочного соотношения (2) принимает вид
    min
    [ a y+(l-a)flh],
    (6)
    fe=l, 2, ..., N

    однако при a = 1 выражение в квадратных скобках не зависит
    от k. Для того чтобы устранить этот недостаток, обратим внимание
    на следующее обстоятельство. Если при k' достигается минимум
    функции g (k), то при k' минимизируется и ag (k) -j- b, если a > 0.
    Пусть g (k) — выражение в квадратных скобках (6); a = (1 — a)"1,
    b = —g n (1 — a)"1. Проделаем необходимые преобразования в (6)
    и установим, что применим следующий оптимизационный выбор:
    [_(l + a+...+a*-i)£ n +fl ft ]=

    min
    h=l, 2

    IV

    =

    min

    h=l, 2, . . . , N

    [-kgn + Rk]=-k'gn + Rb-,

    a = l,

    (7)

    который аналогичен проверочному соотношению (2).
    Здесь также приходится использовать значение R^, соответствующее а = 1, если в действительности Rk зависит от а. Читатель
    должен истолковать критерий (7) при a = 1.
    В целом метод можно обрисовать следующим образом:
    Шаг1. Выберем произвольную исходную стратегию и примем п=0.
    Шаг 2. Для заданной пробной стратегии k вычислим соответствующие средние затраты за отрезок:
    gn = ^.

    (8)

    Шаг 3. Проверим возможность дальнейших улучшений, вычислив
    min

    ft=l, 2

    N

    [-kgn + Rh] = k'gn + Rk',

    (9)

    т. е. выбрав k'.
    Шаг 4. Прекратим расчеты, если —k'g n + Rh- = 0. В противном случае изменим стратегию на k'. Перейдем от итерации п к итерации (ге + 1) и обратимся к выполнению шага 2 на основе новой
    пробной стратегии.
    Для того чтобы понять действие описываемого метода, применим
    его к примеру (3). Вычисления выполняются в следующей последовательности:
    g° = RJi = 8,7 для k — 1 в качестве исходной программы; (I)

    160

    ГЛАВА 11

    min (-1-8,7 + 8,7; -2-8,7 + 12,7; -3-8,7 + 14,7; -4-8,7 +
    + 19,7; -5-8,7 + 28,7) = -15,1 для k' = 4;
    (II)
    l
    g = Д 4 /4 = -4,925;
    (III)
    min
    (~k- 4,925 + # f t )= —0,025 для /с' = 3;
    (IV)
    ft=l, 2 ____ ,5

    £2 = д 3 /з = 4,9;
    min
    ( — £-4,9 + Дь) = 0 для k' = 3.
    ft=l, 2

    .., 5

    (V)
    (VI)

    Заметим, что один и тот же вариант k' = 3 выбирается на двух
    итерациях подряд; это обусловливает прекращение расчетов на
    шаге 4, и k' = 3 является оптимальным.
    Возможно, читателю на самом деле не безразличны два варианта,
    которые представляются одинаково предпочтительными в соответствии с проверочным соотношением (9). Так, если добавить еще
    одну альтернативу k = 6 с затратами R6 = 2RS = 29,4 единицы,
    то для этой альтернативы значение g будет тем же при а = 1, что
    и для альтернативы k = 3. Однако при а < 1
    Л«

    Ня

    1 —а 6

    1 — а3

    RS

    ^

    RS

    1—а 3 -^ 2 '

    Таким образом, при О =£С а < 1 интегральный дисконтированный эффект для k — 6 всегда больше, чем для k = 3. Следовательно,
    даже если в соответствии с проверочным соотношением (9) k = 3
    является оптимальным, действительно предпочтительным может
    быть k = 6.
    11.8. ЭКВИВАЛЕНТНАЯ

    ЗАДАЧА ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ

    В разд. 10.7 рассматривалась связь между рекуррентными соотношениями динамического программирования и линейным программированием. Вкратце можно отметить, что значения, получаемые
    на основе динамического программирования, соответствуют длинам
    кратчайших маршрутов ic вершине конечного состояния от остальных
    вершин ациклической сети. В моделях с бесконечным плановым
    периодом аналогия с сетью остается в силе, за тем лишь исключением, что оптимальная стационарная стратегия обусловливает
    бесконечное число прохождений через соответствующий набор дуг.
    Сетевая интерпретация задачи приведена в гл. 12, однако в настоящем разделе предварительно рассматриваются прямая и двойственная задачи линейного программирования для простой задачи восстановления с бесконечным числом этапов.
    Функциональное уравнение
    /=

    min

    ft=l, 2 , . . ., ,\

    h

    la f + Rk],

    0<а<1

    (1)

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    167

    .можно представить в виде следующей задачи:
    Максимизировать /

    (2)

    / < a f e / + # ft , Л = 1, 2, . . ., N,

    (3)

    при условиях
    тде на знак / не налагается ограничений. Преобразовав (3), получим
    •ограничения
    (4)

    Задачу удобно преобразовать, построив ее целевую функцию
    иа основе эквивалентного среднего эффекта. Для этой цели, как
    •обычно, примем g = (1 — a) /. Тогда задаче (2) и (4) эквивалентна
    •следующая оптимизационная задача:
    Максимизировать g

    (5)

    при условиях
    Д

    *•!'

    *

    * = 1, 2, . - . , N,

    (6)

    тде на знак g не налагается ограничений. Выражение (5) есть целевая
    •функция, а (6) — ограничения двойственной задачи.
    Если задача (5) — (6) именуется двойственной, то прямая задача
    формулируется следующим образом:
    Минимизировать % ( i+ a + *.". + a"-i)
    ft=i
    при условии

    Xh

    (7)

    JV

    (8)

    S

    ft=l

    где £fe ^ 0. Выражение (7) есть целевая функция, а (8) — ограничение прямой задачи. Отметим, что при а = 1 целевая функция принимает такой вид:
    Минимизировать ^ (~Г")

    Xh

    '

    h=i

    Поскольку в прямой задаче имеется только одно ограничение (8),
    оптимальное базисное решение включает только одно х& = 1,
    которое и соответствует лучшему варианту восстановления К;
    все остальные х^ = 0.

    168

    ГЛАВА 11

    11.9. ПОВТОРНОЕ РАССМОТРЕНИЕ ЗАДАЧИ
    НАХОЖДЕНИЯ КРАТЧАЙШЕГО ПУТИ

    В гл. 12 рассматриваются более общие динамические модели,
    чем задача восстановления, приведенная в предыдущих разделах.
    Для того чтобы отыскать стратегию, оптимальную для бесконечногопланового периода, применяются методы последовательных приближений, описанные в разд. 11.6 и 11.7; это описание должно подготовить читателя к восприятию последующего материала. В качестве дополнительной подготовки читателю полезно снова рассмотреть задачу нахождения кратчайшего пути на сети общего вида.

    Р и с . 11.5. Задача нахождения кратчайшего пути.

    Здесь эта задача обобщается с целью включения дисконтирования
    в рассмотрение проблемы, а также повторного анализа алгоритмов,,
    обращающего особое внимание на изучение идеи последовательных
    приближений.
    Как и ранее, сеть включает р вершин и систему дуг; (i, /) обозначает дугу из вершины i в вершину /, a cii — затраты на перемещение по дуге (i, j) из вершины i в /'. Можно считать, что с1} —
    интегральные дисконтированные затраты, зависящие от коэффициента дисконтирования а, однако в индексах такая зависимость,
    в явном виде не показана. Вершина конечного состояния обозначена
    индексом г.
    Так, например, рассмотрим сеть рис. 11.5, в точности повторяющую сеть рис. 7.16 (стр. 292). Вершина конечного состояния обозначена индексом 1. Примем следующую ориентацию во времени1
    для маршрута от вершины k к вершине 1: вершина k отображает
    текущее состояние, а вершина 1 — состояние в конце последнего»

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    169

    шага. Например, маршрут, проходящий через дуги (7, 2), (2, 3),
    (3, 4) и (4, 1), отображает текущее решение выехать из вершины 7
    в вершину 2, последующее решение выехать из вершины 2 в вершину 3 и т. д.
    Предположим, что для перемещения по каждой дуге требуется
    один отрезок планового периода. (Более общий случай, при котором
    для переезда по отдельным дугам требуется более одного отрезка,
    рассматривается далее.) Пусть коэффициент дисконтирования за
    один отрезок равен а, причем 0 ^ а =$С 1. Обобщим определениеy t ,
    которое в разд. 7.6 обозначало длину кратчайшего пути из вершины i
    в конечную вершину г. Примем здесь, что
    yi — интегральные дисконтированные затраты, соответствующие перемещению по оптимальному маршруту (1)
    от вершины i до вершины конечного состояния г,
    где «оптимальный» означает маршрут, интегральные дисконтированные затраты для которого минимальны. Таким образом, если
    первый шаг оптимального маршрута из вершины i в вершину г
    направлен в вершину /, то
    Уг = ayj + си

    .

    (2)

    и

    Vi < «г/А + CM

    для всех k.

    (3)

    [Дайте истолкование выражениям (2) и (3).] Поскольку условия (2)
    и (3) должны выполняться для всех вершин i, отличающихся от
    конечной вершины г, yt должны удовлетворять системе экстремальных уравнений
    z/j = min
    (ayj + ctj) для всех i=£r, z/r = 0.
    (4)
    по всем (г, j)
    в сети

    Иными словами, для каждой вершины i выбирается та из имеющихся в сети дуг (i, /'), которая позволяет минимизировать затраты.
    [Понятно, что при а = 1 выражение (4) сводится к тому соотношению, которое было приведено в разд. 7.6.]
    Концептуально настоящая задача решения экстремального уравнения в одном отношении более трудна, чем модель восстановления,
    описанная в предыдущих разделах. В модели восстановления имелась всего лишь одна неизвестная величина /; здесь же имеется
    (р — 1) неизвестных yt (i =/= г). Однако в другом отношении модель
    нахождения кратчайшего пути более проста, поскольку существует
    вершина конечного состояния, а следовательно, ут = 0. Это значит,
    что хотя период, необходимый для переезда из некоторой вершины k
    в вершину г, зависит от длины выбранного маршрута, длительность
    этого периода всегда конечна. Далее читатель узнает, как методы
    последовательных приближений могут быть использованы для вычисления всей совокупности yt.

    170

    ГЛАВА 11

    Метод итераций по критерию. Подходы, рассмотренные при
    анализе модели восстановления, можно использовать для последовательного получения приближенных значений yt. Алгоритм
    приближений в пространстве функций или итераций по критерию
    состоит в нахождении
    y?+l=

    min

    по всем (г, j)
    в сети

    (ау? + си)

    для всех i^=r, г/?+1 = 0.

    (5)

    Вычислительный процесс прекращается на итерации (п + 1),
    ;
    если для каждой вершины i либо 1/™+* = г/™, либо
    У? < ау? + с„

    (6)

    по всем имеющимся в сети дугам (i, j), причем строгое равенство в (6)
    выполняется хотя бы для одной из дуг (i, j). Удобным исходным
    предположением о значении yt для всех i является
    yl = 0.

    (7)

    Если все сц > 0, то при исходных у\ = 0 значения у? монотонно
    возрастают. Воспользовавшись (7), можно истолковать у? как минимальные интегральные дисконтированные затраты для любого маршрута из вершины i, включающего точно п дуг, при условии что
    в маршрут не входит вершина конечного состояния; в последнем
    случае маршрут заканчивается в вершине г. (Каждая из дуг может
    входить в маршрут более одного раза.)
    Всегда ли работает алгоритм итераций по критерию (5) и (7)?
    Если а = 1 и на любом замкнутом циклическом маршруте затраты
    положительны, то существует такое ге*, что у? = г/? для всех
    п ^ п*, так что вычислительный процесс завершается за конечное
    число итераций. Это объясняется тем, что по мере увеличения п
    любой маршрут длиной п дуг в конце концов достигает вершины
    конечного состояния. Если же а < 1, то предположим, что для
    любой вершины k интегральные дисконтированные затраты на перемещение по каждому из циклических маршрутов, начинающихся
    и завершающихся в вершине /с, будут больше, чем для лучшего,
    не содержащего циклов маршрута, ведущего от вершины k к вершине
    конечного состояния. При таком предположении сходимость достигается за конечное число итераций.
    Пример. Расчеты с использованием алгоритма итераций по критерию (5) и (7) для примера, изображенного на рис. 11.5, при а = 1
    приведены в таблице рис. 11.6. Чтобы читатель мог проверить,
    насколько он усвоил этот метод, ему рекомендуется выполнить
    расчеты со всеми подробностями, использовав для этого рис. 11.5
    (нужно перерисовать сеть на отдельный лист бумаги) и сверяя
    результаты для каждого п с рис. 11.6. Отметим, что на итерации 9
    все у\ = yl, так что вычислительный процесс завершен.

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    Заметим

    также,
    ,,71+1

    iV 2

    что для
    -.71

    1

    171

    п = О, 1, . . ., 5

    С~

    и_

    — J/7 + 2?

    iin + l
    z/
    — г/,,712 -f-| c., 72 .
    7

    т

    /Q\
    (»;

    Таким образом, для п ^ 6 лучший маршрут из вершины 2,
    включающий п дуг, содержит цикл, в который входит вершина 7.
    Аналогично этому лучший маршрут из вершины 7, включающий
    п дуг, содержит цикл, в который входит вершина 2. Отметим также,
    что набор входящих в маршрут дуг на итерации N = 7 является
    11 —

    0

    1

    2

    3

    4

    5

    6

    7

    8

    9

    у-

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    У»

    0

    1

    2

    3

    4

    5

    6

    6

    6

    6

    У*

    П

    0

    1

    2

    3

    3

    3

    3

    3

    3

    3

    П

    0

    1

    2

    2

    2

    2

    2

    2

    2

    2

    П'

    0

    1

    2

    3

    3

    3

    3

    3

    3

    3

    »?

    0

    3

    4

    5

    6

    6

    6

    6

    6

    6

    у?

    0

    1

    2

    3

    4

    5

    6

    7

    7

    7

    ЦП

    0

    1

    2

    3

    4

    5

    6

    7

    8

    8

    У

    8

    Р и с . 11.6. Приближение снизу в пространстве
    функций (метод итераций по критерию).

    оптимальным, однако у\ не равно истинному значению у8, в связи
    с чем расчеты на этой итерации не прекращаются.
    Можно применить также метод приближений (5) в пространстве
    •функций, обеспечивающий монотонную сходимость к j/j сверху.
    В качестве исходного варианта выберем для каждой вершины дугу
    таким образом, чтобы любая вершина была соединена маршрутом
    с вершиной конечного состояния. Пусть у° — соответствующие
    интегральные дисконтированные затраты для маршрута от вершины i
    к вершине конечного состояния. Как и выше, существует такое п*,
    п*, так что вычислительный процесс
    что гу™ = у™* для всех п

    172

    ГЛАВА 11

    завершается за конечное число итераций. Подобный подход очень
    тесно связан с алгоритмом нахождения кратчайшего пути, описанным в разд. 7.6. Однако в этом алгоритме не уделяется особого внимания очередности вершин i при вычислении приближенных значений
    г/,. Здесь же, при точном выполнении (5), прежде чем вернуться
    к какой-то ранее рассмотренной вершине, требуется вычислить
    новое приближенное значение г/™"1"1 для всех остальных вершин.
    Следовательно, при использовании (5)
    сходимость может оказаться не такой
    71 =
    0
    1
    2
    3
    быстрой, как в других методах.
    Продемонстрируем метод (5), обеспечивающий сходимость сверху, на примере
    0
    0
    0
    0
    У?
    сети рис. 11.5 при а=1. Пусть исходный
    набор включает дуги (8, 7), (7, 3), (6, 4),
    е 6 6 6
    (5, 4), (4, 1), (3, 4) и (2, 3). Убедимся в
    том, что соответствующие значения у\ приведены в таблице рис. 11.7 в столбце, где
    3
    3
    3
    3
    ^з"
    п равно нулю. Выполнив операции процесса последовательных приближений (5)
    о
    2
    2
    2
    на сети рис. 11.5, проверим правильность
    »?
    значений г/™, проставленных и во всех
    остальных
    столбцах таблицы рис. 11.7.
    3
    3
    3
    3
    При этом заметим, что набор дуг являет"?
    ся оптимальным уже при п = 1, однако
    расчеты не прекращаются на следующей
    6
    7
    6
    6
    П'
    (п = 2) итерации, поскольку у\ •=£ у\.
    Процесс завершается только при п = 3,
    7
    8
    7
    7
    потому что все у\ = у\.
    Как видно из приведенного примера,
    при
    методе аппроксимации в пространст9
    8
    8
    9
    у »
    ве функций оптимальную стратегию можно найти на итерации /г, однако соотР и с . 11.7. Приближение
    ветствующие значения у™ могут быть и
    сверху
    в
    пространстве
    не оптимальными. В тех случаях когда
    функций (метод итераций
    приближения осуществляются снизу, у™
    по критерию).
    не обязательно должны соответствовать
    какому-то конкретному маршруту от вершины i к вершине конечного состояния.
    Метод итераций в пространстве стратегий. Перейдем к приближениям в пространстве стратегий. На каждой итерации п необходимо исчислить фактические значения yt для проверяемой стратегии. Алгоритм состоит ит следующих шагов:
    Шаг 1. Выберем некоторый исходный набор (р — 1) дуг таким
    образом, чтобы каждая вершина была соединена маршрутом с вершиной конечного состояния, и примем п = 0.
    Шаг 2. Для заданного проверяемого набора дуг вычислим соответствующие y'i, причем г/™ = 0.

    »»

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    173

    Шаг 3. Проверим возможность дальнейших улучшений, вычислив
    min

    по всем (i, з)
    в сети

    (ocz/? + Cj 7 -)=EF?

    для всех г^=г.

    (9)

    Шаг 4. Прекратим расчеты, если для каждой вершины г выполняется условие Y? = j/f, поскольку набор дуг является оптимальным. В противном случае изменим входящие в набор дуги для всех
    вершин k, по которым У™ < г/™, включив в набор дуги, соответствующие УЬ, которые удовлетворяют (9). Перейдем от итерации п
    к итерации (п + 1) и обратимся к шагу 2, использовав новый проверяемый набор дуг.
    Для того чтобы проверить, как читатель усвоил алгоритм, следует
    найти этим методом решение задачи на сети рис. 11.5, начав с того же
    набора дуг, который был рассмотрен в столбце п = 0 таблицы
    рис. 11.7, и соответственно с тех же значений у°. Убедимся в том,
    что при п = 1 все Y\ равны у\, являющимся истинными значениями z/j. Следовательно, вычислительный процесс завершается при
    п = 1, поскольку оптимальная стратегия найдена.
    Сравнивая методы итераций в пространстве функций и в пространстве стратегий, заметим, что, согласно правой части (5) и левой
    части (9), требуется выполнять одни и те же вычисления. Однако
    при приближениях в пространстве функций полученное значение (5)
    используется затем на следующей итерации в качестве нового приближенного значения г/ г , тогда как при приближениях в пространстве стратегий на шаге 2 требуется вычислять новые приближенные
    значения yt. Именно эти дополнительные вычисления обеспечивают
    прекращение процесса сразу же по нахождении оптимальной стратегии (более подробно о шаге 2 см. упражнение 58).
    Выводы. Методы последовательных приближений — как в пространстве функций, так и в пространстве стратегий — применимы
    к решению экстремального уравнения, построенного для задачи
    нахождения кратчайшего пути от каждой вершины k к вершине
    конечного состояния. Следует обратить внимание на два различия
    в применении метода итераций по критерию к модели восстановления и к сетевой модели. В модели восстановления имелось только
    одно неизвестное, а следовательно, только одно экстремальное уравнение, тогда как в сетевой модели имеется (р — 1) неизвестных
    и экстремальных уравнений. Плановый период в модели восстановления является неограниченным, и метод итераций по критерию не
    обязательно обеспечивает сходимость за конечное число итераций;
    напротив, при нахождении кратчайшего пути в сетевой модели метод
    сходится за конечное число итераций. В гл. 12 описанная выше
    сетевая постановка задачи совмещается с процессом оптимизации
    в течение бесконечного планового периода.
    В приведенном обсуждении было принято, что для перемещения
    по любой дуге требуется только один отрезок. Однако иногда жела-

    174

    ГЛАВА 11

    тельно, чтобы на перемещение по дуге затрачивалось несколько
    отрезков. Так, в модели восстановления, отображаемой сетью
    рис. 11.4, перемещение по дуге (г, /) означает, что пройдено (i — /)
    отрезков. Описанные выше методы легко модифицировать с учетом
    такого обобщения модели.
    Пусть
    hij — число отрезков, необходимое для перемещения из вершины i
    в вершину ] по дуге (i, ;).
    (I)
    Тогда каждой дуге (г, /) можно сопоставить коэффициент дисконтирования, равный
    au = (a)h4, 0 < а < 1 .
    (II)
    Экстремальные уравнения, определяющие интегральные дисконтированные показатели у(, вместо (4) имеют следующий вид:
    yt=
    min (auyi + Cij) для всех i=£r и уг = 0\
    (III)
    по всем (г, j)
    в сети

    точно так же изменяются все остальные формулы в настоящем разделе: везде вместо а пишем а^.
    КОНТРОЛЬНЫЕ

    УПРАЖНЕНИЯ

    1. Объясните, в каком смысле предполагается стационарность"
    а) в численном примере, приведенном в таблице рис. 11.1;
    б) в модели эксплуатации лесного хозяйства с бесконечным плановым периодом (разд. 11.3);
    в) в модели восстановления с бесконечным плановым периодом;
    (разд. 11.4).
    2. В разд. 11.1 утверждается, что при сравнении двух стратегий
    с бесконечным плановым периодом определение их относительной
    предпочтительности не вызывает принципиальных трудностей, если:
    при любой конечной длительности планового периода одна из стратегий обеспечивает больший совокупный эффект, чем другая. Согласен ли с этим читатель? По каким соображениям? (Имеются ли
    в приведенном утверждении какие-то неявные допущения?)
    3. По данным рис. 11.1 проверьте, что:
    а) для любого четного отрезка стратегия D обеспечивает больший
    совокупный эффект, чем стратегия В;
    б) для любого отрезка (3 + 6га), где п = О, 1, 2, . . ^стратегия В «лучше» стратегий А, С или D;
    в) общие члены последовательностей, отображающих средний
    эффект за отрезок, описываются формулами (I) — (V), которые приведены в начале разд. 11.2;
    г) найдите такое значение п*, что для любого отрезка п, где
    п ^ п*, средний эффект за отрезок для стратегии А заключен в пределах 2 + 0,01. Найдите аналогичное значение п* для стратегий В,
    С и D. Найдите аналогичное значение га*, обеспечивающее для стра-

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    175

    тегии G нахождение среднего эффекта за отрезок в пределах ll/3 ±
    + 0.01. Как изменится значение п* для стратегии А, если «допуск»
    вместо 0,01 будет принят равным 0,001?
    4. Рассмотрите задачу выбора одной из двух следующих стратегий: стратегии А (см. таблицу рис. 11.1) и стратегии, отличающейся
    от нее только тем, что на первом отрезке эффект равен 100 единицам.
    Предложите одно или несколько общих правил, применимых к задаче
    выбора одной из двух стратегий, для которых значения среднего
    эффекта за отрезок при бесконечном плановом периоде являются
    одинаковыми. Всегда ли предложенные вами правила обеспечивают
    однозначный выбор из числа стратегий, дающих одинаковый средний
    эффект за отрезок при бесконечном плановом периоде? Обоснуйте
    ваш ответ.
    5. Для стратегии Е (см. таблицу рис. 11.1) вычислите средний
    эффект за отрезок. Согласны ли вы с приводимым в тексте утверждением о том, что при включении в число возможных альтернатив
    стратегии D стратегию Е, вероятно, целесообразно исключить из
    дальнейшего рассмотрения? Предположим, что стратегии D не
    существует; целесообразно ли по-прежнему исключать стратегию Е
    из рассмотрения? Приведите соображения, обосновывающие ваши
    ответы.
    6. Пусть рассматриваются варианты а) — з) постановки задачи,
    при каждом из которых к стратегиям, представленным в таблице
    рис. 11.1, добавляется соответствующая альтернатива из числа
    приведенных ниже. Определить, является ли дополнительная стратегия доминирующей по отношению к стратегиям рис. 11.1 или
    какие-либо из них будут доминирующими по отношению к этой
    стратегии; вычислите для дополнительной стратегии средний эффект
    за отрезок.
    а) 3, 4, -1, 3, 4, -1, . . .,
    б) 6, -1, 1, 6, -1, 1, . . .,

    в) 0, 0, 8, 0, 0, 8, 0, 0, . . .,
    г) 0, 8, 0, 0, 0, 8, 0, 0, . . .,
    д) 4, 0, 4, 0, 4, 0, . . .,
    е) 0, 4, 0, 4, 0, 4, . . .,
    2
    ж) 2, 2 / 3 , 2, 2, 2, . . ., 2, . . .,
    3
    4
    з) 2 + е, 2 + е\ 2 + е , 2 + е , 2 + е\ 2 + е6, . . .,
    где е — постоянная величина, заключенная между
    1 и 0.
    (Указание: ответ зависит от конкретного значения е.)
    7. Для каждого варианта постановки задачи в упражнении 6
    определите вид общего члена последовательности значений среднего
    эффекта за отрезок, аналогично тому как это сделано посредством
    формул (I) — (V) в начале разд. 11.2.
    8. Рассмотрите следующую конечную последовательность значений эффекта: RI = 4, Д 2 = 12, R3 = 24, Rt = 40; предполагается

    176

    ГЛАВА 11

    что коэффициент дисконтирования а = 1 / 2 и что при соответствующей процентной ставке (по формуле сложных процентов) можно брать
    или давать взаймы любую сумму денег.
    а) Чему равен интегральный дисконтированный эффект для этой
    последовательности? Чему равна соответствующая процентная ставка в формуле сложных процентов?
    б) Если мы хотим перераспределить эффект во времени таким
    образом, что весь эффект будет возникать на отрезке 1, а для остальных отрезков равняться нулю, то какова величина получаемого
    эффекта на отрезке 1? (Укажите, сколько можно взять или дать
    взаймы на каждом отрезке, когда будет произведен расчет по этим
    ссудам, а также каково значение соответствующей процентной
    ставки.)
    в) Ответьте на вопрос б), однако при условии, что весь эффект
    требуется получить на отрезке 2; на отрезке 3; на отрезке 4.
    г) Подробно объясните, почему последовательность Si = 2, £ 2 =
    = 16, S з = 20, последовательность RJ.
    д) Подробно объясните, почему последовательность I\ = 4, 772 =
    = 8, Т з — 24, Tt = 48 является менее предпочтительной, чем последовательность RJ.
    9. Рассмотрите последовательность значений эффекта в упражнении 8. При каком значении ос последовательности RJ и Sj будут
    одинаково предпочтительны? RJ и Г/? Sj и Т;?
    10. Выведите формулу (5) разд. 11.2, определяющую значение
    интегрального дисконтированного эффекта, и выполните все промежуточные алгебраические преобразования, позволяющие получить (6) - (12).
    11. Выведите формулы интегрального дисконтированного эффекта, аналогичные (6) — (12) из разд. 11.2 для последовательностей,
    приведенных в упражнении 6.
    12. а) Выполните промежуточные алгебраические преобразования, необходимые для получения (13) — (17) из разд. 11.2.
    б) Какое заключение можно сделать о сравнительной предпочтительности стратегий А и С? Стратегий А и D? Проверьте, действительно ли стратегия В более предпочтительна, чем стратегия D, при
    а < V 2 и менее предпочтительна при а >> V 2 .
    13. Для каждого из указанных ниже вариантов постановки
    задачи выведите формулы, аналогичные (13) — (17) из разд. 11.2
    для последовательностей, приведенных в таблице рис. 11.1 и в
    упражнении 6. Укажите диапазоны значений ос, на которых предпочтительна та или иная последовательность:
    а) стратегия В и стратегия Е,
    б) стратегия В и стратегия С,
    в) стратегия С и стратегия D,
    г) стратегия А и стратегия из п. а) упражнения 6,

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    177

    д) стратегия В и стратегия из п. а) упражнения 6,
    е) стратегия С и стратегия из п. а) упражнения 6,
    ж) стратегия С и стратегия из п. б) упражнения 6,
    з) стратегия А и стратегия из п. в) упражнения 6,
    и) стратегия D и стратегия из п. з) упражнения 6.
    14. Проверьте правильность формул (I) — (IV) в материалах
    повышенной трудности, приведенных после (16) в разд. 11.2.
    15. а) Выполните промежуточные алгебраические преобразования, необходимые для получения формул (18) и (19) разд. 11.2 для
    стратегии В *.
    б) Получите аналогичные результаты для стратегии А* и убедитесь в том, что полученный интегральный дисконтированный эффект
    при 0 ^ а < 1 является конечным.
    в) Выведите для стратегий А* и В* формулу, аналогичную
    (13) — (17) из разд. 11.2. Укажите диапазоны значений а, на которых предпочтительна та или иная стратегия.
    г) Определите интегральный дисконтированный эффект для стратегии С*, представленной следующей последовательностью:
    1, 6, -1, 1, 6, -1, 2, 12, -2, 2, 12, - 2, 3, 18, -3, 3, 18, -3,
    Ответьте на вопросы варианта в) для стратегий В* и С*.
    д) Определите интегральный дисконтированный эффект для стратегии D*, представленной следующей последовательностью:
    2
    2 / 3 , 2, 2, 2, 2, 2, 4, 4, 4, 4, 4, 4, 12, 12, 12, 12, 12, 12, . . . .
    Ответьте на вопросы варианта в) для стратегий В* и D*.
    16. Проверьте правильность (22) из разд. 11.2. Покажите, почему
    для стратегии В* при а = 1 эквивалентный средний эффект не
    определен.
    17. Определите эквивалентный средний эффект для каждой из
    последовательностей упражнения 6. Вычислите значения при а = 1.
    18. В тексте разд. 11.2 утверждается, что, хотя в соответствии
    с критерием эквивалентного среднего эффекта стратегии А, В, С и D
    (см. таблицу рис. 11.1) при а = 1 являются одинаково предпочтительными, решение должно основываться на личном суждении
    руководителя, а не базироваться на каком-либо научном обосновании. Затем в тексте указывается возможность привести доводы
    в пользу того, что при а = 1 стратегия А является оптимальной,
    стратегии С и D очень близки к оптимуму, а стратегию В следует
    исключить из дальнейшего рассмотрения. Рассмотрите затронутые
    проблемы; укажите, согласны ли вы с приведенными доводами.
    Обоснуйте высказанную вами точку зрения.
    19. а) В тексте разд. 11.3 сделано предположение о том, что
    последовательность допущения.
    12-0734

    178

    ГЛАВА 11

    б) Покажите, что из неравенств (2) следует возможность определения оптимального значения К из (3). Всегда ли (3) определяет
    единственное значение К, если имеются альтернативные оптимальные стратегии? Обоснуйте ваш ответ.
    в) Дайте истолкование неравенств (2) и критерия прекращения
    вычислительного процесса (3) при а = 1.
    20. а) Вычертите график функции (4) из разд. 11.3 при а =0,75
    и Ь = 0,5.
    б) Выполните промежуточные алгебраические преобразования
    и покажите, что, если N& описывается (4), критерий (3) прекращения вычислительного процесса упрощается и сводится к (5).
    в) Постройте пример такой последовательности N&, что при
    фиксированном значении коэффициента дисконтирования 0 < а < 1
    не существует конечного значения К, которое было бы оптимальным.
    г) Для числового примера (6) разд. 11.3 покажите, что К = 4
    удовлетворяет (5).
    д) Проверьте правильность вычисленных в (7) интегральных
    дисконтированных показателей для k = 1 и k — 2.
    21. Рассмотрим модель эксплуатации лесного хозяйства (раздел 11.3). Пусть
    Nk = а + kb, где а + Ъ > 0 и b>Q.

    а) Определите критерий прекращения вычислительного процесса, аналогичный (5).
    б) Примем а =2/3, а = 3 и Ъ = 9. Чему равно оптимальное
    h l
    значение К! Вычислите дисконтированные показатели a. ~ Nk Для
    /с = 1, Л = 2, & = 3 и /с = 4.
    22. Рассмотрим модель эксплуатации лесного хозяйства (разд.
    11.3). Пусть
    Nk = а + k*b,

    где а + b > 0 и Ь > 0.

    а) Определите критерий прекращения вычислительного процесса, аналогичный (5).
    б) Примем а = 2/3 , а = 3 и 6 = 9. Чему равно оптимальное
    значение Ю
    в) Вычислите дисконтированные показатели а*"1.^ для k =
    = 1, 2, . . . , А: + 1, где k — оптимальное значение, полученное
    в постановке б).
    23. а) В тексте разд. 11.3 предполагается, что последовательh
    ность ИДЭ Ш/(1 — a ) удовлетворяет неравенствам (14). Рассмотрите трудности, возникающие при отказе от этого упрощающего
    допущения.
    б) Покажите, почему из (14) следует, что оптимальное значение k1
    можно определить из (15). Всегда ли (15) определяет единственное
    значение fe1, если имеются альтернативные оптимальные стратегии?
    Обоснуйте ваш ответ.

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    179

    в) Объясните, почему отношение в правой части (15) больше,
    чем Nk/Nh+l для любого k.
    г) Покажите, что если ос = 1, неравенства (15) можно представить в виде (17).
    24. Рассмотрите численный пример (6) из разд. 11.3.
    а) Используйте (15) для проверки того, что при бесконечном
    плановом периоде k' = 2 является оптимальной стратегией.
    б) Проверьте правильность приведенных в (18) значений F (1)
    и F(2).
    25. Рассмотрите модель, приведенную в упражнении 21. Определите оптимальную стратегию k' для бесконечного планового
    периода. Вычислите F (k' — 1), F (kr) и F (k' + 1). Чему равно
    сокращение интегрального дисконтированного эффекта при использовании вместо k' оптимальной стратегии в условиях однократного
    принятия решений, т. е. Ю
    26. Рассмотрите модель, приведенную в упражнении 22. Определите оптимальную стратегию k' для бесконечного планового
    периода. Вычислите F (k' — 1), F (k') и F (k' -\- 1). Чему равносокращение интегрального дисконтированного эффекта при использовании вместо k' стратегии К, оптимальной в условиях однократного принятия решений?
    27. Рассмотрите модель восстановления с бесконечным плановым
    периодом, приведенную в разд. 11.4.
    а) Пусть все R^ > 0. Объясните, почему не существует конечного значения / при а = 1, удовлетворяющего (5).
    б) Пусть все Rh = 0. Объясните, почему любое конечное значение / удовлетворяет (5) при а = 1.
    в) Объясните, почему из (5) следуют неравенства (6), а из (6)
    в свою очередь — (7).
    г) Приведите промежуточные алгебраические преобразования,
    необходимые для получения правой части (8).
    д) Приведите промежуточные алгебраические преобразования,
    необходимые для получения (9), и покажите, что при ее = 1 выражение (9) превращается в (10).
    е) Покажите, каким образом преобразуются (6), (7), (9) и (10),
    если целью оптимизации в (5) является достижение максимума.
    28. Рассмотрите модель управления запасами с вогнутой функцией затрат, приведенную в конце разд. 11.4.
    а) Покажите, что полученное из (VI) k позволяет минимизировать
    затраты (V).
    б) Выведите формулу Rh (а) при коэффициенте дисконтирования а, если 0 < а < 1 и дисконтируются затраты по каждому
    отрезку. Какова зависимость оптимального размера партии от
    значения ос? Какова зависимость оптимального размера партии,
    если такая зависимость имеется, от закупочной цены с? Дайте
    подробное объяснение.

    180

    ГЛАВА И

    29. Рассмотрите теорему о длительности планового периода
    в модели восстановления, приведенной в разд. 11.5. Приняв К = 5
    и п* = 8, дайте истолкование:
    а) формуле (3) при kio = 4; при & 3 0 = 4; при k20 = 6,
    б) формуле (4) при п = 10; при п = 20,
    в) если стратегия 12 оптимальна для всех п > 22, верно ли
    изо = 12? Будет ли стратегия 12 оптимальной при бесконечном
    плановом периоде? [Обоснуйте ваши ответы с учетом (3) и (4).]
    г) если стратегия 9 оптимальна при бесконечном плановом
    периоде, /е 3 = 9; будет ли оптимальна программа 9 для всех п ;> 3?
    30. В каждой из приведенных ниже задач примените метод рассмотрения бесконечности как предела возрастающей длительности
    конечного планового периода и найдите наименьшее значение п,
    такое, что стратегия, оптимальная при бесконечном плановом периоде, будет оптимальна и при конечной длительности, равной и, п + 1
    и п + 2. (Напоминаем, что целью оптимизации здесь является
    достижение максимума.)
    а) Условный пример, описываемый выражениями (6) и (18) (модель
    эксплуатации лесного хозяйства) из разд. 11.3, где Rh s= ИДЭ [k].
    б) Задача, приведенная в упражнениях (21) и (25).
    в) Задача, приведенная в упражнениях (22) и (26).
    31. Рассмотрите численный пример (2), использованный для
    .демонстрации алгоритма итераций по критерию (1) в разд. 11.6.
    а) Проверьте правильность (4) и, вычислив значения показателей
    внутри скобок, убедитесь в том, что при k = 1 достигается минимум.
    б) При известном значении /15, которое приведено в (5), вычисли1в
    те / и проверьте, что k = 3.
    в) Примите /° = 20 и выполните операции алгоритма итераций
    ло критерию. Завершите вычислительный процесс после п = 3.
    г) Примите /° = 20 и выполните операции алгоритма итераций
    по критерию. Завершите вычислительный процесс после п = 3.
    д) Пусть RI = 7. Выполните операции алгоритма итераций по
    критерию, приняв /° = 0. При каком п впервые появляется значение k — 3? Каково соответствующее значение /п? Сравните это
    4
    значение /™ с / в (5).
    е) Пусть RI = 10. Выполните операции алгоритма итераций
    по критерию, приняв /° = 0. При каком п впервые появляется
    п
    значение / = 3? Каково соответствующее значение /"? Сравните
    это значение /п с /4 в (5).
    ж) Пусть Л 4 = 17,9. Выполните операции алгоритма итераций
    по критерию, приняв /° = 43,50. При каком п впервые появляется
    п
    значение k = 3? Каково соответствующее значение / ? Сравните
    1
    это /" с f в (7).
    з) Предположим, что на каждой итерации /г, где п ^ п', выбирается одна и та же оптимальная стратегия для бесконечного планового периода. Выведите формулу вычисления /п при известном
    значении /п.

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    181

    32. Графическое отображение метода итераций по критерию.
    Для каждого k вычертите график функции у = off -\- Rh, где у —
    ордината, а / — абсцисса. Для каждого значения / одна (или более)
    из этих линий будет лежать ниже других. Обведите красным
    карандашом график кусочно-линейной функции, состоящей из этих
    «минимальных» отрезков. Затем вычертите график функции у = /.
    Пересечение этой прямой и графика кусочно-линейной функции дает
    решение — искомое значение /. При использовании метода итераций
    по критерию мы начинаем с /°. Проведите в точке / = /° вертикальную прямую и выберите значение k, отвечающее точке ее пересечения
    с графиком кусочно-линейной функции. Соответствующее значение
    этой функции представляет собой следующее пробное значение /, то есть /*; его можно найти, проведя горизонтальную прямую
    через точку на графике кусочно-линейной функции до пересечения
    с прямой у = /. По мере повторения выполняемых итераций пробные точки все более и более приближаются к точке пересечения
    прямой у = / и графика кусочно-линейной функции.
    В каждой из приведенных ниже задач вычертите график для
    каждого значения k, постройте график кусочно-линейной функции,
    вычертите прямую у = / и найдите решение. Продемонстрируйте
    реализацию метода итераций по критерию при /° = 0 и при /° =
    — /?i/(l — а). [Итеративный метод демонстрируйте на графике,
    не выполняя лежащих в его основе вычислительных операций.
    Напоминаем, что в задачах б), в) и г) целью оптимизации является
    достижение максимума.]
    а) Численный пример (2) разд. 11.6.
    б) Иллюстративный пример, описываемый выражениями (6)
    и (8) (модель эксплуатации лесного хозяйства) из разд. 11.3.
    в) Задача, приведенная в упражнениях 21 и 25.
    г) Задача, приведенная в упражнениях 22 и 26.
    33. В каждой из указанных ниже задач примените метод итераций по критерию, описанной в разд. 11.7. Обозначьте п' индекс
    первой итерации, на которой соответствующее k является оптимальным для условий бесконечного планового периода; завершите
    вычислительный процесс после итерации (п' + 2). Начните в первую
    очередь с /° = 0. Затем начните с /° = Н}/(1 — а). (Напоминаем,
    что целью оптимизации является достижение максимума.)
    а) Иллюстративный пример, описываемый выражениями (6)
    и (8) (модель эксплуатации лесного хозяйства) из разд. 11.3, где
    Rh = ИДЭ Ik].
    б) Задача, приведенная в упражнениях 21 и 25.
    в) Задача, приведенная в упражнениях 22 и 26.
    г) Для каждой задачи опишите стратегию, действительно позволяющую получить /п'+2. Является ли эта стратегия стационарной?
    [Примечание: такая стратегия может и не существовать.]
    д) Для каждой задачи проверьте, действительно ли | /п — / I ^
    п
    <а ) / ° - / | при га = 1, 2, . . ., п' + 2 .

    182

    ГЛАВА 11

    34. В каждой из указанных ниже задач примените алгоритм
    итераций по стратегиям, описанный в разд. 11.7. В качестве исходной стратегии при п = 0 используйте сперва k = 1, а затем k =
    = К + 1, где К — стратегия, оптимальная для бесконечного планового периода.
    а) Иллюстративный пример, описываемый выражениями (6)
    и (8) (модель эксплуатации лесного хозяйства) из разд. 11.3, где
    Rh = ИДЭ [fc].
    б) Задача, приведенная в упражнениях 21 и 25.
    в) Задача, приведенная в упражнениях 22 и 26.
    35. Рассмотрите возможность применения критерия среднего
    эффекта за отрезок в алгоритме итераций по стратегиям, описанном
    в разд. 11.7.
    а) Покажите, что в терминах эквивалентного среднего эффекта (5) соответствует (1).
    б) Аналогично этому покажите, что (6) соответствует (2).
    в) Обозначьте через g (k) выражение, заключенное в (6) в квадратные скобки. Обозначьте а = (1 — а)"1, Ъ = —g n (1 — а)"1. Постройте ag (k) -+- b и покажите, что с помощью необходимых алгебраических преобразований получается простое выражение в левой
    части (7).
    г) Дайте истолкование проверочного критерия (7) при а = 1.
    36. Используйте алгоритм итераций по стратегиям, описанный
    в разд. 11.7, для нахождения оптимального решения иллюстративного примера (6) — модель эксплуатации лесного хозяйства из
    разд. 11.3 при ос = 1. В качестве исходной стратегии примите k = 1.
    (Напоминаем, что целью оптимизации является здесь достижение
    максимума.)
    37. Рассмотрите задачу нахождения кратчайшего пути в разд. 11.9
    и дайте истолкование (2) и (3).
    38. Примените алгоритм итераций по критерию, описанный
    в разд. 11.9, для решения примера, отображенного на рис. 11.5,
    при а = 1 и у\ = 0.
    а) Выполните вычисления со всеми подробностями и проверьте
    правильность результатов, приведенных в таблице рис. 11.6.
    б) Найдите лучший маршрут из п дуг, соединяющих вершину 2
    с вершиной конечного состояния при п s^ 6; то же для вершины 7.
    39. Примените алгоритм итераций по критерию, описанный
    .в разд. 11.9, для решения задачи, изображенной на рис. 11.5, приняв
    а = 1 и выбрав значения г/° соответствующими набору дуг (8, 7),
    (7,5), ( 6 , 4 ) , ( 5 , 4 ) , (4,1), ( 3 , 4 ) и ( 2 , 3 ) .
    а) Проверьте правильность значений г/°, приведенных в таблице рис. 11.7.
    б) Выполните вычисления со всеми подробностями и проверьте
    правильность результатов, приведенных в таблице рис. 11.7.
    [Процесс последовательных приближений (5) выполняйте на
    рис. И.5.]

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    183

    40. Примените алгоритм итераций по критерию, описанный
    в разд. 11.9, для решения задачи, изображенной на рис. 11.5, приняв
    i (i =й= г).
    а = 1 и у\ = 10 для всех
    41. Примените алгоритм итераций по критерию, описанный
    в разд. 11.9, для решения задачи, изображенной на рис. 11.5, приняв
    а = 1 и выбрав значения у\ соответствующими набору дуг (8, 5),
    ( 7 , 3 ) , ( 6 , 4 ) , ( 5 , 1 ) , (4,1), ( 3 , 1 ) и (2,1).
    42. В каждом из указанных ниже вариантов постановки задачи
    примените алгоритм итераций по критерию, описанный в разд. 11.9,
    для решения задачи, изображенной на рис. 11.5, при а = 0,8.
    Завершите вычислительный процесс после итерации 9.
    а) yl = 0.
    б) у\ вычисляются для набора дуг, приведенного в упражнении 39.
    в) уЧ вычисляются для набора дуг, приведенного в упражнении 41.
    43. Примените алгоритм итераций по стратегиям, описанный
    в разд. 11.9, для решения задачи упражнения 41.
    44. Примените алгоритм итераций по стратегиям, описанный
    в разд. 11.9, для решения задачи упражнения 42:
    а) вариант б),
    б) вариант в).
    45. Объясните, как вы понимаете следующие термины:
    бесконечный плановый период;
    стационарность;
    стационарная стратегия,
    бесконечная последовательность значений эффекта;
    полезность денежных поступлений и затрат;
    средний эффект за отрезок;
    процентная ставка и сложные проценты;
    коэффициент дисконтирования;
    интегральный дисконтированный эффект (или интегральные
    дисконтированные затраты);
    эквивалентный средний эффект;
    почти оптимальный;
    модель восстановления;
    отрезок (или момент) восстановления;
    функциональное (или экстремальное) уравнение;
    метод последовательных приближений;
    метод итераций по критерию (метод последовательных приближений в пространстве функций);
    метод итераций по стратегиям (метод последовательных приближений в пространстве стратегий);
    монотонно возрастающая (убывающая) последовательность;
    сходимость сверху (снизу).

    184

    ГЛАВА 11

    УПРАЖНЕНИЯ НА РАЗВИТИЕ ВЫЧИСЛИТЕЛЬНЫХ НАВЫКОВ

    46. Задача замены оборудования. Рассмотрим задачу фирмы
    «Резвая фреза», приведенную в упражнении 41 гл. 6. Предположим,
    что необходимо определить стратегию замены оборудования для
    бесконечного планового периода. Пусть стоимость новой модели на
    любом отрезке равна р, число альтернативных стратегий N = 7,
    а остаточная стоимость (продажная цена) заменяемого оборудования и эксплуатационные расходы приведены в упражнении 41
    гл. 6 (т. 1). В приведенных ниже вариантах а) и б) найдите оптимальную стратегию замены при а = 1.
    а) р = 100.
    б) р = 90.
    в) Найдите наибольшее и наименьшее значения р, при которых
    k = 3 является оптимальным для а = 1.
    г) Пусть а < 1, закупки и эксплуатационные расходы совершаются в начальный момент отрезка, а остаточная стоимость
    поступает в конце отрезка. Так, если сверлильный станок приобретают в начале настоящего отрезка и эксплуатируют три отрезка,
    интегральные дисконтированные затраты для него за эти три отрезка
    составляют р + rt + ocr2 + а?гя + СС З У З . Для приведенных выше
    вариантов а) и б) определите наименьшее значение ос, при котором
    сохраняется оптимальность стратегии, лучшей при а = 1; вычислите
    соответствующую процентную ставку.
    д) Если закупочная стоимость увеличена до (р + d), а каждое
    из значений остаточной стоимости — до (УД + d), сохранится ли
    при этом неизменным выбор оптимальной стратегии. Объясните,
    непременно сформулировав в явном виде все сделанные допущения.
    47. Обычно применяемый метод вычисления квадратного корня
    1
    из положительного числа А представляет собой следующий алгоритм
    п
    последовательных приближений (предложен Ньютоном): / = 0,5 X
    X I/""1 -f- (A/fn~1)]. Дайте графическую интерпретацию этого метода. Покажите, что последовательность /п сходится к истинному
    значению / = у А при любом исходном /° > 0. Покажите также,
    что /п сходится к / сверху (при п ^ 1).
    48. Рассмотрите модель восстановления с бесконечным плановым
    периодом, приведенную в разд. 11.4, приняв N = 5, Ri = 5, Ro = 8,
    R3 = 10, Д 4 = 12, RS = 18.
    а) Определите оптимальную стратегию для любого значения а при
    О < а < 1.
    б) Пусть а = 0,9. Примените подход, при котором бесконечность
    рассматривается как предел возрастающей длительности конечногопланового периода (разд. 11.5). Завершите вычислительный процесс
    если одна и та же стратегия выбирается на пяти итерациях подряд.
    в) Пусть ос = 0,9. Примените алгоритм итераций по критерию,
    описанный в разд. 11.6, приняв сначала /° = 0, а затем /° =
    = .Ri/(l — а). Обозначим п' первую итерацию, на которой k являет-

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    185

    ся оптимальным для бесконечного планового периода; завершите
    вычислительный процесс на итерации п' = 2.
    г) Используя графическое представление алгоритма, описанное
    в упражнении 32, выполните на графике итерации варианта в).
    д) Пусть а = 0,9. Примените алгоритм итераций по стратегиям, описанный в разд. 11.7, приняв в качестве исходного k = 1.
    е) Пусть а = 1. Примените алгоритм итераций по стратегиям,
    описанный в разд. 11.7, приняв в качестве исходного k = 1.
    49. Для решения каждого из указанных ниже упражнений гл. 7
    (т. 1) используйте алгоритм итераций по критерию при нахождении
    кратчайшего пути, описанный в разд. 11.9, приняв а = 1 и у\ соответствующими заданному исходному набору дуг. Затем примените
    алгоритм итераций по стратегиям, описанный в разд. 11.9, начав
    с тех же исходных наборов дуг.
    а) Упражнение 27, вариант а).
    б) Упражнение 28, вариант а).
    в) Упражнение 60, вариант а).
    г) Упражнение 60, вариант б).
    д) Упражнение 61, вариант а).
    е) Упражнение 61, вариант б).
    ж) Упражнение 62, вариант а).
    з) Упражнение 62, вариант б),
    и) Упражнение 63, вариант а),
    к) Упражнение 63, вариант б),
    л) Упражнение 65, вариант а).
    50. Для решения каждого из указанных ниже упражнений
    гл. 7 (т. 1) сначала используйте алгоритм итераций по критерию'
    при нахождении кратчайшего пути, описанный в разд. 11.9, приняв
    а = 1 и выбрав yl соответствующими заданному исходному набору
    дуг. Затем примените алгоритм итераций по стратегиям, описанный
    в разд. 11.9, начав с тех же исходных наборов дуг.
    а) Упражнение 27, вариант а), исходный набор дуг (2, 1), (3, 7)г
    (4, 1), (5, 1), (6, 4), (7, 6) и (8, 5).
    б) Упражнение 28, вариант а), исходный набор дуг (7, 4), (3, 2)т
    (4, 3), (5, 1), (6, 5), (7, 3) и (8, 6).
    в) Упражнение 60, вариант а), исходный набор дуг (2, 1), (3, 2)т
    (4, 3), (5, 4) и (6, 5).
    г) Упражнение 60, вариант б), исходный набор дуг (1, 2), (3, 2)г
    (4,3), ( 5 , 4 ) и (6,5).
    д) Упражнение 61, вариант а), исходный набор дуг (2, 1), (3, 2),.
    (4,3), (5,4) и (6,5).
    е) Упражнение 61, вариант б), исходный набор дуг (1, 2), (3, 2),.
    (4,3), ( 5 , 4 ) и (6,5).
    ж) Упражнение 62, вариант а), исходный набор дуг (2, 1), (3, 2),
    (4,1), ( 5 , 4 ) и (6,5).
    з) Упражнение 62, вариант б), исходный набор дуг (1, 2), ( 3 , 2 ) т
    (4,1), (5,4) и ( 6 , 5 ) .

    186

    ГЛАВА 11

    и) Упражнение 63, вариант а), исходный набор дуг (2, 1), (3, 2),
    (4,3), (5,4) и (6,5).
    к) Упражнение 63, вариант б), исходный набор дуг (1, 2), (3, 2),
    (4,3), (5,4) и (6,5).
    л) Упражнение 65, вариант а), исходный набор дуг (2, 1), (3, 2),
    (4,5), (5,6) и (6,3).
    ДОПОЛНИТЕЛЬНЫЕ УПРАЖНЕНИЯ

    Упражнения 51—56 относятся к модели восстановления, описанной в разд. 11.4.
    51. а) Покажите, что /, определяемое из (5), представляет собой
    максимальный дисконтированный эффект для любой (не обязательно
    стационарной) стратегии.
    б) Покажите, что оптимальная стратегия всегда является стационарной. (Указание: может оказаться полезным доказательство
    и использование результата, полученного в упражнении 55.)
    52. Докажите теорему о длительности планового периода для
    модели восстановления, приведенную в разд. 11.5.
    53. Задача о ранце. Покажите связь между теоремой о продолжительности планового периода для модели восстановления,
    приведенной в разд. 11.5, и задачей о ранце, описанной в упражнении 46 гл. 10.
    54. Рассмотрите алгоритм итераций по критерию, описанный
    в разд. 11.6.
    а) Покажите, что если все /?ь > 0, а /° = 0, то на каждой итерации /п+* > /п.
    ft
    б) Покажите, что если /° = Rkl({ — a ) для некоторого выбранп
    1
    ного k, то на каждой итерации / + =£С /™.
    п
    1
    n
    n
    1
    в) Покажите, что если / ~ , то / утверждение, если в обоих неравенствах знак меняется на противоположный.)
    г) Покажите, что если стратегия k выбрана на итерации (п — 1),
    а затем отвергнута на итерации п, то она больше не будет выбрана.
    55. Рассмотрите алгоритм итераций по стратегиям, описанный
    в разд. 11.7. Предположим, что имеется некоторая стратегия, не
    обязательно стационарная, и соответствующее ей пробное значение /п. Покажите, что если стратегия k' удовлетворяет условию
    ccft7n ~Ь Rk' < ini TO использование стратегии k' в качестве стационарной стратегии для бесконечного планового периода позволяет
    получить /"+1 < /™. Дайте объяснение этому явлению.
    56. Графическое отображение алгоритма итераций по стратегиям. Разработайте графический подход, аналогичный описанному
    в упражнении 32 и отображающий вычислительный процесс алгоритма итераций по стратегиям. Примените этот подход к решению
    численного примера (3) в разд. 11.7. Потребует ли большего числа
    итераций любая другая исходная стратегия (k Ф 1)?

    РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    187

    57. Рассмотрите задачу нахождения кратчайшего пути, характеризуемую экстремальными соотношениями (4) в разд. 11.9.
    а) Предложите прямой алгоритм (т. е. алгоритм, позволяющий
    сразу же вычислять истинное значение каждого y t ) для ациклической сети. (Указание: модифицируйте подход, описанный в разд. 7.7
    т. 1.)
    б) Примените предложенный алгоритм для решения задачи мистеpa M., изображенный на рис. 8.1, приняв для простоты а = -^-.
    ^
    58. Рассмотрите описанный в разд. 11.9 алгоритм итераций
    по стратегиям для решения задачи нахождения кратчайшего пути.
    а) Покажите, что при а = 1 на каждой итерации пробный набор дуг на шаге 2 обладает следующим свойством: каждая вершина
    соединена некоторым маршрутом с вершиной конечного состояния.
    б) Постройте пример, позволяющий продемонстрировать, что
    свойство, которое указано в п. а), не обязательно наблюдается
    при ос < 1. Предложите способ вычисления у? для того случая,
    когда пробный набор дуг включает циклы; дайте объяснение значениям г/", получаемым с помощью предлагаемого метода. (Удостоверьтесь в том, что предлагаемый метод в конечном счете действительно обеспечивает нахождение кратчайшего пути.)

    ГЛАВА 12

    Методы оптимизации
    при бесконечном плановом периоде
    12.1. ДИСКРЕТНОЕ ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ

    Теперь читатель подготовлен к тому, чтобы объединить различные
    изученные им подходы к оптимизации при бесконечном плановом
    периоде с методами последовательных приближений. При чтении
    настоящей главы следует стремиться к тому, чтобы:
    1) выяснить математические характеристики оптимального решения задачи для бесконечного планового периода;
    2) выявить пути нахождения этого решения с помощью методов
    последовательных приближений.
    Полное овладение численными методами является не столь уж
    важной целью. Более того, практические расчеты выполняются
    не вручную, а на электронных вычислительных машинах. Однако
    для эффективного использования полученных решений необходимо
    знать главные особенности каждой из моделей; это позволит выяснить
    действительную применимость любого конкретного численного
    решения.
    Модель управления запасами. Начнем с рассмотрения конкретного примера, который позволит нам показать, какой вид оптимизационных рекуррентных соотношений динамического программирования соответствует случаю бесконечного планового периода.
    В частности, мы рассмотрим стационарную модель управления
    запасами, близко напоминающую ту модель, которая изучалась
    ранее, в разд. 8.3. Используем систему обозначений, учитывающую
    сделанные допущения о стационарности. Управляющей переменной
    является
    х = Объем производства,
    который, согласно нашим требованиям, должен быть неотрицательным целым числом. Обозначим соответствующую функцию производственных затрат для любого отрезка через С (х), а функцию затрат
    на содержание запасов — через h ( j ) , где / — уровень запасов на
    конец отрезка. Примем, что для всех отрезков спрос одинаков
    и равен d (d — положительное целое число), причем он должен быть
    удовлетворен полностью и своевременно. Как и ранее, положим
    коэффициент дисконтирования за отрезок равным а (0 ^ а < 1).
    Введем обозначение:
    /п (0 — интегральный дисконтированный эффект для оптимальной
    производственной программы при начальном уровне запасов
    i за п отрезков до конца планового периода.

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    189

    Тогда рекуррентное соотношение динамического программирования, соответствующее модели с конечным плановым периодом,
    имеет вид

    /„ (i) = min [C(x) + h ( i + x — d) + a/ n _ t (i + x-d)],
    ж

    (1)

    где минимум находится для неотрицательных целых значений при
    х ^ d — J.
    Для бесконечного планового периода соотношение, аналогичное (1), вероятно, имеет вид
    j ( i ) = min[C(x) + h(i + x — d) + a f ( i + x — d)], 0
    (2)

    ЭС

    Здесь / (i) понимается как интегральный дисконтированный
    эффект для оптимальной производственной программы в случае
    бесконечного планового периода, если уровень запасов на начало
    текущего отрезка равен i.
    Отметим некоторые различия между выражениями (1) и (2).
    Важнейшее из них состоит в том, что и в левой, и в правой части
    соотношения (2) находится одна и та же функция / (i). Поэтому
    выражение (2) называется функциональным, или экстремальным,
    уравнением. По существу, это система уравнений, где каждому
    из возможных значений переменной состояния, т. е. начального
    уровня запасов i, соответствует одно уравнение. Следовательно,
    (2) представляет собой функцию f (i) для всего диапазона значений
    переменной состояния. Как читатель помнит из рассмотрения простого функционального уравнения, составленного для модели восстановления в разд. 11.4, необходимо определить, имеет ли система
    уравнений (2) однозначное и конечное решение.
    Это можно выяснить, анализируя данную конкретную модель.
    Однако можно добиться и более существенных успехов, анализируя
    функциональные уравнения более общей модели, по отношению
    к которой модель управления запасами является всего лишь частной
    (полученной путем добавления нескольких слабых ограничений).
    В процессе подготовки к анализу этой общей модели рассмотрим
    возможность представления (2) с помощью сетевой оптимизационной
    модели.
    Предположим, что число возможных значений начального уровня
    запасов является конечным; пусть каждая из вершин сети соответствует одному из этих уровней. Когда мы находимся в вершине i,
    решение производить количество продукции х можно представить
    в виде дуги из вершины i в вершину (i -f- х — d). Соответствующая
    стоимость перемещения по дуге равна С (х) + h (i + х — d). Вместо
    / (i) введем в (2) обозначение г/,-, так что г/г- соответствует интегральному дисконтированному эффекту, отвечающему вершине i. Полученная сеть близко напоминает сеть, приведенную в разд. 11.9,
    отличаясь от нее лишь тем, что не имеет вершины конечного состоя-

    190

    ГЛАВА 12

    ния, так что маршрут, соответствующий значению у^ по существу
    является бесконечным.
    Характеристика сети. Рассмотрим сеть, включающую р вершин
    и множество ориентированных дуг, которые соединяют между собой
    некоторые из вершин. Иными словами, предположим, что из каждой
    вершины можно переместиться по крайней мере в какую-либо другую
    вершину. Каждой дуге (i, /) соответствует эффект или затраты ctj,
    причем время перемещения из i в / равно одному отрезку. Какивыше,
    коэффициент дисконтирования обозначим а.
    Пусть маршрут начинается в некоторой произвольно выбранной
    вершине i. Предположим, что из вершины i мы направляемся в вершину у и, следовательно, производим затраты ctj. Предположим
    далее, что из вершины j мы направляемся в вершину /с, причем
    возникают дисконтированные затраты сссд. Если процесс продолжается неограниченное время, маршрут является бесконечным.
    Дополнительно добавляются все новые затраты, однако умноженные
    на все более высокие степени коэффициента дисконтирования а,
    где а < 1. Обозначим через yt интегральные дисконтированные
    затраты для оптимального бесконечного маршрута, который начинается в вершине i.
    Если принятая стратегия является стационарной, то каждый
    раз, вернувшись к вершине, мы снова выбираем ту же дугу, которая
    была выбрана при предыдущем заходе в эту вершину. Пусть существует стационарная стратегия, которая является оптимальной;
    тогда соответствующее yt удовлетворяет функциональным уравнениям

    г/г=

    min

    по всем (i, j)
    в сети

    (ayj + aj) для всех вершин i, 0^а<;1.

    (3)

    (Задача нахождения маршрута с минимальными средними затратами
    за отрезок рассматривается в разд. 12.2.) Заметим, что ни одна
    из вершин не рассматривается в качестве вершины конечного состояния. В этой модели удобно допустить существование дуг (i, О»
    поскольку оптимальный маршрут для бесконечного планового периода может включать повторные перемещения из вершины i в нее же.
    (Так, сеть, которая соответствует модели восстановления с бесконечным числом этапов, приведенной в разд. 11.4, включает только
    одну вершину и N дуг, начинающихся и кончающихся в этой же
    вершине.)
    Сформулировав экстремальные уравнения (3), мы допустили
    существование оптимальной стационарной стратегии и соответствующего z/j. Однако, для того чтобы использовать (3) на практике,
    необходимо уметь ответить на следующие вопросы:
    I) Всегда ли можно для всех значений yt отыскать однозначное
    и конечное решение?
    II) Если всегда, то является ли соответствующая стационарная
    стратегия действительно оптимальной?

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    191

    Иными словами, прежде чем применять численные методы, необходимо удостовериться, всегда ли имеют решения функциональные
    уравнения (3). Если такие решения существуют, дуга (t, 7), позволяющая достичь минимума для вершины (s), является элементом
    следующей стационарной стратегии: находясь в вершине г, всегда
    выбирайте дугу (i, ;). Поскольку число вершин является конечным,
    в конце концов придется снова и снова перемещаться по одному
    и тому же набору дуг. Конкретный характер такого цикла может
    зависеть от местонахождения в начальный момент времени. Поэтому
    второй вопрос заключается в том, нельзя ли улучшить результаты,
    перейдя к другой стационарной стратегии или же к нестационарной
    стратегии, т. е. к такой стратегии, при которой учитывается, по
    какому маршруту мы попали в вершину il
    Ответы как на вопрос I), так и на вопрос II) являются утвердительными. Можно строго показать следующую теорему.
    Т е о р е м а о с т а ц и о н а р н о й с т р а т е г и и . Всегда
    существует однозначно определенное конечное г/ь удовлетворяющее
    экстремальным уравнениям (3), и соответствующая стационарная
    стратегия является оптимальной •— лучшей из всех допустимых
    стратегий
    Существование стационарной стратегии, которая является истинным оптимумом, доказывается и для того случая, когда в качестве
    критерия оптимальности принят минимум эквивалентных средних
    затрат за отрезок при а = 1. Однако в этом случае система (3) не
    является адекватной системой функциональных уравнений; данный
    случай рассматривается в следующем разделе.
    С помощью почти тривиальных изменений модель можно обобщить на ситуацию, при которой для перемещения по дуге требуется
    1
    более одного отрезка . Ввиду необходимых изменений системы обозначений формулы кажутся сложными (почти во всех формулах
    а заменяется на а^).
    В конце разд. 10.7 приводилась достаточно общая каноническая
    форма модели для конечного планового период». Если включить
    коэффициент дисконтирования а, рекуррентное соотношение примет вид
    in (s) = optimum (Rn (s, dn) + afn^ [Tn (s, 4)1} для всех s в Sn, ,
    dn в Dn (s)
    при /„ (s) = 0, W
    где s — состояние системы, Sn — множество всех возможных состояний на этапе п, dn — принимаемое решение на этапе тг, Dn (s) —
    множество всех допустимых значений dn, Rn (s, dn) — непосредственный экономический эффект, обусловленный решением dn, если
    система находится в состоянии s, Tn (s, dn) — преобразованное
    состояние системы на следующем этапе.
    Предположим, что структура модели является стационарной,
    так что в (I) можно для каждого п ввести упрощенные обозначения
    S, D (s), R (s, d) и Т (s, d). Допустим, далее, что существует опти-

    192

    ГЛАВА 12

    мальная стратегия, являющаяся стационарной. Тогда естественным
    аналогом (I) для бесконечного числа этапов будет
    optimum {R (s, d) -f- af [T (s, d)]} для всех s в Постулируем также, что система может иметь конечное число
    состояний, которые для удобства пронумеруем, присвоив им индексы
    s = l, 2, . . ., р, а также что D (s) включает конечное число решений. При наличии этих двух структурных предположений будем
    называть модель (II) дискретной задачей динамического программирования.
    Если Т (s, d) = Т (s, d') только при d = d', то существует однозначное соответствие между сетевыми экстремальными уравнениями (2) и (II). Каждое состояние s соответствует вершине s, а / (s) =
    = ys. Решение d отображается дугой из вершины s в вершину
    Т (s, d), причем R (s, d) — соответствующая стоимость перемещения
    по этой дуге.
    Рассмотрим сеть, в которой для перемещения по каждой дуге (i, j)
    требуется время, равное 1ъц отрезков, причем не все Нц должны быть
    обязательно равны одному отрезку. Определим соответствующий
    коэффициент дисконтирования следующим образом:
    atj = aft».
    (Ill)
    Тогда экстремальные уравнения для этой более общей задачи
    записываются не в форме системы (3), а в следующем виде:
    yi=
    min (ацу] + сц) для всех вершин i(0 < a <2).
    (IV)
    по всем (г, j)
    в сети

    12.2. МЕТОДЫ ПОСЛЕДОВАТЕЛЬНЫХ

    ПРИБЛИЖЕНИЙ

    В разд. 11.5, посвященном модели восстановления, были рассмотрены многие важные идеи, лежащие в основе нескольких методов
    последовательных приближений. Все приведенные ранее соображения в равной мере применимы и здесь, так что, прежде чем читатель
    перейдет к детальному изучению этих методов, для него может
    представить интерес краткий обзор упомянутых идей.
    Вкратце рассмотрим два подхода\ В случае первого из них мы
    пытаемся угадать неизвестное значение функции г/, и на каждой
    итерации улучшаем проверяемое приближенное значение. При втором подходе мы пытаемся угадать оптимальную стратегию! Если
    при использовании пробной стратегии выполняется экстремальное
    уравнение, вычислительный процесс прекращается, если нет, исследуется новая пробная стратегия. По сравнению с первым подходом
    при втором подходе требуется больший объем вычислительных операций на каждой итерации, однако всегда обеспечивается сходимость
    за конечное число итераций.
    Метод итераций по критерию. Решение функциональных уравнений можно отыскивать методом последовательных приближений

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    193

    в^пространстве функций. Подобно тому, как и в тт. 11, будем считать,
    что у\ — произвольно выбранные значения i/j, и применим метод
    итераций по критерию:
    г/"+1 =

    min

    по всем (г, j)
    в сети

    (аг/? + сг;-)

    для всех г.

    (1)

    Тогда каждое из у} стремится к некоторому пределу, однако, как
    оыло показано для простой модели восстановления в разд. 11.4,
    сходимость I/™ не обязательно обеспечивается за конечное число
    итераций. Более того, даже если в течение нескольких итераций (I)
    выбирается одна и та же стратегия, это еще не означает, что она
    действительно является оптимальной для бесконечного планового
    периода. По существу даже при сколь угодно большом числе итераций не обязательно существует «сходимость стратегии», т. е. не
    обязательно существует единственная стратегия, которая оптимальна для всех конечных п ^ N, сколь бы ни велико было N.
    Выбрав в качестве начального приближения все значения у°
    нулевыми, мы приходим к такому же вычислительному процессу,
    как и при рассмотрении некоторой фиксированной модели с конечным плановым периодом. В частности, г/" отображают интегральные
    дисконтированные затраты для оптимального маршрута длиной
    п дуг, начинающегося в вершине i. По аналогии с теоремой о длительности планового периода для модели восстановления, приведенной в разд. 11.5, можно говорить о существовании такого п*,
    что для каждого п > п* любая стратегия, являющаяся оптимальным
    текущим решением в модели с конечным плановым периодом длительностью п отрезков, одновременно есть и оптимальная стационарная стратегия для модели с бесконечным плановым периодом. Более
    того, при известных с^ и а можно вычислить значение п*, позволяющее применить данный подход.
    Если все c t j ^ 0 и все у\ — О, значения у? возрастают монотонно.
    Сходимость сверху обеспечивается для любого c ( j , если вначале
    выбрана некоторая пробная стратегия и по приведенной ниже формуле (2) вычислены соответствующие этой стратегии значения г/?.
    Тоща, если прекратить расчеты на итерации т и использовать промежуточную оптимальную стратегию, полученную методом итераций
    по критерию (I), в качестве стационарной стратегии для модели
    с бесконечным плановым периодом соответствующие значения интегральных дисконтированных показателей не будут превышать
    уГ в (I).
    Доказательство сходимости yl к yt при произвольно выбранных
    у° аналогично доводам, приведенным в разд. 11.6 для модели восстановления с бесконечным числом этапов. Проведем доказательство
    для сети более общего вида, в которой коэффициент дисконтирования для дуги (i, j) равен а,,.

    194

    ГЛАВА 12

    Пусть для каждой вершины i дуга (г, j*) оптимальна в модели
    с бесконечным плановым периодом, а дуга (i, j) оптимальна на
    итерации п, выполняемой в соответствии с (I). Тогда
    с

    Для всех i,

    Ut = <*-ц*Уз* + а*
    1

    у? < atjvy^

    (I)

    для всех i,

    (II)

    уп, - yi < а и » (г/Г1 - Ы < ad n _ l t

    (III)

    + си*

    так что
    1

    где

    d n _i =E max | z/Г — Уь\h

    Аналогично этому

    У? = ъиУГ1 + Ч,
    У1 < atjy} + Си,

    так что

    Mi - yf < <*tj (yj - г/Г1) < ada-i.
    Следовательно,
    |y"-zM<«dn-i Поскольку 0 ^ a <;
    Пусть все с^- = 0 и
    yf можно установить на
    ний. Для всех i при
    i/l=

    (IV)
    (V)
    (VI)
    (VII)

    1 , отсюда следует сходимость.
    все г/° = 0. Тогда монотонное возрастание
    основе следующих индуктивных соображеп = 1
    min

    по всем (г, ;')
    в сети

    (a1/) + C|J-)>0 = y?,

    (VIII)

    так что у\ ~^ у\. Предположим, что для п = 1, 2, . . ., т и для всех
    i г/? ^ г/г""1- Пусть на итерации тга дуга (г, /) является оптимальной.
    Тогда
    yT+1 = aijyT + Cij>atjyT-1 + cij>

    min

    по всем (i, j)
    в сети

    (а^у^ + с^) = yf

    (IX)

    и, следовательно, yf ^ г/"'1 при тг = т + 1.
    Аналогично этому если величины у\ вычисляются в соответствии с первоначально выбранной стратегией, то сходимость сверху
    можно доказать по индукции. Для п — 1 и для всех i
    yl=

    min

    по всем (i, 3)
    в сети

    (a.ijy1 + cij)^.a.ihyak + clh = yi,

    (X)

    где (i, k) — дуга, соответствующая начальной стратегии, так что
    У\ ^ У\- Предположим, что для тг = 1, 2, . . ., т и для всех i
    У? ^ yf'1- Пусть на итерации т дуга (i, /) является оптимальной.
    Тогда
    l/f+1 < «иУТ + ctj < аиуГ1 + си = УТ
    (XI)
    и, следовательно, yf ^ yf'1 при п = m + 1.

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    195

    Приводимый ниже пример, основанный на сетевом представлении выбора между вариантами В и D (которые приведены в таблице рис. 11.1), позволяет при а = 0,5 продемонстрировать сходимость
    yf без соответствующей сходимости стратегий. Пусть сеть имеет
    4 вершины, однако несколько возможных решений будет только
    в вершине 1:
    вершина 1: с12 = 2 2 / 3 , с13 = 3; вершина 2: с 2 2 = 2;
    вершина 3: с 34 = 1;
    вершина 4: с 43 = 3,
    и пусть а = 0,5. Начертим сеть, соответствующую (I). Убедимся
    также в том, что

    3/1 = 4 у,

    3/2 = 4 >

    2/з = З у , !/4 = 4 у

    (II)

    удовлетворяют функциональным уравнениям и что обе дуги (7, 2)
    и (7, 3) являются оптимальными.
    Реализацию алгоритма итераций в пространстве функций начнем,
    приняв все z/j = 0. Тогда на итерации п, где п = 1, 2, 3, получим:
    i/;=min (0,5x0+2у; 0,5x0+3) = 2у для дуги (7,2);

    (III)

    x

    yJ=0.5xO+2=2; $=0,5x0+1=1; z/ 4=0,5 X 0+3=3;
    г/'=min (0,5x2+2 у ; 0,5х1+3)=3у

    для дуги (7,3);

    (IV)

    ^=0,5x2+2=3; j£=0,5x3+l=2 1; ^=0,5X1 + 3=3 1 ;
    у?=тш

    (0,5хЗ+2у; 0,5x2 у+3) =4-1 для дуги ( 1 , 2 ) ;

    (V)

    г/з=0,5хЗ+2=3-1; z/ 2 3 =0,5x3y+1=2 A ; ^ = o , 5 x 2 - l + 3 = 4 l .
    При увеличении п значения у? стремятся к значениям г/j в (II),
    однако при нечетных п всегда позволяет достичь минимума дуга (1,2),
    а при четных — дуга (1, 3). Следовательно, «сходимость стратегий»
    отсутствует.
    Метод итераций по стратегиям. Экстремальные уравнения (I)
    можно решать с помощью алгоритма последовательных приближений в пространстве стратегий, который имеет следующий вид.
    Шаг 1. Выберем произвольную исходную стратегию и примем
    п = 0.
    Шаг 2. Для заданной пробной стратегии вычислим значения yf
    в соответствии с уравнениями расчета «стоимости вершин»:
    yf = ayf + ci} или yf — ay? = cti
    (2)
    для всех вершин i (формула расчета «стоимости вершин»),
    где дуга (i, /) отображает решение для вершины i, соответствующее
    конкретной пробной стратегии.

    196

    ГЛАВА 12

    Шаг 3. Проверим возможность дальнейших улучшений, вычислив
    min
    (ay7- -\- cij) для всех i (проверка возможности улучшения). (3)

    по всем (i, з)
    в сети

    Шаг 4. Прекратим расчеты, если Y? = у? для всех i. В противном случае изменим стратегию для каждой вершины /с, для которой
    У™ < J/fti выбрав дугу, позволяющую достичь в (3) значения У".
    Перейдем от итерации п к итерации (п -j- 1) и обратимся к выполнению шага 2 на основе новой пробной стратегии.
    Техника и логика метода итераций по стратегиям. Отметим, что
    в формуле расчета стоимости (2) требуется решить систему линейных
    уравнений. Поскольку имеется по одному уравнению и по одной
    переменной г/™ для каждой вершины i и поскольку 0 ^ а < 1,
    система (2) всегда имеет единственное решение. Применяя формулу (2), читатель обнаружит, что удобно вначале вычислять значения у?, входящих в цикл, а лишь затем — остальных переменных,
    выражая их через ранее вычисленные переменные. Вычисления
    прекращаются в тот момент, когда для всех i выполняется условие
    У? = У?1 поскольку в этом случае значения г/f удовлетворяют экстремальным уравнениям.
    Если в (3) i — k, величину (ayf + ckj) можно интерпретировать
    как интегральные дисконтированные затраты на перемещение из
    вершины k в вершину /; затем используется полная стратегия, проверяемая на итерации п и включающая дугу, ранее зафиксированную
    для вершины k в составе пробной стратегии, проверяемой на итерации п. Если при этом для некоторого k выяснится, что при выборе
    дуги (ft, /) Yk < J/", то, вероятно, решение можно дополнительно
    улучшить, выбирая эту дугу всякий раз, когда мы окажемся в вершине k. Новое значение г/™+1 отображает именно такую пересмотренную стратегию.
    Таким образом, можно сделать важный вывод: если при использовании некоторой стратегии постоянно выбирается дуга (ft, /),
    то можно проверить, нельзя ли улучшить решение, используя
    такой критерий, при котором дуга (ft, /) выбирается только в качестве текущего решения! (Этот вывод следует прочесть повторно,
    потому что полученный глубокий результат вовсе не очевиден.)
    Метод последовательных приближений в пространстве стратегий
    обладает следующими свойствами:
    +1
    д
    +1
    I) Z/? ^ У? Д я любой вершины i и i/™ < у%, если У£ <С yft.
    II) Алгоритм является конечным, т. е расчеты выполняются
    за конечное число итераций.
    III) Стратегия, позволяющая по завершению расчетов достичь Y?,
    является оптимальной.
    Как будет более четко показано в разд. 12.5, метод последовательных приближений в пространстве стратегий обладает сформулированными выше свойствами потому, что он весьма близок к симплексному методу. На каждой итерации текущая стратегия является

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    197

    допустимой; однако соответствующие значения переменных г/™ могут
    и не быть допустимыми в том смысле, что они могут не удовлетворять
    экстремальным уравнениям. Правило прекращения расчетов представляет собой проверку допустимости. Доказательство сходимости
    метода итераций по стратегиям к оптимальному решению за конечное
    число итераций весьма напоминает доказательство того, что при
    симплексном методе число итераций до прекращения расчетов является конечным. Суть доказательства состоит в том, что ввиду I) мы
    никогда не возвращаемся к ранее проверенной стратегии. Поскольку
    число возможных стратегий является конечным, в конце концов
    итеративный процесс прекращается.
    При сравнении методов последовательных приближений в пространстве функций и в пространстве стратегий заметим, что одни
    и те же расчеты выполняются для нахождения значений правых
    частей в (4) и левых частей в (3). В методе итераций по критерию
    полученные на некоторой итерации значения используются на следующей итерации в качестве новых приближенных значений yt.
    Напротив, новые приближенные значения г/; в методе итераций по
    стратегиям вычисляются с помощью дополнительных расчетов,
    а именно в результате решения уравнений расчета «стоимости вершин» (2) на следующей итерации. Эти дополнительные вычисления
    есть цена, которую мы платим за обеспечение сходимости за конечное
    число итераций.
    Метод итераций по стратегиям демонстрируется на численных
    примерах в разд. 12.4.
    В сети, где для дуги (i, /) коэффициент дисконтирования равен
    a-ij, замена а на а и необходима лишь в формулах (1) — (3).
    12.3.

    МИНИМИЗАЦИЯ СРЕДНЕГО ЭФФЕКТА

    ЗА

    ОТРЕЗОК

    Нельзя ожидать, что экстремальные уравнения относительно yt
    в разд. 12.1 окажутся пригодными при а = 1, поскольку в этом
    случае суммарный эффект для бесконечного планового периода
    может быть бесконечно большим (например, если все с г - ; ->0). Для
    того чтобы построить требуемое функциональное уравнение, перепишем все формулы с использованием эквивалентного среднего
    эффекта за отрезок, а затем примем а = 1.
    Начнем с предположения, что нам удалось вычислить эквивалентный средний эффект за отрезок для каждого из возможных
    на данной сети циклов и с соответствует наименьшему из значений
    эффекта при а = 1. Разумеется, при решении практической задачи
    нежелательно вычислять все значения среднего эффекта, поэтому,
    как правило, истинное значение с остается неизвестным до завершения оптимизации. Однако в приводимых далее алгебраических преобразованиях с следует рассматривать лишь как символ, обозначающий такую величину, которая, несомненно, существует.

    198

    ГЛАВА 12

    Для того чтобы избежать необходимости рассмотрения многих
    частных случаев, дополнительно примем, что сеть обладает одним
    свойством: предполагается, что существует маршрут, точнее,
    направленный маршрут, ведущий от любой вершины i к одной (по
    крайней мере) из вершин, входящих в цикл, который позволяет
    достичь с. (Это условие удовлетворяется, например, в том случае,
    если существует направленный маршрут от любой вершины i к любой
    вершине /.) Подобный подход разъясняется ниже; он может быть
    модифицирован таким образом, что позволит рассматривать и сети,
    не обладающие указанным свойством.
    Построим функциональные уравнения, включающие с. Как читатель увидит далее, эти уравнения включают и другие необходимые
    для расчетов величины, а именно wi. Следует предупредить, что
    приводимые ниже соображения не отвечают полностью требованиям
    строгого математического анализа; они приводятся здесь лишь для
    объяснения конечных результатов, которые сами по себе могут
    показаться странными. Поэтому если читатель нетерпелив, он может
    опустить эвристические соображения и перейти непосредственно
    к экстремальным уравнениям (5).
    Величину эквивалентного среднего эффекта для каждой вершины i, равную (1 — а) у}, удобно связать с с посредством следующего
    соотношения, определяющего wt:
    (i-a.)yt = (i-a.)wt+c, 0 ^ а < 1
    (1)
    (покажите, какой смысл вложен в величину wt). Таким образом,
    .

    (2)

    Можно интерпретировать wt как разность между г/, и с/(1 — а),
    причем последняя величина есть интегральный дисконтированный
    эффект от получения с на каждом отрезке в течение бесконечного
    планового периода. [Уже сама система обозначений является неточной, поскольку и г/,-, и Wi зависят от а, так что правильнее было бы
    использовать обозначения z/, (а) и Wi (a).]
    Тогда экстремальное уравнение, приведенное в разд. 12.1, можно
    переписать в следующем виде:
    0

    =

    in
    min

    м (i, j)
    по всем
    в сети

    С
    Г а v(u>j +1r^—
    — a /} + и1
    J

    L

    для всех вершин i.

    (3)

    Поскольку с есть величина постоянная, слагаемые, включающие
    с, можно объединить либо перенести одно из таких слагаемых в правую часть (3) из левой, либо в левую часть из правой. Мы воспользуемся первой из этих возможных альтернатив, поскольку она допускает обобщение на случай различных коэффициентов дисконтирования а.1] для каждой дуги (i, i). Таким образом, как нетрудно

    МЕТОДЫ ОПТИМИЗАЦИИ

    ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    199

    проверить, выражение (3) можно представить в следующем виде:
    w/ =

    min

    по всем (г, j)

    (awj + ctj — с).

    (4)

    При а = 1 выражение (4) упрощается:
    Mi =

    min

    по всем (г, ;')
    в сети

    (и>]~\-сц — с)

    для всех вершин i.

    (5)

    Если перенести постоянную с в левую часть, получим эквивалентное выражение
    Wi-\-c=

    min

    по всем (г, j)
    в сети

    (wj + ctj)

    для всех вершин i.

    (6)

    (При точной системе обозначений Wi в (5) и (6) принимается равным
    предельному значению ivi (ее) при стремлении а к 1 снизу.)
    До сих пор полагалось, что преобразование приведенных ранее
    экстремальных уравнений, соответствующих а < 1, в экстремальные уравнения (5), где ее = 1, является оправданным. При таком
    преобразовании предполагается существование стационарной стратегии, оптимальной в том смысле, что она включает цикл с минимальными эквивалентными средними затратами за отрезок. Такое
    предположение оправдано, поскольку можно доказать следующую
    теорему.
    Т е о р - е м а о с т а ц и о н а р н о й с т р а т е г и и . Всегда
    существуют единственное конечное с и конечные Wj, удовлетворяющие экстремальным уравнениям (5), причем соответствующая стационарная стратегия включает цикл, для которого эквивалентные
    затраты за отрезок являются минимальными по всему множеству
    возможных стратегий.
    Как и в случае а < 1, дуга, которой соответствует минимум (5)
    или (6), отображает решение, которое следует принимать, находясь
    в вершине i. Такая стратегия должна включать не менее одного
    цикла. Стратегия соответственно представляется в виде маршрута,
    начинающегося в рассматриваемой вершине i и ведущего к циклу,
    для которого эквивалентные средние затраты за отрезок являются
    минимальными. (Разумеется, в цикл должна входить вершина i.)
    Если оптимальная стационарная стратегия включает более чем
    один цикл, то для всех циклов эквивалентные средние затраты за
    отрезок должны быть одинаковыми. Это следует из сделанного ранее
    допущения, что всегда можно отыскать маршрут из любой вершины i
    к вершине, входящей в цикл, где достигается с. Поскольку с связано
    с циклом, а величины с^ стационарны, значение с одновременно
    является средними затратами за отрезок, минимальными для всех
    возможных циклов. Это значит, что подход на основе «эквивалентного среднего эффекта за отрезок» позволяет найти стратегию,
    оптимальную по критерию «средний эффект за отрезок».

    200

    ГЛАВА 12

    Как упоминалось выше, величины wt представляют интерес
    главным образом с вычислительной точки зрения — для того чтобы
    вычислить с и найти оптимальную стратегию, необходимо определить значения u>i. Однако существует несколько интерпретаций
    экономического смысла Wi, Вот одна из них. Из (2) очевидно, что
    для любой пары i и /
    У1 — У: = ">* — u>j, 0 <; а < 1.
    Таким образом, предельное значение разности между интегральными дисконтированными показателями для вершин i и / при стремлении а к 1 равно wt — wj. Следовательно, wt — Wj можно рассматривать как приращение затрат, обусловленное нахождением
    в вершине i, а не в вершине / при а = 1.
    Метод итераций по стратегиям. При а = 1 для решения (5) или
    (6) может быть использован метод последовательных приближений
    в пространстве стратегий. Для удобства изложения будем предполагать, что на каждой итерации проверяемая стратегия включает
    один цикл. Дополнительные указания, требуемые для расчетов при
    наличии на некоторой итерации более одного цикла, приводятся
    в конце настоящего раздела.
    Если найдены значения wt, удовлетворяющие экстремальным
    уравнениям (5) и (6), добавление одной и той же константы к этим
    значениям дает новые значения, также удовлетворяющие таким
    уравнениям. Таким образом, значения Wi не являются единственными, и в приводимом ниже алгоритме удобно принять одно из них
    равным нулю. Для определенности примем Wi = 0.
    Алгоритм включает следующие операции:
    Шаг 1. Выберем произвольную исходную стратегию и примем
    wi = 0.
    Шаг 2. Для заданной пробной стратегии вычислим значения w? и с™ в соответствии с уравнениями расчета «стоимости
    вершин»

    ц>™ — wf -}-сп — ctj

    для всех вершин i (формулы расчета
    «стоимости вершин»),
    (7)

    «Я = О,
    где дуга (i. /) отображает решение для вершины i, соответствующее
    конкретной пробной стратегии.
    Шаг 3. Проверим возможность дальнейшего улучшения, вычислив

    min

    по всем (г, j)
    в сети

    (и>™ 4- сц — сп) = W\ (показатели возможного улучшения). (8)

    Шаг 4. Прекратим расчеты, если W? = ivf для всех г. В противном случае изменим стратегию для каждой такой вершины &, для
    которой W\ < и>й, выбрав дугу, позволяющую достичь в (8) значения WZ- Перейдем от итерации п к итерации (п + 1) и обратимся
    к выполнению шага 2 на основе новой проверяемой стратегии.

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    201

    Техника решения. Заметим, что в (7) требуется решить систему
    линейных уравнений. Если проверяемая стратегия включает один
    цикл, уравнения (7) всегда имеют единственное решение. Отметим
    также, что, если просуммировать уравнения (7) для всех вершин,
    входящих в цикл, w? взаимно уничтожаются, так что в результате
    получим
    сп=

    2

    по всем (г, j)
    в цикле

    си/чъсло дуг в цикле.

    (9)

    Мы провели формулу расчета показателей возможного улучшения (8), Ьснованную на экстремальных уравнениях (5). Следует
    отметить, что слагаемое с71 в (8) не влияет на результат минимизации.
    Поэтому операция вычитания не обязательна при нахождении минимума, она требуется лишь при исчислении результирующего значения Wf. Эту формулу удобно представить в виде (8), поскольку она
    может быть обобщена на случай различной длительности перемещения по отдельным дугам.
    Приняв должные меры предосторожности, чтобы избежать зацикливания, аналогичного возможному зацикливанию при использовании симплексного метода, получаем алгоритм, обладающий следующими свойствами:
    I) На каждой итерации с"^^" 1 .
    II) Вычисления прекращаются после конечного числа итераций.
    III) Оптимальной по завершению расчетов является стратегия,
    позволяющая достичь Wf.
    Пусть Нц — число отрезков, необходимое для перемещения по
    н
    Дуге (i, /), и а.ц=а ч. Тогда (3), (4) и (5) можно представить в следующем виде:

    min

    по всем (г,Ц)

    Wj=

    [aijWj + Cij — (1 + И + .. .+аЧ~^с},
    min

    по всем (i, j)
    в сети

    (Wj + cij — hijc).

    (Ц)
    (Ill)

    При учете коэффициентов hij изменяется соответственно значение с™ в (7) и (8), а знаменатель в (9) становится равным сумме /г ;/ по дугам (i, /), входящим в цикл.
    Даже если исходная стратегия включает только один цикл,
    стратегии, проверяемые на последующих итерациях, могут включать два или более цикла. В этом случае необходима незначительная
    модификация алгоритма. Поскольку в любой пробной стратегии каждая из вершин i либо входит в один из циклов, либо находится на маршруте к одному из циклов, множество всех вершин можно

    202

    '

    ГЛАВА Г>

    разбить на непересекающиеся группы, по одной группе для каждого
    цикла. Пусть с" обозначает средний эффект за отрезок для цикла,
    с которым связана вершина i [мы будем по-прежнему использовать
    систему обозначений, принятую для сети общего типа, в которой
    hi, — число отрезков, необходимое для перемещения по дуге (i, /)].
    Тогда, если дана пробная стратегия, необходимо решить систему
    w^ — iv™ + hutf = Сц

    для всех вершин i,

    (I)

    где все с?, связанные с одним и тем же циклом, считаются одинаковыми, причем в каждом из циклов произвольно выбирается одна
    из вершин i, для которой принимается и;" = 0.
    [Так, например, если один из циклов включает три вершины 1,
    2 и 3, то дополнительно к (I) строятся уравнения с™ = с™ = с™
    и, скажем, w™ = 0.]
    Решив систему (I), найдем
    min

    по всем ( i , j )
    в сети

    (С™)Е=С°

    для всех i.

    (II)

    Если для некоторого k выполняется условие С& < с£, то соответствующим образом изменим стратегию на основе (II). Если при
    этом новая стратегия по-прежнему включает более одного цикла,
    снова решим систему (I), в противном случае возвратимся к (7).
    Если же условие С& = с£ выполняется для всех k, то с\ одинаковы
    п
    также для всех k', приняв с равным этому общему значению, выполним, как и прежде, расчет показателей возможного улучшения
    по формуле (8).
    Можно глубже понять выражения (5), связав их с моделью
    нахождения кратчайшего пути на сети общего типа. Введем обозначение:
    Тогда (5) можно представить в виде
    Wi =

    min

    по всем (i, j)
    в сети

    (wj-{-cij)

    для всех i при wt = 0.

    (IV)

    Существует одно различие между (IV) и обычной моделью нахождения кратчайшего пути (например, в таком ее виде, в каком она
    изложена в разд. 11.9): хотя u>t = 0, вершина 1 в действительности
    не является вершиной конечного состояния. Стратегия вполне
    может включать дугу из вершины 1 к вершине /.
    Пусть в угаданной стратегии с есть минимальные эквивалентные
    средние затраты за отрезок, соответствующие некоторому циклу.
    Тогда сумма Сц по дугам этого цикла равна нулю. Если для каждого
    из остальных возможных циклов на сети сумма с^ является неотри-

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    203

    цательной, предлагаемая стратегия является оптимальной. В этом
    случае нахождение кратчайшего пути методом последовательных
    приближений в пространстве функций приводит к решению (IV).
    Если же, однако, существует цикл, для которого средние затраты,
    исчисленные в текущих c t j , являются отрицательными, то имеется
    возможность улучшения, и алгоритм нахождения кратчайшего пути,
    изложенный в разд. 7.6 и 11.9, оказывается непригодным. Выполняя
    операции алгоритма, мы раньше или позже обнаружим, что повторно
    пересматриваем Wj, относящиеся к тому циклу, который представляется в качестве возможного улучшения.
    Таким образом, возникает следующий «смешанный» алгоритм.
    Выберем стационарную стратегию и вычислим результирующее
    пробное значение г. Применим алгоритм итераций по критерию (5),
    приведенный в разд. 11.9, где c t j исчисляются по формуле (III).
    Примем w\ = оо для всех i =/= 1. Если при расчетах обнаруживается
    цикл, для которого соответствующая сумма c t j отрицательна, должным образом изменим стратегию, повторно вычислим с для этого
    улучшающего цикла, пересчитаем сг;- и повторно выполним операции. Как только вычисления по алгоритму нахождения кратчайшего
    пути завершатся получением значений и;ь мы найдем, что соответствующее с оптимально.
    12.4. ДЕМОНСТРАЦИЯ МЕТОДА
    НА ЧИСЛОВЫХ ПРИМЕРАХ

    ИТЕРАЦИЙ ПО СТРАТЕГИЯМ

    Модели, приведенные в настоящей главе, являются сложными,
    и рассмотрение нескольких примеров поможет овладеть методами
    оптимизации. Именно эту цель преследуют иллюстративные примеры, помешанные в разд. 12.4 и 12.5.
    В примерах 1 и 2 демонстрируются подробные расчеты, выполненные методом итераций по стратегиям, при 0 ^ ос < 1. В примере 3 при а — 1 имеется более одной оптимальной стратегии,
    и вычислительный процесс завершается без окончательного выбора
    одной из этих стратегий, которые являются оптимальными также
    и при 0 sjl a ^ 1. Метод итераций по стратегиям можно дополнить
    указанием, согласно которому всегда выбирается стратегия, оптимальная не только при а = 1, но и при всех а, близких к 1.
    В примерах 4, 5 и 6 при а = 1 оптимальная стратегия для любой
    конечной длительности планового периода п зависит от четности п.
    Вместе с тем в примерах 4 и 5 показано, что алгоритм итераций по
    стратегиям может определить оптимальную стратегию однозначно.
    В примере 6 аналогично примеру 3 имеется несколько оптимальных
    стратегий; формальными методами, возможно, и не удастся установить различие между стратегией, оптимальной только при а = 1,
    и стратегией, оптимальной при 0 ^ а ^ 1. (В примере 7 на первой

    204

    ГЛАВА 12

    итерации должна быть выбрана стратегия с двумя циклами, хотя
    исходная стратегия включала только один цикл; в связи с этим
    применяются формулы (I) и (II) предыдущего раздела.)
    На этих примерах читатель поймет, почему необходимо глубоко
    разбираться в экономическом смысле формул и алгоритмов. Механическое их использование может привести к численно правдоподобным, однако явно непригодным ответам.
    Полезно переписать формулы расчета «стоимости вершин» (2)
    и показателей возможного улучшения (3) из разд. 12.2 при а < 1,
    а также соответствующие формулы (7) и (8) из разд. 12.3 при а =. 1.
    Пример 1. Рассмотрим сеть, изображенную на рис.
    12.1.
    На дугах проставлены соответствующие значения сг;-. Для того
    чтобы начать расчеты методом итераций по стратегиям, необходимо

    Р и с . 12.1. Пример 1.
    выбрать исходную стратегию, в которой для каждой вершины имеется выходящая из нее дуга. Пусть такой стратегией являются:
    вершина 1 — дуга (1, 4);

    вершина 2 — дуга (2, 1);

    вершина 3 — дуга (3, 2);

    вершина 4 — дуга (4, 1).

    (1)

    Таким образом, данная стратегия включает единственный цикл —
    дуги (1, 4) и (4, 1).
    Применив формулы расчета «стоимости вершин» (2) из разд. 12.2,
    решим следующую систему уравнений, линейных относительно г/?:

    У1 = ау\ + с14;
    yl = ау\ + с21;

    (2)

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    которые можно представить

    в следующем

    J/1

    205

    виде:

    — аг/ 4 — О.
    о,
    „,,0

    ,,0

    -«# + У1

    _

    = 4;

    В конкретных задачах значение а фиксируется на определенном
    уровне. Однако полезно выполнить здесь расчеты, не устанавливая
    конкретного значения а и выявляя его влияние на результаты.
    Решим первое и четвертое уравнения относительно у° и у\ (это уравнения для вершин, входящих в цикл), а затем остальные уравнения. Можно убедиться в том, что:

    2

    4 + За— За
    \_^
    \

    1 + 4а + 2а2— За3

    ( )

    »« — 1 _ «г '

    Достаточно одного взгляда на рис. 12.1, чтобы увидеть, что
    возможность выбора решений существует только для вершин 1
    и 2 — из вершин 3 и 4 выходит всего лишь по одной дуге. При
    0-^а<;1, согласно формуле расчета показателей возможности
    улучшения (7) из разд. 12.2, для вершины 1 имеем

    = min I

    — а2 —

    (5)

    Аналогично этому для вершины 2
    min (ay* + с21, ау°3 + с23) =

    2
    при --^ а < 1.

    ^y

    для

    Поскольку для каждой вершины i выполняется условие Y\ = y\,
    2
    исходная стратегия оптимальна, если только -^-^а< 1.Если же

    206

    ГЛАВА 12

    2
    а <-тг, тогда минимум в (6) достигается на дуге (2, 3), и это решеО
    ние должно на следующей итерации заменить дугу (2, 1). Читателю
    предлагается объяснить, почему при а < 2/3 дуга (5, 3) является
    лучшим решением.
    Убедимся в том, что показатель возможного улучшения для
    дуги (2, 3) в (6) действительно представляет собой интегральные
    дисконтированные затраты на перемещение из вершины 2 в вершину 3, из 3 в 2, затем в вершину 1 и, наконец, по петле, состоящей
    из вершин 1 и 4 и соединяющих их дуг. Однако если дуга (2, 3)
    действительно используется вместо (2, 1), то интегральные дисконтированные затраты исчисляются на перемещение из вершины 2
    в вершину 3 и обратно по циклу бесконечное число раз. Таким образом, можно определить, предпочтителен ли повторяющийся цикл,
    включающий вершины 2 и 3, проверив, улучшается ли решение при
    однократном прохождении этого цикла.
    Из рис. 12.1 видно также, что только стратегия (1) оптимальна
    при ос = 1. Цикл с минимальными средними затратами состоит
    _

    0 1 Л

    из дуг (1, 4) и (4, 1), так что с = —^— = 2.
    Л

    Пример 2. Рассмотрим сеть с параметрами, приведенными на
    рис. 12.1, однако примем с23 = 3. Поскольку исходная стратегия (1)
    не включает эту дугу, проверяемые значения у\ соответствуют (4).
    Аналогично этому расчеты показателей возможного улучшения
    по формуле (5) дают те же результаты. Вместе с тем
    -3«*

    .
    ('X
    г

    и в результате при 0 <^ а <С 1 получим
    .
    atf + с23 ^ YI для дуги (2, 3).
    (8>
    Таким образом, дуга (2, 3) заменяет в проверяемой стратегии
    дугу (2, 1). Это в свою очередь значит, что при п = 1 второе уравнение в системе (3) заменяется на
    = 3
    9
    и новое решение имеет следующий вид:

    -.1 _ „1 _ 1+За
    Уз— У4 — I _ t t 2 -

    //|П\
    (Ш)

    Теперь показатели возможного улучшения для вершин 1 и 2
    при 0 ^ а < 1 одинаковы:
    3g2 3-j-lc

    для вершин 1 ж 2.
    (11)
    Вычисления прекращаются, поскольку для всех i Fi = i/J.

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    207

    Пример 3. Продолжим рассмотрение приведенного выше примера, приняв а = 1. Из рис. 12.1 (с внесенным изменением с23 = 3)
    видно, что циклы вершин 1 и 4 и вершин 2 и 3 в равной мере оптимальны. Начав с исходной стратегии (1) и применив формулы расчета «стоимости вершин» (7) из разд. 12.3, получим систему уравнений:

    (12)
    /•

    с/-0.

    с 4i — i
    v°. = 0.

    Можно убедиться
    решение:
    F° = 0,

    в том,

    w\ = 0,

    что система (12)

    w\ = 2,

    и>« = 1,

    имеет , следующее
    w\ = -1.

    (13)

    Расчет показателей возможного улучшения по формуле (8) из
    разд. 12.3 дает следующие результаты:
    min (и% + с12 — с°, ц>4 + с и — с°) —
    = min (2 + 4 - 2, -1 + 3 - 2) = 0 = W?
    min (н?° + c 2 i — с°, и;° + с23 — с°) =
    = min (0 + 4 — 2, 1 + 3 — 2) = 2 = WI

    (Для вершины 1)
    для дуги (1, 4); (14)
    (для вершины 2)
    для обеих дуг. (15)

    Расчеты прекращаются, поскольку для всех i W° = w\.
    Отметим, что хотя исходная стратегия (1), включающая единственный цикл из вершин 1 и 4, согласно вычисленным показателям возможного улучшения, является оптимальной, предпочтительной, вероятно, будет все же альтернативная оптимальная стратегия, включающая цикл из вершин 2 и 3. Это объясняется тем,
    что дуга (2, У) оптимальна не только при а = 1, но и является единственной оптимальной дугой при 0 ^ а, < 1, как это подтверждает-

    ся (8).

    Пусть
    с

    с

    На рис. 12.2

    2

    и = си — = си — изображена сеть, для которой
    u?i =

    min

    по всем (i, i)
    в сети

    (wj + CM)

    и

    u?i = 0.

    (!)
    (II)

    Заметим, что суммарная «длина» оптимального цикла равна
    нулю, тогда как для любого другого цикла она строго положительна.

    208

    ГЛАВА 12

    Пример 4. Рассмотрим сеть, изображенную на рис. 12.3. Вначале
    примем с12 = 1,5. При изучении сети быстро обнаруживается, что
    при а = 1 дуга (2, 3) является лучшим решением, чем дуга (2, 1).
    Если снова и снова в течение ряда отрезков начинать из вершины 2,
    то цикл, включающий вершины 2 и 3, обусловливает меньшие совокупные затраты, чем цикл из вершин 2 и 1.
    Наряду с этим не столь ясно, действительно ли при а = 1
    дуга (1, 3) лучше дуги (1, 2). Для выяснения причины этого вычислите, проходя отрезок за отрезком, совокупные затраты с начала
    планового периода для маршрута, начинающегося в вершине 1,
    идущего в вершину 2, а затем по циклу, включающему вершины 2 и 3.

    аг, =

    Рис.
    12.2.
    Пример
    (на дугах проставлены

    Р и с. 12.3.

    Пример

    4.

    Сравните эту сумму с аналогичными затратами для маршрута,
    идущего в вершину 3 из вершины 1. Читатель обнаружит, что
    дуга (1,3) более предпочтительна при нечетном числе отрезков
    (1, 3, 5, . . . ,) в плановом периоде, а дуга (1,2) — при четном.
    Что же происходит при использовании алгоритма итераций
    в пространстве стратегий? Пусть исходной стратегией является
    следующая:
    вершина 1 — дуга (1, 3); вершина 2 — дуга (2, 3);
    вершина 3 — дуга (3, 2).

    (16)

    Найдем значения у\, решив систему уравнений:

    = ау3
    у\ =

    с13;
    (17)
    '•32'

    Нетрудно убедиться в том, что решение имеет следующий вид:
    0_
    У! —

    1 —«2

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    209

    L —«•=

    Расчет показателей возможного улучшения для вершины 1 дает


    . ^1.5+20 + 2,50^

    i+

    f« + * )^Yl

    m n

    при -=- ^ а < 1.

    Таким

    О

    2

    образом,

    ля

    вершины 7)

    для дуги (7, 2)

    при больших

    (19)

    значениях

    а

    дуга (7,2) лучше дуги (1,3), так что стратегию (16) необходимо
    заменить. Новая оптимальная стратегия имеет следующий вид:
    7У1 — У
    »1 — 1 1'

    7У1 — 77°
    J/2 — i>2'

    7У 1 — 7/
    ИЗ — »3'

    f?(Yl
    V^W

    Теперь применим алгоритм итераций по стратегиям при а = 1
    и убедимся в том, что приведенное выше решение, включающее
    дугу (7, 2), является единственным оптимумом.
    Пример 5. Продолжим рассмотрение предыдущего примера,
    однако примем с12 = 2. И здесь при конечном плановом периоде
    дуга (7, 3) является строго предпочтительной в случае нечетного
    числа отрезков и строго худшей в случае четного их числа. Если
    в качестве исходной стратегии выбрать (16), результаты (17) и (18)
    остаются в силе.
    Показатель возможного улучшения для вершины 7 при 0 ^
    ^ а < 1 равен

    ; Следовательно, дуга (1, 3) оптимальна при всех значениях а, меньI ших чем 1 .
    Пример 6. Продолжим рассмотрение предыдущего примера,
    однако примем a = 1. Как можно было предположить, дуга (1, 3)
    I остается оптимальной. Тем не менее, согласно показателям возможного улучшения, дуга (1, 2) также является оптимальной.
    Здесь необходимо решить систему уравнений:
    u£-!0S = c a 8 -?>;

    (22)

    ,„о
    W3 — ,,,о
    W2 _
    — ,,
    С 3 2 — Т°С,

    w° = 0,
    решением которой является
    5

    с = 3,

    wl = 0,

    w\ = 1,

    н^ = 2.

    (23)

    Можно убедиться в том, что при использовании дуги (7, 3) вместо (7, 2) мы получим точно такие же результаты.

    ГЛАВА 12

    210

    Показатели возможного улучшения для_ вершины 1 имеют следующий вид:
    min (w\ + £i2 — c°i

    с

    w

    ля

    \ + Ci3 — °) =



    = min (1 + 2 - 3, 2 + 1 - 3) - 0 = W\

    вершины 1}

    для дуг (1, 2) и (J, 3),
    (24)

    так что проверяемая стратегия, включающая дугу (1, 2), удовлетворяет проверке на оптимальность.
    Пример 7. Рассмотрим сеть, изображенную на рис. 12.4, при
    а = 1. Пусть исходная стратегия имеет вид:
    вершина 1 — дуга (1, 4); вершина 2 — дуга (2, 4);
    _
    вершина 3 — дуга (3, 2);

    вершина 4 — дуга (4, 1).

    Р и с . 12.4. Пример 7.
    Таким образом, единственный цикл включает вершины 1 is. 4. Этой
    стратегии соответствует решение
    О

    О

    С\

    1 О

    Л

    О

    О

    /ТЛ7\

    • Можно проверить, что показатели возможного улучшения равны : >
    W\ = 0 = iv\

    для дуги (1, 4);

    WI = -2 < w\
    5
    И7" = — у = №°3

    для дуги (2, 5);

    ТУ°= — у = »4

    Для дуги (^, 7).

    Для дуги (3, 2);

    (V)

    Поэтому стратегия, соответствующая (V), является улучшением. Заметим, что в новой стратегии имеется два цикла, так что
    на следующей итерации приходится использовать (I) и (II) из
    разд. 12.3.

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    211

    Соответствующим путем решаются следующие уравнения расчета
    стоимости:
    w\ - w\ + cj = 2; с] = cJ;

    w\ = 0;

    и* - ш$ + 3 = 2; с\ = с\;

    w\ = 0;

    w

    w

    c

    l — \ + \ = 0;

    u;J — w\ + c\ = \.
    Можно проверить, что

    el = ci = |,

    ci = ci = l

    ' (VII)

    и что
    CJ = 1 < cj

    для дуги (7, 2);

    C\ = 1 = 4

    для дуги ( 2 , 3 ) ;

    CJ = 1 = cS для дуги (5, 2);
    CJ = 1 < cj

    (VIII)

    для дуги (4, 3).

    В новой стратегии, представленной (VIII), имеется только один
    цикл. Читателю предлагается выполнить еще одну итерацию и убедиться в том, что стратегия (VIII) действительно оптимальна.
    Выводы. В настоящем разделе демонстрировалось применение
    метода последовательных приближений в пространстве стратегий
    для решения нескольких примеров. Было показано, как для случая
    О ^ а < 1 критерий соблюдения условий оптимальности У? характеризует возможность улучшения стратегии; была также показана
    зависимость этой величины от значения а. Для случая а = 1 метод
    позволяет найти не менее одного цикла, однако критерий проверки
    оптимальности не является настолько чувствительным, чтобы выявить
    различия между альтернативными оптимальными стратегиями, которые обусловливают существенно разные интегральные дисконтированные затраты при значениях а, близких к 1. Как упоминалось
    выше, алгоритм можно изменить так, что этот недостаток будет
    устранен. Поскольку необходимые модификации выходят за рамки
    настоящего изложения, они здесь не приводятся.
    12.5.

    ПРОСТАЯ МОДЕЛЬ УПРАВЛЕНИЯ ЗАПАСАМИ

    В приведенных выше примерах рассматриваются простые сети,
    позволяющие сосредоточить внимание на технике расчетов по методу
    последовательных приближений. В настоящем разделе этот метод
    применяется к динамической задаче, имеющей практическую значимость, а именно к простой детерминированной модели управления

    212

    ГЛАВА 12

    запасами, которая вначале изучалась в разд. 8.3, а затем была обобщена в разд. 12.1. Воспользуемся теми же данными, что и в примере
    фирмы «Надежный поставщик», приведенном в разд. 8.7:
    Спрос:
    D = 3 единицам.
    Объем выпуска: х ^ 5 единицам,

    (1)

    Уровень запасов на конец отрезка: /'
    единицам;
    затраты на
    дукции

    производство

    и

    хранение про-

    где х и /' — неотрицательные целые числа и
    С (0) = 0 ,
    С (3) = 19,

    25

    Р и с. 12.5. Модель
    управления запасами
    (при бесконечном плановом периоде) фирмы
    «Надежный
    поставщик». Уровень запасов для вершины £
    равен i; объем выпуска на дуге (£, j) равен
    / — i + 3.

    С (1) = 15. С (2) = 17,
    С (4) = 21, С (5) = 23,
    h =1

    (3)

    для всех отрезков в течение бесконечного планового периода.
    Переменной состояния является уровень
    запасов на начало отрезка, обозначенный / .
    где i = 0, 1, . . ., 4. Таким образом, стационарная стратегия представляет собой правило установления объема выпуска, позволяющего получить заданное i. На рис. 8.16 оптимальная стратегия хх (i) для бесконечного
    планового периода представлялась следующей:

    (0) = хх (1) = хх (2) = 5.
    Хс

    (3)

    = Хх

    (4) - 0.

    (4)

    Теперь (4) необходимо подтвердить методом
    итераций по стратегиям.
    Сеть, отображающая условия рассматриваемого примера, изображена на рис. 12.5.
    Каждому уровню запасов i на начало отрезка
    соответствует некоторая вершина; при заданном i каждому допустимому объему выпуска х соответствует дуга. Так, если уровень
    запасов на начало отрезка равен г, объем выпуска составляет х,
    а спрос равен 3 единицам, то запас на начало следующего отрезка
    составляет / == i + х — 3 > 0. Следовательно, дуга (i, 7) отображает
    производство (/ — i + 3) единиц. В связи с наличием в (1) ограничений на объем выпуска и уровень запасов некоторые сочетания i и j не являются допустимыми. Так, например, при (= 0 долж

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    213

    но быть / ^ 2 , поскольку х ^ 5. Затраты для дуг, приведенные
    в рис. 12.6, определяются следующим выражением:

    (5)

    си = С (i — i + 3) + h - j .

    Предположим, что в качестве критерия оптимальности выбран
    минимум средних затрат за отрезок. Тогда решаемое функциональное уравнение имеет вид
    =

    min

    по всем (г, j)
    в сети

    (u>j-\-сц — с) для всех i.

    (6)

    Пусть исходная стратегия состоит в том, чтобы производить
    недостающее для удовлетворения спроса количество продукции
    при / ^ 3, так чтобы уровень запасов на конец отрезка был равен

    Р и с. 12.6. Модель управления
    запасами
    фирмы
    «Надежный
    поставщик».
    Затраты для дуг определяются
    выражением

    ctj = с а - t + з) + А-/.

    ^

    19+0

    21

    23 + 2

    17 + 0

    19+1

    21+2 23 + 3

    П+ 1

    13+2 21 + 3 23

    15+1

    17 + 2 19+3 21

    2
    3

    0+0

    0+1

    15 + 2 17+3 13 +

    / = 0, и вообще не выпускать продукцию, если на данном отрезке
    i = 4, так что / = 1. На сети эта стратегия представляется следующим образом:
    вершина 0 — дуга (0, 0),

    х = 3;

    вершина 1 — дуга (J, 0),

    х = 2;

    вершина 2 — дуга (2,0),

    х = 1;

    вершина 3 — дуга (3, 0),

    х = 0;

    вершина 4 — дуга (4, 1),

    х = 0.

    (7)

    Например, находясь в вершине 1 (i = 1), мы выпускаем 2 единицы
    продукции, так что к концу отрезка спрос 3 единиц уменьшает
    запас до нуля. Если начертить сеть, включающую только эти дуги,
    то можно заметить, что выбранная стратегия в конечном счете приводит к стационарному выпуску 3 единиц продукции в течение
    каждого отрезка.
    Используем алгоритм итераций по стратегиям и будем находить
    значения w\ и с° с помощью системы уравнений расчета стоимости:

    ГЛАВА 12

    "214

    c° = 19,
    |- "? = 17,

    - «Я + с° = 15,

    (8)

    - wl + ? = О,

    _ ц,» 4- "с0 = 1 ,
    решением которой являются
    °=
    = 19, w° = 0, и»? = -2, да" = -4,
    Можно убедиться

    ш° = -19,

    ш° = -20.

    (9)

    в том, что операция нахождения

    min

    по всем (t, j )
    в сети

    + Cl]—~cn) = W?

    (10)

    при гг = 0 дает решение
    WI = 0
    для дуги (О, О);
    Wl = -12 для дуги (1, 3);
    Wl = -14 для дуги ( 2 , 3 ) ;
    (И)
    ^3° = -19 для дуги (3, 0);
    WI = -20 для дуги (4, 1).
    Поскольку для i = l и i — 2 ТУ? < wl, выполнение операции
    на этом не прекращается. Читателю предлагается вычертить сеть,
    отвечаующую новой стратегии, которая была бы основана на (11).
    Результаты, полученные в ходе ряда последовательных итераций, приведены в таблице рис. 12.7. Читателю полезно самостоятельно повторить расчеты, используя данные таблицы рис. 12.7 в качестве контроля. Следует также начертить сети, изображающие каждую
    из пробных стратегий. Отметим, что, рассматривая эту таблицу,
    можно сделать следующие выводы:
    I) От п = 0 до п = 1 значение сп не улучшается.
    II) Хотя при п = 2 средние затраты за отрезок улучшаются
    (с2 <; с1), однако относительные стоимости возрастают w\ > W]
    для всех i и w\ ;> w\ для всех i -ф 0.
    III) Стратегии для разных итераций имеют следующий вид:
    х = 5 для г = 1 , 2 , х = 4 для i = 0, 3, х = 0 для i = 4,
    что соответствует производственному циклу
    (12)
    (5, 4, 0) при п = 2;
    х = 4 для i = 1, ж = 5 для i = 0, 2, я = 0 для i = 3,4,
    что соответствует производственному циклу
    (13)
    (4, 5, 0) при п = 3;

    Метод итераций uo стратегиям
    Мермнша

    Ду-«

    Ду™
    (i, /) «-5 ^S

    i

    (i, /) w\

    W\

    0

    (0,0) 0

    0 ; (0,0)

    0

    Дуга
    (', /) <*?

    -9 (0,1)

    Дуга
    Щ

    2

    -3s

    0

    -I

    (i, /)

    w?

    W|

    (0,2)

    0

    0

    (3,0) -16 -16 (3,0)

    XX

    (4Д) -21 -21 (4,1)

    XX

    XX

    4

    (4,1) —20 —20 (4,1) -30 -30 (4,1) —21

    —21 (4,1) -18 -18 (4Д) -22 -22

    упраллепия

    0

    0

    XX

    (3,0) —19 -19 (3,0) -19 —24 (3,4)

    3"

    (0,2)
    ^

    (3,0) — 17 -17 (3,0)

    3

    1

    Щ

    (2,4) —10 —10 (2,4)

    (2,4)

    Р и с . 12.7. Моделъ

    (ОД) 0

    Дуга
    (i, /) "1

    -•! X

    -«4 -ц-!<_

    a17
    /

    -1

    W?

    —8 —10 (2,3)

    (2,0) -4 -14 (2,3) -14 -22 (2,4)

    19

    0

    (i, /) u)|

    (1,3) —6 -6 (1,3)

    2

    19

    (0,2)

    Ду™

    W|

    -«! -1

    (1,0)

    с"

    (i, /') ^t

    —2 —8 (1,3)

    2
    5
    (1,2)
    ~&3

    1

    2 — 12 (1,3) -12 -12 (1,3)

    Дуга

    17

    запасами фирмы

    •4
    «Надежный

    16

    поставщик».

    X -•!
    1
    9
    У
    5

    Ч

    A

    21В

    ГЛАВА 12

    х = 5 для i = 0,1, х — 4 для i = 2, # = 0 для г = 3,4,
    что соответствует производственному циклу
    (5, 4, 0) при п = 4;
    .г = 4 для г = 0, ж = 5 для i = 1,2, а: = 0 для i = 3,4,
    что соответствует производственному циклу
    (4, 5, 0) при п — 5;
    х = 5 для t = О, 1, 2, ж = 0 для i = 3, 4,
    что соответствует производственному циклу
    (5, 5, 0, 5, 0) при п = 6.

    (14)

    (15)

    (16)

    Таким образом, в ходе выполняемых итераций анализируются
    два цикла (5, 4, 0) и (4, 5, 0) при все более низких уровнях запасов, причем этот процесс продолжается до тех пор, пока не будет
    достигнута сходимость к оптимальной стратегии (16), которая подтверждает (4).
    Для того чтобы проверить, как вы усвоили материал, ослабим
    ограничение, налагаемое на объем выпуска, и будем считать допустимым х = 6; этому объему соответствуют затраты С (6) = 28,Б.
    Выполните одну итерацию алгоритма итераций по стратегиям и проверьте, что оптимальная стратегия имеет вид
    вершина 0 — дуга (О, 3); вершина 1 — дуга (1, 3);
    вершина 2 — дуга (2, 3); вершина 3 — дуга ( 3 , 0 ) ,
    (I)
    вершина 4 — дуга (4, 1),
    чему соответствует
    х = 6 для i = О, х = 5 для i = 1,
    х = 4
    для i = 2, х = 0 для i — 3, 4,
    (II)
    производственный цикл (6, 0)
    н с = 15,75.
    12.6. ПОДХОД

    НА ОСНОВЕ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ

    В настоящем разделе разъясняется постановка дискретной задачи
    динамического программирования для бесконечного планового
    периода в виде модели линейного программирования. Выяснение
    связи между двумя этими задачами помогает понять, почему алгоритм
    итераций по стратегиям сходится за конечное число итераций:
    он в сильной степени напоминает симплексный метод. Кроме того,
    читатель сумеет представлять задачу динамического программирования рассмотренного вида в такой форме, которая позволит применять стандартные машинные программы, предназначенные для решения задач линейного программирования. Подобные преобразования
    важны при решении практических задач, поскольку на всех больших ЭВМ имеются весьма совершенные программы для реализации

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    217

    алгоритмов линейного программирования. Дополнительным преимуществом является и то обстоятельство, что возникает возможность
    использовать хорошо разработанные методы анализа чувствительности.
    Минимизация интегральных дисконтированных затрат. Рассмотрим случай 0 ^ а < 1 и соответствующие функциональные урав
    нения
    yi=

    min

    по всем (i,|j)
    в сети

    (ayj + Cij)

    для всех i.

    (1)

    Эти уравнения означают, что каждая величина yt должна удовлетворять линейным ограничениям (ограничения двойственной задачи по дугам):
    Ut ^ я-У} + са или же Hi — Щз ^5 са Д ля каждой дуги (i, j) в сети.
    (2)
    На знак yt ограничений не налагается; вместе с тем система
    неравенств (2) не полностью адекватна экстремальным уравнениям (1), поскольку значения у}, удовлетворяющие (2), могут и не
    удовлетворять (1). Так, например, если все C;j > 0, то i/, = 0 удовлетворяют неравенствам (2), но не уравнениям (1). Для обеспечения
    адекватности по каждому i одно из неравенств (2) должно быть
    равенством хотя бы на одной дуге (i, j ) . Сколь бы удивительным это
    ни казалось, однако истинные оптимальные значения всех z/; достигаются в результате использования линейной целевой функции
    (целевой функции двойственной задачи):
    р_
    Максимизировать ]Х' г^уь,

    (3)

    где все rh > 0, но в остальном могут принимать произвольные значения, а р — наибольший номер вершины на сети.
    Назовем совокупность ограничений (2) и целевую функцию (3)
    двойственной задачей; тогда прямая задача формулируется следующим образом:

    Минимизировать
    при

    ^ 2 саха

    по всем (i, j)
    в сети

    (4)

    условиях
    S
    хь.}—
    X
    a.Xjk^rh
    по всем (ft, j)
    по всем (i, ft)
    в сети

    (для всех вершин /с),

    (5)

    в сети

    xij ^ 0

    (для каждой дуги (t, /) в сети).

    (6)

    Здесь (4) — целевая функция, а (5) — ограничения прямой задачи по вершинам.

    218

    ГЛАВА 12

    Как и ранее, символ двойного суммирования в (4) означает, что
    суммирование осуществляется по всем дугам (г, ;') сети. Наличие
    в (5) только одного знака суммирования для каждой фиксированной

    г/i

    г/2

    1
    (1,2)
    (1,4)
    1
    (2,1) —а
    (2,3)
    (3,2)
    (4,1) —а



    Дуга

    '"l

    г/з

    г/4
    <С12


    1
    1
    —а

    С

    < 14

    —а

    <С21
    С

    <^ 23
    <«32

    1
    1

    ^*2

    ^'з

    ^*4

    <'41

    Максимизировать

    На знак у^ не налагается ограничений
    Р и с. 12.8. Двойственная задача линейного программирования для примера 1, приведенного на рис. 12.1.

    вершины k сети означает, что суммирование осуществляется по всем
    дугам (k, j) и (i, k) для данного значения k. Двойственная и прямая
    задачи линейного программирования для сети примера 1 разд. 12.4
    Вершина

    1
    2
    3
    4







    1
    —а

    1

    —а
    1

    ,я. „



    —а
    1

    —а

    ^Г2

    1

    —а

    = Г3

    —а
    С

    12

    С

    14

    С

    21

    С

    23

    С

    32

    = Г!

    С

    1

    = ^4

    41

    Минимизировать

    Р и с. 12.9. Прямая задача линейного программирования для примера 1, приведенного на рис. 12.1.

    (рис. 12.1) записаны в виде таблицы на рис. 12.8 и 12.9 (прямая
    задача весьма близка к обобщенной сетевой задаче разд. 6.9).
    Симплексный метод и метод итераций по стратегиям. Предположим, что для решения прямой задачи (4) — (6) используется симплексный метод. Поскольку rh > 0 для всех вершин /с, по крайней
    мере одно xjh > 0. На каждой итерации симплексного метода пробное решение представляет собой опорный план, включающий
    р переменных, где р — число вершин. Следовательно, в таком плане
    должно быть точно по одной переменной x^j для каждой вершины k.

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    219

    Иными словами, опорный план в прямой модели аналогичен пробной
    стратегии в двойственной модели.
    Когда в опорный план вводится новая переменная, то для сохранения его базисности из него должна быть исключена одна из базисных переменных. Таким образом, па каждой итерации симплексного
    метода новая дуга вводится в план, а одна из базисных дуг исключается. После изменения плана он проверяется на соблюдение условий оптимальности с помощью расчетов, равноценных проверке
    выполнения всех неравенств (2) при текущих значениях двойственных переменных. Последние совпадают с у%, используемыми для
    проверки текущей стратегии, так что обычный критерий проверки
    оптимальности плана в симплексном методе соответствует правилу
    улучшения стратегии при алгоритме последовательных приближений
    в пространстве стратегий.
    Теперь можно увидеть, в чем заключается единственное реальное
    различие между подходом к решению прямой задачи линейного
    программирования на основе симплексного метода и методом итераций по стратегиям, примененным к решению двойственной задачи.
    В последнем алгоритме на каждой итерации просматриваются все
    вершины и одновременно делаются все возможные улучшения.
    Соответственно в алгоритме итераций по стратегиям в базис проверяемого решения можно в течение одной итерации вводить несколько
    переменных (дуг). Напротив, в симплексном методе на каждой итерации вводится только одна переменная, после чего проверяется достижение оптимальности. Теорией еще не установлено, можно ли считать метод с многократным введением переменных перед каждой
    проверкой оптимальности более эффективным с вычислительной
    точки зрения. Относительные преимущества каждого из двух подходов в значительной степени зависят от особенностей машинной
    программы для данной конкретной ЭВМ.
    Связь между двумя подходами обусловливает также возможность доказательства сходимости метода последовательных приближений в пространстве стратегий к оптимальному решению за
    конечное число итераций. Требуется лишь незначительно изменить
    доводы относительно достижения оптимума и конечности симплексного алгоритма.
    С помощью приводимых ниже соображений можно строго показать, что возможен произвольный выбор положительной rh в двойственной целевой функции (3) и ограничений прямой задачи (5).
    Предположим, что двойственная задача решена для некоторого
    набора rk, и пусть известны значения х^, соответствующие этой
    стратегии. Согласно теореме двойственности (гл. 5), хц также существуют, причем они конечны. Для конкретности пусть соответствующий вектор базисных переменных есть хв. Значения элементов
    вектора хв можно найти из ограничений прямой задачи (5) для
    вершин сети:
    (/ -А)хв = г,
    (I)

    220

    ГЛАВА 12

    где / — единичная матрица размерностью р X р, А — матрица
    коэффициентов, г — вектор-столбец rh. Уравнение (I) можно запи
    сать в следующем виде:
    хв = г + Ахв;
    (II)
    повторно подставляя значение хв в правую часть (II), получим
    хв=г + А(г + Ахв) = (/ -1- А + А2 + . . .) г.
    (III)
    Поскольку хв является конечным и г > 0, сумма (/ -f- A +
    + Л 2 + . . .) должна сходиться к матрице, которую обозначим
    (/ — А)~1. Элементы каждой из матриц, входящих в рассматриваемую сумму, являются неотрицательными; следовательно, (/ — А)'1
    есть неотрицательная матрица, диагональные элементы которой
    имеют значения, не меньшие единицы.
    Поэтому если вместо г использовать г* > 0, то
    2

    х*в = (I + А + Л + . . .) г* ^ г* > О,

    (IV)

    так что предыдущий базис остается допустимым (и невырожденным).
    Такая производимая в правой части замена оставляет значения
    показателей достижения оптимальности (значения двойственных
    переменных) базиса В неизменными; это и позволяет прийти к требуемому выводу о сохранении оптимальности стратегии хв.
    Минимизация эквивалентных средних затрат за отрезок. При
    а = 1 функциональное уравнение динамического программирования имеет следующий вид:
    wi =

    min

    по всем (г, ;')
    в сети

    (wj-i-ctj — c)

    для всех i,

    (1)

    где, как и ранее, предполагается, что от каждой вершины i существует маршрут к одной (по крайней мере) из вершин, связанной
    с тем циклом, где достигается с. Это предположение можно опустить,
    изменив соответствующим образом экстремальные уравнения.
    Как было показано на численных примерах в разд. 12.4, значения Wi не определяются однозначно. Более того, хотя метод итераций
    по стратегиям и позволяет найти стратегию, содержащую цикл
    с минимальными эквивалентными средними затратами за отрезок,
    этот метод не позволяет выяснить ту из альтернативных оптимальных
    стратегий, которая оптимальна и при значениях а, близких к 1.
    Аналогичному подходу на основе линейного программирования
    присущ тот же недостаток. Наряду с этим существуют и практические методы нахождения стратегии, оптимальной и при значениях а,
    близких к 1.
    Оптимальное значение с и связанную с ним стратегию можно
    найти, решив двойственную задачу
    Максимизировать с

    (8)

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    при условиях
    Wi — Wj -\- с ^ ctj

    для каждой дуги (г, /) в сети,

    221

    (9)

    где на знаки величин w^ и с не налагается ограничений. Здесь (8) —
    целевая функция, а (9) — ограничения двойственной задачи по
    дугам. Соответствующая прямая задача имеет следующий вид:
    Минимизировать

    2 2

    по всем (i, i)
    в сети

    при условиях
    У\

    по всем (ft, j)
    в сети

    Vhj—

    2

    по всем (г, ft)
    в сети

    S S

    v

    ij ^ 0

    (10)

    (для каждой вершины k), (11)

    Vih = 0

    по всем (i, j)
    в сети

    с^иц

    vtl=i,

    (для каждой дуги (г, /) в сети).

    (12)
    (13)

    Здесь (10) — целевая функция прямой задачи, (И) — ее ограничения по вершинам, (12) — ограничение нормализации во времени, которое именуется нормирующим уравнением и исключает
    возможность получения решения vi} — 0. В результате величины v,j,
    как правило, не являются целочисленными, и положительные Vu
    в оптимальном решении связаны с циклом, обеспечивающим минимум
    эквивалентных средних затрат. Величина иц представляет собой
    долю тех отрезков, в течение которых, при наличии в оптимальной
    стратегии единственного цикла, осуществляется перемещение по
    дуге (i, у).
    Если суммировать уравнения (И) по всем вершинам, слагаемые
    в левой части взаимно уничтожаются, так что возникает избыточность
    числа ограничений и в процессе вычислений можно отбросить одно
    уравнение. Это явление имело место и в сетевых моделях, рассмотренных в гл. 6 и 7; оно соответствует тому обстоятельству, что
    в (9) величины и?г не определяются однозначно — если некоторый
    набор Wi удовлетворяет неравенствам (9), то им удовлетворяет
    и набор значений (wt -f постоянная).
    Пример. Для сети, изображенной на рис. 12.1, двойственная
    и прямая задачи приведены на рис. 12.10 и 12.11. Читателю следует
    сравнить эти модели с теми, которые приводились выше в форме
    таблиц на рис. 12.8 и 12.9, где 0 ^ а < 1. Можно убедиться в том,
    что решение примера 3
    Wi = 0, w2 = 2, w3 = 1, w 4 = —1, с = 2
    (14)
    является допустимым для задачи рис. 12.10 и что в результате этого
    оба допустимых решения
    v

    v

    u ~ u =у •
    1
    fi4 = ^4i = ^23 ~ Vx ~-= т'

    все

    прочие Vij —Q,

    (15)

    все

    прочие Vjj = Q

    (16)

    222

    ГЛАВА 12
    Дуга

    (1,
    (1,
    (2,
    (2,
    (3,
    (4,

    2)
    4)
    1)
    3)
    2)
    1)

    U\

    W2

    1

    -1

    W3

    1
    -1

    Wt

    С

    1


    -1

    1

    <«12

    1

    <«2l

    1

    1
    -1

    1


    •— 1-

    1

    1

    <«32

    1 1


    -1

    Максимизировать
    На знак и*ь не налагается ограничений
    Р и с . 12.10. Двойственная задача линейного программирования для примера 1, приведенного на рис. 12.1.

    являются оптимальными для задачи, приведенной на рис. 12.11.
    (Если уравнение для вершины 1 исключить как избыточное, то
    в базис решения (15) входят и vzi — v3Z = 0.)
    Вершина

    /С12

    1

    1
    2
    3
    4

    —1

    А 14

    1

    У21

    "23

    "32

    1

    —1

    —1

    1

    -1
    1

    1

    =0
    =0
    =0
    =0

    1

    —1

    j

    В среднем за
    цикл

    "41

    1

    1

    1

    1

    1

    1

    Cj 2

    C14

    С21

    «23

    «32

    «41

    Минимизировать

    »tj>0

    Р и с . 12.11. Прямая задача линейного программирования для примера 1, приведенного на рис. 12.1.

    Простые модификации приведенных выше постановок достаточны
    для того, чтобы обобщить их и на ситуации, при которых htj —
    число отрезков, необходимое для перемещения по дуге (i, /) и a,tj =
    h
    = a tj. В случае минимизации интегральных дисконтированных
    затрат мы попросту заменяем а на ац всюду, где а встречается
    в формулах. В случае минимизации эквивалентных средних затрат
    за отрезок требуется лишь поместить коэффициент /г; перед с
    в экстремальных уравнениях (7) и в соответствующих им ограниче-

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    223

    пиях (9) двойственной задачи по дугам. Аналогично этому в выражении ограничения нормализации во времени (12) также ставится
    коэффициент Нц перед иц. При такой постановке НцУц есть доля
    тех отрезков, в которых производится перемещение по дуге (г, /),
    если в оптимальной стратегии имеется единственный цикл.
    12.7. ЗАКЛЮЧИТЕЛЬНЫЕ

    ЗАМЕЧАНИЯ

    В настоящей главе методы последовательных приближений были
    применены для решения экстремальных уравнений в моделях динамического программирования с бесконечным плановым периодом,
    которые удовлетворяют следующим допущениям:
    I) исходы решений являются детерминированными;
    II) состояние системы исследуется в дискретные моменты времени;
    III) как управляющие переменные, так и переменные состояния
    являются дискретными и имеют конечное число возможных значений;
    IV) параметры системы являются стационарными.
    В гл. 16—18 изучаются модели, для которых допущение I) ослаблено и включает вероятностные исходы. Случайные события приводят к необходимости распространения оптимизационных процессов на новый тип поведения. Однако методы решения этих моделей
    немногим отличаются от методов, излагаемых в гл. 8—12.
    Как читатель увидит в моделях теории массового обслуживания
    (гл. 20 и приложение III), некоторые реальные ситуации полезно
    рассматривать так, как будто решения могут приниматься в любой
    момент времени, а не только в дискретные моменты, предусмотренные
    допущением II). Например, управляющий магазина самообслуживания, увидев в «час пик», что очередь покупателей к кассирам
    слишком велика, может в любой момент увеличить число работающих
    касс. Очевидно, он не обязан принимать подобное решение только
    в определенные моменты времени, например разделенные пятиминутными интервалами. В случае таких ситуаций различные изученные читателем методы последовательных приближений можно
    адаптировать с целью разработки реализуемых оптимизационных
    алгоритмов.
    Допущение III), относящееся к дискретному характеру переменных и к конечному числу их значений, нередко вводится по соображениям удобства как анализа, так и вычислений. Однако часта
    реальная система столь же хорошо моделируется при предположениях о непрерывности и даже неограниченности управляющих
    переменных и переменных состояния. Для иллюстрации рассмотрим
    простую модель управления запасами, обобщенную в разд. 12.1.
    В этой модели предполагалось, что объем выпуска продукции х
    должен быть целочисленным. Поскольку спрос отображается целым
    числом единиц, допущение о целочисленности объема производства

    224

    Г Л А В А 12

    влечет за собой целочисленность уровня запасов. Предположим
    вместо этого, что объем выпуска рассматривается как скорость
    (выпуск в течение единицы времени — отрезка), так что постулат
    о его целочисленности отбрасывается. Тогда рекуррентное соотношение для бесконечного планового периода имеет вид
    / (0 = min (С (х) + h (i + х - d) + a/ (i + х - d)],
    (1)
    X

    где —оо ^ i ^ +оо их — любое неотрицательное действительное
    число, не меньшее чем (i — d).
    При анализе такой модели возникают некоторые ранее не встречавшиеся технические детали. Так, например, если предположить,
    что функция / (i) существует и единственна, потребуется все же
    выяснить, является ли / (г) и непрерывной функцией. Аналогично
    этому потребуется определить, является ли функция Хоо (i), которая
    определяет оптимальную стратегию, однозначной и непрерывной.
    Если в выражении типа (1) используются непрерывные переменные, иногда удается, применив аппарат математического анализа,
    получить в явном виде простую формулу для решения / (i) и формулу
    принятия решений х^ (i). Такие результаты обладают существенными
    достоинствами. Не только упрощаются вычисления, необходимые
    для получения конкретных ответов, но и в большей мере выявляется
    структура оптимальной стратегии и ее зависимость от экономических параметров. Методы решения задач с непрерывными переменными представляют наибольший интерес для операционистапрактика, в связи с чем здесь они более подробно не рассматриваются.
    Ослабление допущения о стационарности. Отметим, каким образом допущение IV) было использовано в сетевой модели разд. 12.1.
    Гипотеза о стационарности заключалась в том, что множество имеющихся в сети дуг (i, j) и соответствующих им стоимостных показателей c t j остается неизменным для всех отрезков. Однако, надлежащим
    образом определив переменные состояния, можно обобщить модели
    на большее число ситуаций, чем кажется с первого взгляда. Ниже
    приводится пример циклического варьирования значений параметров.
    Рассмотрим простую модель управления запасами, описанную
    в разд. 12.5. В ней предполагалось, что для любого отрезка Dt = 3.
    Вместо этого предположим, что спрос может быть равным как 3,
    так и 2 единицам. Тогда число вершин, отображающих значения
    переменной состояния i = О, 1, . . ., 4, т. е. уровни запасов на
    начало отрезка, уже не ограничено пятью. Теперь имеется уровень
    запасов на начало отрезка при спросе за отрезок 3 единицы, который
    обозначим i' и примем равным i' = О, 1, . . ., 4, и уровень запасов
    i" = О, 1, . . ., 4 при спросе 2 единицы. Таким образом, новая сеть
    состоит из двух групп по пять вершин на каждой. Допустимое решение о выпуске х единиц продукции в отрезке со спросом Dt = 3
    отображается дугой из вершины i' в вершину ;" = i' + х — 3.
    Аналогично этому решение о производстве х единиц при Dt = 2

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    225

    единицы соответствует дуге из вершины i" в вершину /" = г" -}- х — 2.
    При помощи такого способа можно также отображать колебание
    затрат на производство и хранение продукции от отрезка к отрезку.
    Использование особенностей структуры. В модели восстановления, приведенной в разд. 11.4, показана возможность упрощения
    численного решения функционального уравнения при наличии
    информации о виде оптимальной стратегии. Другие такие примеры
    будут приведены в гл. 18 и приложении II (том III). Предваряя
    эти примеры, рассмотрим одну из операций метода итераций по
    стоимости, а именно нахождение
    min
    (ауп+си).
    (2)
    по всем (г, ;')
    в сети

    В некоторых задачах информация об экономических параметрах
    и о возможных решениях может свидетельствовать о том, что если
    дуга (i, ;'*) оптимальна при i = 0, то эта дуга оптимальна и при
    всех 8 ^ j*. Тогда если известно, что решением является i = О,
    то может исчезнуть необходимость нахождения решений для многих
    других значений 8.
    В качестве другого иллюстративного примера рассмотрим
    £" (/) = ОД" + си Для всех г

    (I)

    и предположим, что / = 1, 2, . . ., Nt. Если модель позволяет
    установить вогнутость g? (j) на этом множестве /, то решением (2)
    попросту является либо / = 1, либо / = N^ Таким образом, для
    каждого i в (2) потребуется проверять только два значения j. Если же
    функция g™ (j) является выпуклой, возможно другое упрощение,
    при котором обычно приходится проверять более двух значений j ,
    но нет необходимости рассматривать все Nt.
    Эффективный метод поиска минимума выпуклой функции основан
    на использовании так называемых чисел Фибоначчи. По существу,
    метод применим для любой функции g (i), причем такой, что g (i)
    строго убывает при возрастании j в пределах 1 ^ / s^ j* и строго
    возрастает при увеличении ;', если / > /*. Такие функции именуются
    дитоническими. Если g (j) есть дитоническая функция, то —g (j)
    называется одновершинной или унимодальной функцией.
    Последовательность чисел Фибоначчи имеет следующий вид:

    1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, . . .,
    (II)
    так что в этой последовательности каждое последующее число есть
    сумма двух предыдущих. Пусть Fn — член п последовательности (II).
    Тогда, согласно так называемому «плану поиска с использованием
    чисел Фибоначчи», минимум функции g (/), где / = 1, 2, . . .
    . . ., (Fn — 1), определяется с помощью (п — 1) вычислений значения функции.

    226

    ГЛАВА 12

    Так, например, предположим, что Fn — 1 = 20, т. е. п = 7.
    Тогда требуется вычислить только п — 1 = 6 значений. Начнем
    с числа Фибоначчи Fn^ и со следующего меньшего числа Fn^2.
    В данном примере F6 — 13 и Fb = 8. Вычислим и сравним g (13)
    и g (8). На основе этого сравнения можно выполнить еще одно вычисление с использованием очередного меньшего числа Фибоначчи,
    т. е. 5. В данном случае, если оказалось, что g (8) =gC g (13), интервал
    поиска минимума функции g (/) сокращается до j = 1, 2, . . ., 12.
    При таком результате сравнения необходимо вычислить и сравнить
    g (5) и g (8). Если же, напротив, g (8) > g (13), то интервал поиска
    сократился до / = 9, 10, . . ., 20. При таком интервале следует
    вычислить значения функции для /' = 13 (/ — 8 = 5) и / = 16
    (/ — 8 =8). Таким образом, в любом случае для очередного сравнения необходимо вычислить g ()) только для одного нового значения /. Процесс продолжается указанным способом и завершается
    нахождением минимума g (j) после проверки шести значений /.
    КОНТРОЛЬНЫЕ УПРАЖНЕНИЯ

    1. Рассмотрите модель управления запасами, описанную в разд.
    12.1. Пусть возможными значениями уровня запасов на начало
    отрезка i являются i = О, 1, . . ., 7, а спрос на отрезке равен
    d = 4.
    а) Сколько различных значений / (j) необходимо определить
    в модели (2)? Напишите экстремальное уравнение для каждого
    из этих значений и укажите, какие значения х следует рассматривать
    при минимизации.
    б) Предположим, что оптимальная стратегия производства заключается в том, чтобы при i ^ 5 выпускать 11 — i единиц продукции,
    а при i > 5 прекращать выпуск. Объясните, каким образом можно
    вычислить значения / (i) (составьте соответствующие экстремальные
    уравнения).
    в) Вычертите сеть, отображающую всю оптимизационную задачу,
    и укажите маршрут, соответствующий оптимальной стратегии для
    варианта б) постановки задачи.
    2. Рассмотрите сетевую постановку, описанную в разд. 12.1.
    а) Объясните, почему значения 1/ г , соответствующие интергальным дисконтированным затратам для оптимального бесконечного
    маршрута, который начинается в вершине i, являются конечными.
    б) Объясните, почему все г/, непременно удовлетворяют экстремальным уравнениям (3).
    3. Рассмотрите сетевую постановку, описанную в разд. 12.1.
    Пусть в сети имеется шесть вершин, и все вершины попарно соединены дугами в обоих направлениях.
    а) Сколько должно удовлетворяться экстремальных уравнений (3)? Напишите каждое из этих уравнений, приведя все их члены,
    которые должны учитываться при минимизации.

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    227

    б) Пусть в оптимальный набор дуг входят дуги (1, 2), (2, (3, 4), (4, 5), (5, 6) и (6, 1). Укажите, какую систему линейных уравнений необходимо решить для нахождения соответствующих значений Уг.
    4. В алгоритме итераций по критерию, приведенном в разд. 12.2,
    не обязательно будет существовать только одна стратегия, оптимальная при принятии текущих решений для всех конечных п ^ N —
    вне зависимости от того, сколь велико значение N. В тексте раздела
    утверждается, что существует такое п*, что для всех п^> п* любая
    стратегия, оптимальная при принятии текущих решений для конечного планового периода длительностью п отрезков, одновременно
    является оптимальной стационарной стратегией для модели с бесконечным плановым периодом. Противоречат ли эти утверждения
    друг другу? Объясните, почему.
    5. Рассмотрите алгоритм итераций по критерию, приведенный
    в разд. 12.2. Предположим, что значения г/? вычисляются на основе
    некоторой первоначально выбранной стратегии и что вычислительный процесс прекращается на итерации т. Опишите стратегию,
    позволяющую получить значения yf. Можно ли считать, что эта
    стратегия будет обязательно стационарной?
    6. Рассмотрите иллюстративный пример (I), приведенный после
    описания алгоритма итераций по критерию в разд. 12.2.
    а) Начертите сеть, отображающую (I).
    б) Проверьте, что значения (II) удовлетворяют функциональным уравнениям для сети и что оптимальными являются как
    дуга (1, 2), так и дуга (1,3).
    в) Если значения у\ в (V) заданы, вычислите у\ и у\ и убедитесь
    в том, что дуга (1, 3) лучше при п = 4, а дуга (7, 2) лучше при п = 5.
    1. В каждом из приведенных ниже вариантов постановки задачи
    вначале вычислите значения уг с учетом анализа, проделанного
    в разд. 12.4. Затем примените алгоритм итераций по критерию,
    описанный в разд. 12.2, начав с у\ = 0. Если вы обозначите через п'
    номер первой из итераций, на которой общая стратегия согласуется
    с оптимальной текущей стратегией, то прекратите расчеты на итерации п' + 3. Нанесите на график значения г/™ и у%.
    а) Пример 1 на рис. 12.1 при а = 0,8.
    б) Пример 1 на рис. 12.1 при а =0,5.
    в) Пример 4 на рис. 12.3 (с12 = 1,5) при а =0,5.
    л

    г) Пример 4 на рис. 12.3 (с12 = 1,5) при а = -г •
    д) В каждом варианте убедитесь в том, что для всех i
    Vi—yi
    где й я _ 4 = max | г/?"1 — yh\.
    h

    8. В каждом из приведенных ниже вариантов постановки задачи
    примените алгоритм итераций по критерию, приведенный в разд. 12.2,

    228

    ГЛАВА 12

    вычисляя уЧ на основе указанного для этого варианта исходного набора дуг (исходной стратегии). Если вы обозначите через п' номер
    первой из итераций, на которой общая стратегия согласуется с оптимальной текущей стратегией, то прекратите расчеты на итерации
    п' -f 3. Нанесите на график значения у% и у\.
    а) Пример 1 на рис. 12.1 при а — 0,8; исходная стратегия включает дуги (1, 4), (4, 1), (2, 3) и (3, 2).
    А
    б) Пример 1 на рис. 12.1 при а = у ; исходная стратегия включает дуги (1,4), (4,1), (2,1) и (3,2).
    л
    в) Пример 4 на рис. 12.3 (с12 = 1,5) при а = j- ; исходная
    стратегия включает дуги (1, 3), (3, 2) и (2, 3).
    л
    г) Пример 4 на рис. 12.3 (с12 = 1,5) при а =-т- ; исходная стратегия включает дуги (1, 2), (2, 3) и (3, 2).
    д) В каждом варианте убедитесь в том, что для всех i
    1 y'i—yi |
    где й п _ 1 = тах [г/Г1 — Уъ \.
    h

    9. Рассмотрите сеть с вершинами 1 и 2 и дугами (1, 1), (2, 2),
    (1, 2) и (2, 1), причем си = с22 == 50 и с12 = с21 = 10; a = -g .
    Изучите сеть и вычислите yi и у%. Примените алгоритм итераций по
    критерию, приведенный в разд. 12.2, приняв у\ = 0 и у\ = 40;
    выполните итерации до п — 5. Нанесите на график yf и г/™. Изменяются ли величины у* монотонно?
    10. Рассмотрите сетевую постановку, описанную в разд. 12.1.
    Предположим, что для каждой вершины г выбрана дуга (г, /).
    а) Объясните, почему в выбранный набор дуг входит по крайней
    мере один цикл. Если имеются два цикла, объясните, почему циклы
    разъединены (т. е. почему вершина не может одновременно входить
    в несколько циклов).
    б) Рассмотрите формулу расчета «стоимости вершин» (2)
    в разд. 12.2. Пусть выбранная стратегия включает только один
    цикл, а именно дуги (1, 2), (2, 3) и (3, 1). Составьте соответствующие
    уравнения (2). Покажите, что решением этой системы линейных
    уравнений являются:
    г/i = с12 + ас 23 + агс31 + а3с12 + а 4 с 2 з + «5Сз1 + • • - ,
    2
    3
    5
    У\ ~ с23 -J- ас31 + а с12 + а с23 + а*с31 + a q2 + . . .,
    в) Пусть применяется алгоритм итераций по стратегиям, где
    значения yi приняты в соответствии с вариантом б). Далее, пусть
    на шагах 3 и 4 обнаруживается, что У" = ay" + c13, Y\ < г/1, а для
    всех остальных Y\ = у". Покажите, что у\ <С у\ и что как следствие
    этого для любой вершины i у\ ^ г/?.

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    229

    11. В разд. 12.3 для простоты предполагается, что из каждой
    вершины i существует маршрут к одной (по крайней мере) из вершин
    цикла, позволяющего достичь минимальных эквивалентных средних
    затрат за отрезок (а. = 1).
    а) Какие осложнения возникают, если отбросить это допущение?
    (Указание: рассмотрите сеть, стоимости на дугах которой равны
    С

    12 =

    С

    21 —

    С

    13 = 1;

    С

    34 —

    С

    4 3 — 2.)

    б) Объясните, почему при 0 ^ а <; 1 не возникает необходимость в таком допущении.
    12. а) Каков смысл величины wt в выражениях (1) и (2)
    разд. 12.3?
    б) Приведите промежуточные алгебраические преобразования,
    позволяющие из (3) получить (4).
    в) Перенесите выражение из правой части (3) в левую; затем
    покажите, что при а = 1 результат эквивалентен (6).
    г) Предположим, что разность wt — w} интерпретируется как
    такое приращение затрат по сравнению с затратами при оптимальной стратегии, которое обусловлено нахождением в вершине i,
    а не в вершине j. С учетом этой интерпретации опишите словами
    экстремальные уравнения (6).
    д) Пусть даны значения wt, удовлетворяющие экстремальным
    уравнениям (5) или (6). Объясните, почему прибавление к этим
    значениям константы позволяет получить новые значения Wi, также
    удовлетворяющие уравнениям (5) или (6). (Продемонстрируйте правильность ваших соображений на сети, включающей три вершины
    с попарным соединением их дугами в обоих направлениях.)
    13. Рассмотрите алгоритм итераций по стратегиям, описанный
    в разд. 12.3, при а = 1.
    а) Пусть сеть включает вершины 1, 2, . . . , / ? . Сколько уравнений и сколько неизвестных будет иметь система линейных уравнений (7)?
    б) Пусть пробная стратегия включает цикл (1, 2), (2, 3) и (3, 1).
    Составьте соответствующие уравнения (7) и покажите, что с™ =
    = (с12 + с 23 + с 3 1 ) / 3 , как это утверждается в (9).
    в) Пусть дуга (г, /) входит в оптимальную стратегию. Чему равна
    разность wi — wfi Пусть дуга (/, k) также входит в эту же оптимальную стратегию. Чему равна разность w-t — w fe ?
    г) Измените описание шагов алгоритма итераций по стратегиям,
    который соответствует представлению экстремальных уравнений
    в виде (6).
    д) Измените описание алгоритма итераций по стратегиям, если
    целью является максимизация среднего эффекта за отрезок.
    14. Рассмотрите сетевую модель, в которой для перемещения
    по дуге (i, i) требуется h^ отрезков, причем не все Пц равны 1. Этот
    случай обсуждается в конце разд. 12.3.
    а) Убедитесь в том, что (3), (4) и (5) действительно преобразуются
    в (I), (II) и (III).

    230

    ГЛАВА 12

    б) Убедитесь в том, что Wi — Wj по-прежнему может интерпретироваться как приращение затрат, обусловленное нахождением в вершине г, а не в вершине ;', при а = 1. С использованием этой интерпретации опишите словами экстремальные уравнения (III).
    15. а) Обратившись к разд. 12.4, убедитесь в том, что решением (3) действительно является (4).
    б) Проверкой алгебраических действий, выполненных в (5) и (6),
    убедитесь в том, что дуга (1, 4) действительно позволяет достичь
    минимума в (5) при 0 ^ а < 1, а дуга (2, 1) — минимума в (6)
    2
    при -у ^ а «< 1. Объясните, почему дуга (2, 3) является лучшим
    2
    решением при значениях а, меньших чем -$.
    О
    в) Покажите, какие изменения необходимо внести в выражения (2) — (6) в том случае, когда в исходной стратегии вместо
    дуги (2, 1) используется дуга (2, 3). Придем ли мы к тем же выводам,
    что в варианте б)?
    г) Убедитесь в том, что показатель возможности улучшения (6)
    для дуги (2, 3) представляет собой интегральные дисконтированные
    затраты, обусловленные перемещением из вершины 2 в 3, возвращением в 2, затем перемещением в 1 и, наконец, движением по циклу
    между вершинами 1 к 4. Сравните значение этого показателя со
    значением у% в варианте в).
    16. а) В разд. 12.4 проверьте алгебраические действия в (7) —
    (И) и убедитесь в том, что при 0 й^ а < 1 минимум соответствует (11).
    б) Проверьте, что при а = 1 формулы расчета «стоимости вершин» имеют вид (12), а их решением является (13). Проверьте также
    расчеты-в (14) и (15). Обсудите приведенное в тексте утверждение,
    что предпочтительней все же является цикл, включающий вершины 2 и 3.
    в) Предположим, что используется стратегия (1), которой при
    О ^ а < 1 соответствуют интегральные дисконтированные затраты (4). Рассмотрите разности г/ 2 — 2/i> а = 1. Покажите, что результирующие величины совпадают
    с w-i — Wi, w% — и?! и z#4 — wi B (13).
    17. Рассмотрите иллюстративный пример на рис. 12.3 при ci2 =
    = 1,5 (пример 4).
    а) Покажите, что если используются дуги (2, 3) и (5, 2), то
    выбор дуги (.?, 2) более предпочтителен, чем выбор дуги (7, 2) для
    конечного планового периода при нечетном числе отрезков, и менее
    предпочтителен — при четном.
    б) Проверьте, что в разд. 12.4 выражение (18) является решением (17). Проверьте алгебраическое действие в (19), а также то,
    что дуга ( 1 , 2 ) позволяет достичь минимума при у ^ а << 1.
    в) Покажите, как необходимо изменить выражения (17) — (19),
    в том случае если вместо дуги (1, 3) используется дуга (1, 2). Проверьте правильность (20).

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    231

    г) Выполните расчеты алгоритма итераций по стратегиям при
    « = 1. Проверьте, что решение, включающее дугу (1, 2), является
    единственным оптимумом.
    д) Рассмотрите стратегию, включающую дуги (7, 2), (2, 3)
    и (3, 2). Примите 0 ^ а < 1; найдите значения г/ 4 , у2 и уа, представив их в виде, аналогичном (18). Рассмотрите разности у2 — yi
    и
    Уз — У\и примите а = 1. Покажите, что результирующие величины совпадают с w2 — u?i и w3 — w} в (23).
    18. Рассмотрите иллюстративный пример на рис. 12.3 при с12 = 2
    (пример 5). Проверьте (21), а также и то, что дуга (1, 3) оптимальна
    при 0 ^ а < 1.
    19. Рассмотрите иллюстративный пример на рис. 12.3 при с12 = 2
    и а = 1 (пример 6).
    а) Проверьте, что формулы (уравнения) расчета «стоимости
    вершин» при использовании дуги (1, 2) имеют вид (22), а их решением является (23).
    б) Составьте и решите аналогичные уравнения расчета «стоимости вершин» при использовании дуги (7, 5).
    в) Проверьте, что при использовании алгоритма итераций по
    стратегиям как дуга (1,2), так и дуга (1, 3) являются оптимальными
    по показателю возможности улучшения.
    20. Рассмотрите пример на рис. 12.4 при а = 1 (пример 7),
    обсуждавшийся в конце разд. 12.4.
    а) Составьте уравнение расчета «стоимости вершин» для стратегии (III) и проверьте, что их решением является (IV). Проверьте
    также значения показателей возможного улучшения, приведенные в (V).
    б) Покажите, что стратегия (V) включает два цикла. Проверьте,
    что решением системы уравнений (VI) является (VIII). Проверьте
    также значения показателей возможного улучшения (VIII).
    в) Завершите выполнение расчетов согласно алгоритму итераций по стратегиям и убедитесь в том, что стратегия (VIII) является
    оптимальной.
    Упражнения 21—26 связаны с задачей фирмы «Надежный поставщик», приведенной в разд. 12.5. Все номера выражений относятся
    к этому же разделу.
    21. а) Пусть 0 ^ а < 1. Используя систему обозначений, соответствующую (2) из разд. 12.1, запишите в полностью развернутом
    виде все функциональные уравнения, которые необходимо удовлетворить.
    б) Пусть а = 1. Введем обозначения g (i) = wt и g = с взамен
    использованных в (6) из разд. 12.5. Запишите функциональные
    уравнения в этой системе обозначений и таким образом представьте
    экстремальные уравнения в виде, аналогичном (2) из разд. 12.1.
    22. В каждом из приведенных ниже вариантов задачи начертите
    сеть, которая содержит только дуги, соответствующие стратегиям

    232

    ГЛАВА 12

    а) (7) и (11);
    б) (12) - (16).
    23. а) Проверьте, что (8) представляют собой уравнения расчета
    «стоимости вершин», соответствующие стратегии (7), и что (9) является решением (8). Приведите со всеми подробностями расчеты (10)
    и проверьте, что их результаты имеют вид (11).
    б) Выполните со всеми подробностями остальные расчеты согласно алгоритму итераций по стратегиям и проверьте результаты г
    приведенные в таблице рис. 12.7. В частности, составьте и решите
    уравнения расчета «стоимости вершин» и сравните показатели возможного улучшения.
    в) Пусть дана оптимальная стратегия (4); приняв а •< 1, найдите
    соответствующие значения у0, г/i, . . ., г/ 4 . Рассмотрите разности
    г/1 — г/о, г/2 — J/o, Уз — г/ 0 , г/ 4 — г/ 0 и примите а = 1. Покажите, что
    полученные величины совпадают с величинами u;d — w0, wz — w0f
    w3 — w0 и u?4 — w0 для оптимальной стратегии.
    24. Примените алгоритм итераций по стратегиям (а — 1), выбрав
    в качестве исходной стратегии набор дуг (0, 1), (1, #), (2, 7), (3, 2)
    и (4,3).
    25. Примените алгоритм итераций по стратегиям, определив
    у" в соответствии со стратегией (7). На каждой итерации укажитепроизводственный цикл, обусловливаемый проверяемой стратегией.
    Примите:
    а) а = 0,9;
    б) а = -TJ- ;
    в) а = б!
    г) Опишите влияние значения а на выбор оптимальной стратегии.
    д) Каково наименьшее значение а и чему равна соответствующая процентная ставка, при которой стратегия (4) все еще остается
    оптимальной?
    26. Примените алгоритм итераций по стоимости, приняв вначалег/? = 0, а затем определяя для у\ те значения, которые отвечают
    стратегии (7). Пусть п' обозначает номер первой итерации, на которой общая стратегия согласуется с оптимальной текущей стратегией.
    для упражнения 25; прекратите расчеты на итерации п' -J- 3.
    Примите:

    а) а = 0,9; б) а = — ; в) а = 0.
    27. Рассмотрите численный пример, приведенный в конце раздела 12.5.
    а) Примите а = 1. Проверьте, что стратегия (1) оптимальна,
    если разрешен объем выпуска х = 6 при С (6) = 28,5. Проверьтетакже, что стратегия (1) обусловливает производственную программу (II).
    •1
    б) Определите оптимальную стратегию при ее = -к- и сравните
    ее со стратегией (1).

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    233

    28. Рассмотрите числовой пример, приведеняый в разд. 12.5.
    В каждый из приведенных ниже вариантов постановки задачи внесите необходимые изменения, кроме того, измените сеть рис. 12.5
    и определите оптимальную стратегию с помощью алгоритма итераций
    по стратегиям при а = 1.
    а) Спрос для каждого отрезка равен 2 единицам (вместо 3).
    б) Спрос для каждого отрезка равен 4 единицам (вместо 3).
    в) Остаток на конец отрезка не должен превышать 3 единиц
    (вместо 4).
    г) Объем выпуска в пределах отрезка не может превышать 4 единиц (вместо 5).
    д) Разрешены только объемы выпуска, равные х = 0, 2, 4 единицам.
    е) Объем выпуска на каждом отрезке должен быть не меньше
    1 единицы (х ^ 1).
    ж) Условно-постоянные затраты на операции по переналадке
    в (3) составляют 10 единиц (вместо 13).
    з) Стоимость содержания запасов равна h = 5 (вместо 1).
    и) Затраты на содержание запасов при ставке h исчисляются
    исходя из среднего уровня запасов на отрезке, а не из уровня запасов
    на конец отрезка.
    29. Рассмотрите иллюстративный пример модели управления
    запасами, приведенной в разд. 12.5. Пусть удовлетворение спроса
    разрешается задерживать па срок не более одного отрезка, однако
    удовлетворение задержанного спроса не должно превышать 3 единиц.
    а) Соответствующим образом измените сеть рис. 12.5.
    б) Пусть штраф за задержку удовлетворения единичного спроса
    на срок в один отрезок равен 10 единицам. Приведите соответствующие стоимости на дугах сети для варианта а).
    30. В каждом из приведенных ниже вариантов постановки задачи
    составьте прямую и двойственную модели линейного программирования, описанные в разд. 12.6. Сначала примите 0 ^ а < 1, так чтобы
    условия задач были аналогичны приведенным на рис. 12.8 и 12.9.
    Затем примите а = 1, так чтобы условия задач были аналогичны
    приведенным на рис. 12.10 и 12.11.
    а) Пример на рис. 12.3 при с12 = 1,5 (пример 4 разд. 12.4).
    Приведите оптимальные решения прямой и двойственной задач
    линейного программирования при а = 1.
    б) Пример на рис. 12.4 (пример 7 разд. 12.4).
    в) Модель управления запасами разд. 12.5 (рис. 12.5).
    г) Приведите оптимальные решения прямой и двойственной
    задач линейного программирования для варианта в) при а, = 0,9;
    а = -;т-;
    а = О (упражнение 25).
    ^
    31. Специальный материал об «ослаблении стационарности»
    в разд. 12.7 содержит описание сети, отображающей модель управления запасами с переменным спросом.

    234

    ГЛАВА 12

    а) Начертите описанную сеть. Пусть функции затрат соответствуют приведенным в разд. 12.5; попытайтесь угадать оптимальную
    стратегию, вычислите соответствующие средние затраты (а = 1)
    и проверьте показатели возможного улучшения в алгоритме итераций по стратегиям, для того чтобы определить, действительно ли
    предлагаемая стратегия является оптимальной. (Указание: при
    выборе стратегии обратите пристальное внимание на характер переменного спроса и на функции затрат.)
    б) Пусть переменный спрос принимает поочередно значения 3
    и 1 вместо 3 и 2. Ответьте на те же вопросы, что и в варианте а).
    в) Если вам не удалось угадать оптимальные стратегии в вариантах а) и б) определения этих стратегий, используйте алгоритм итераций по стратегиям.
    32. Поиск с использованием чисел Фибоначчи. Эффективный
    метод поиска минимального значения дитонической функции описан
    в конце разд. 12.7. Примените этот метод для нахождения приведенных ниже функций:
    а) g ( j ) = (/-7) 2 для / = 0 , 1, . . ., 50.
    б) g (/) - 2/ + (/ - 7)а для / = О, 1, . . ., 50.
    в) g (/) = -2/ + (/ - 7)2 для / = О, 1, . . ., 50.
    f

    , ...
    J
    г) g (]) = Y

    100-у
    для j = 0, 1, . . ., 10,
    9 0 - 3 / для / = 11, 12, . . ., 20,
    30 + Л/ для / = 21, 22, . . ., 30,

    I 180 + ;

    для j = 31, 32, . . ., 40.

    33. Объясните, как вы понимаете следующие термины:
    функциональные, или экстремальные, уравнения;
    стационарная стратегия;
    цикл;
    задача дискретного динамического программирования;
    метод последовательных приближений;
    метод итераций по критерию (метод последовательных
    приближений в пространстве функций);
    метод итераций по стратегиям (метод последовательных
    приближений в пространстве стратегий);
    монотонно возрастающий (убывающий);
    сходимость сверху (снизу);
    формула расчета «стоимости вершин»;
    нормирующее уравнение;
    числа Фибоначчи;
    дитоническая функция;
    одновершинная, или унимодальная, функция.

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    235

    УПРАЖНЕНИЯ НА ПОСТАНОВКУ ЗАДАЧ
    И РАЗВИТИЕ ВЫЧИСЛИТЕЛЬНЫХ НАВЫКОВ

    34. Рассмотрите сеть, изображенную на рис. 12.12; наличие
    стрелок на обоих концах дуги означает, что перемещение по дуге
    разрешено в обоих направлениях и что затраты при этом соответствуют проставленному на
    дуге числу.
    а) Пусть а = 1. Решите
    соответствующие экстремальные уравнения (5) из разд.
    12.3, используя метод итераций по стратегиям.
    б) Примените метод итераций по стратегиям для
    нахождения yt и соответствующей
    стратегии
    при
    а = 0,9;
    а = -~- \ а == 0.
    Используйте оптимальное решение варианта а) в качестве
    Р и с . 12.12.
    исходной стратегии.
    в) Примите а == 0,9. Примените алгоритм итераций по критерию, начав с у\ = 0. Если п
    обозначает номер первой итерации, на которой общая стратегия
    согласуется с оптимальной текущей стратегией, прекратите расчеты
    на итерации п' + 3.
    35. Рассмотрите сеть, изображенную на рис. 12.13; наличие
    стрелок на обоих концах дуги означает, что перемещение по дуге
    разрешено в обоих направлениях и что затраты при этом соответствуют проставленному на дуге числу. Ответьте на вопросы, поставленные в упражнении 34.
    В упражнениях 36—40 требуется изменить постановку задач
    по сравнению с упражнениями, приведенными в предыдущих главах.
    Как и ранее, дайте определения всем используемым обозначениям.
    36. В каждом из приведенных ниже вариантов задачи принято,
    что затраты и эффект дисконтируются к текущему отрезку, причем
    а — коэффициент дисконтирования за отрезок, 0 ^ а < 1. Постройте соответствующую рекуррентную формулу динамического программирования для конечного планового периода, аналогичную
    формуле (1) разд. 12.1.
    а) Задача расширения производственных мощностей в упражнении 33 гл. 10.
    б) Задача общества «Биржевик» в упражнении 34 гл. 10.
    в) Задача сглаживания занятости автомобильной компании
    «Гигант» в упражнении 36 гл. 10.

    236

    ГЛАВА 12

    г) Задача разработки производственной программы в упражнении 39 гл. 10, где принято, что в течение отрезка / выпуск продукции
    составляет Xj. При заданных значениях xit х2, . . ., xi_l укажите
    оптимальное значение xt.
    37. В каждом из приведенных ниже вариантов постановки задачи
    примите, что все параметры являются стационарными, плановый

    Р и с . 12.13.

    период — бесконечным, затраты и эффект дисконтируются к текущему отрезку, а — коэффициент дисконтирования за отрезок, 0 ^
    йС а < 1. Постройте требуемую систему экстремальных уравнений,
    аналогичных (2) из разд. 12.1.
    а) Модель сглаживания производства в упражнении 45 гл. 8.
    б) Модель сглаживания производства в разд. 9.8.
    в) Модель построения производственной программы в упражнении 53 гл. 9.
    г) Задача о продаже скота в упражнении 32 гл. 10.
    38. Рассмотрите модель сглаживания производства в упражнении 45 гл. 8. Используйте параметры модели в иллюстративном
    примере разд. 12.5; пусть «программный» объем выпуска продукции
    составляет х = 3 единицы, а «издержки сглаживания» у = 1.
    а) Примените алгоритм итераций по стратегиям для нахождения
    оптимальной стратегии при а = 1.
    б) Примените алгоритм итераций по стратегиям для нахождения
    оптимальной стратегии при а = 0,9; а = 0,5; а = 0. В качестве
    исходной проверяемой стратегии примите оптимальную стратегию
    варианта а). Опишите влияние, которое значение а оказывает на
    выбор оптимальной стратегии.
    в) Примите а = 0,9. Примените алгоритм итераций по критерию, начав с у° = 0. Если п' обозначает номер первой итерации, на
    которой общая стратегия согласуется с оптимальной текущей стратегией, прекратите расчеты на итерации п' + 3.

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    237

    39. Рассмотрите модель управления запасами, аналогичную приведенной в разд. 12.5. По-прежнему предполагается, что спрос
    D = 3, объем выпуска х ^ 5, уровень запасов на конец отрезка
    j ^ 4. Затраты на производство и содержание запасов описываются
    функцией С (х) -f- hj, где h — 1, a
    П

    И

    =

    lj

    2

    3

    г i~\ — / 5х
    Р х °'
    > '
    L (X) - | 12 -)- ж при а: > 4.

    а) Примените алгоритм итераций по стратегиям для нахождения
    оптимальной стратегии при а = 1.
    б) Примените алгоритм итераций по стратегиям для нахождения
    оптимальной стратегии при а = 0,9; а = 0,5; а = 0. В качестве
    исходной стратегии используйте оптимальное решение варианта а).
    Охарактеризуйте влияние выбора а на оптимальную стратегию.
    в) Примите а = 0,9. Примените] алгоритм итераций по критерию, начав с уЧ = 0. Если п' обозначает номер первой итерации,
    на которой общая стратегия согласуется с оптимальной текущей
    стратегией, прекратите расчеты на итерации п' + 3.
    г) Повторите варианты а), б) и в) при h = 2.
    д) Повторите варианты а), б) и в) при спросе D = 2. (Примечание:
    аналогичные вопросы для конечного планового периода поставлены
    в упражнениях 13 и 15 гл. 9.)
    40. Ответьте на вопросы, поставленные в упражнении 39, приняв,
    что функция затрат производства имеет вид
    С (х) = {

    О
    3 -f- 2х

    при х = О,
    при х = 1.

    (Примечание: для конечного планового периода этот вопрос поставлен в упражнении 14 гл. 9.)
    ДОПОЛНИТЕЛЬНЫЕ УПРАЖНЕНИЯ

    41. Рассмотрите сеть, аналогичную описанной в разд. 12.1,
    причем коэффициент дисконтирования удовлетворяет условию 0 ^
    <сс< 1.
    а) Пусть задана пробная стратегия (не обязательно стационарная) и соответствующие интегральные дисконтированные показатели г/™. Предположим, что имеется хотя бы одна (а возможно,
    и несколько) вершин k, для которой

    min

    по всем (h, j)
    в сети

    (ay

    Рассмотрите стационарную стратегию, в которую включены дуги,
    позволяющие достичь минимума (ау1} + с,-;) для каждой вершины г.

    238

    ГЛАВА 12

    Покажите, что эта новая пробная стратегия позволяет достичь
    такого значения г/J1"1"1, что г/"1"1 ^ г/" для каждой вершины j, причем
    для вершины k это неравенство является строгим.
    б) Предположим, что заключение, сделанное в варианте а)г
    является верным; тогда покажите, что существует стационарная
    стратегия, которая лучше всех других возможных стратегий.
    42. Рассмотрите сеть, аналогичную описанной в разд. 12.1,
    причем коэффициент дисконтирования а удовлетворяет условию
    О ^ а <С 1. Пусть для каждой переменной yt существует нижний
    предел LI и верхний предел Ut, такие, что Lt ^ yt ^ Ut. Покажите,
    что использование дуги (г, k) не приводит к оптимуму, если только

    a,Lh + сл>

    min

    по всем (г, j)
    в сети

    (aUj + Cij).

    Подробно разъясните, как можно использовать это неравенство
    для ускорения сходимости методов последовательных приближений.
    43. Рассмотрите доказательство сходимости алгоритма итераций
    по критерию при 0 s^ a < 1, приведенное в материалах повышенной трудности в конце разд. 12.2. Измените доказательство так,
    чтобы показать, что алгоритм итераций по стратегиям обеспечивает
    скорость сходимости, по крайней мере не меньшую, чем скорость
    геометрической прогрессии (VII).
    44. Рассмотрите двойственную модель линейного программирования при а = 1, а именно (8) и (9) из разд. 12.6, а также соответствующую прямую модель (10) — (13).
    а) Покажите, что мы ничего не упускаем, приняв, что все wt ^ 0.
    б) Покажите, что мы ничего не упускаем, приняв, что в прямой
    модели ограничения имеют вид неравенств типа «не меньше».
    в) Покажите, что если все с^ ^ 0, то без потери строгости можно
    предположить, что с ^ 0 и что нормирующее ограничение (12)
    является неравенством типа «не меньше».
    45. Предположим, что мы отказываемся от допущения, сделанного в разд. 12.3 и говорящего, что от любой вершины i имеется
    маршрут по крайней мере к одной из вершин, принадлежащей тому
    циклу, который позволяет достичь с. Пусть ct — минимальные средние затраты за отрезок, достижимые на тех маршрутах, которые
    начинаются в вершине i. Тогда аналогично экстремальным уравнениям (5) должны удовлетворяться следующие экстремальные
    уравнения:
    wi — min
    (wj + ctj + Cj) для всех вершин j,
    по всем (г, з)
    в сети

    d=

    min

    по всем (i, j)
    в сети

    (cj)

    для всех вершин i.

    а) Придумайте эвристические
    экстремальные уравнения.

    доводы,

    обосновывающие

    эти

    МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ

    239

    б) Покажите, каким образом эти уравнения приводят к шагам (I)
    и (II) алгоритма, приведенного в конце разд. 12.3.
    в) Постройте соответствующие двойственную и прямую модели
    линейного программирования, аналогичные (8) — (13) из разд. 12.3.
    Соответствующая двойственная целевая функция имеет вид максир
    _
    мизации выражения 2 г/гсгп гДе каждое rh > 0, однако в остальном
    h=l

    может выбираться произвольно.
    г) Объясните, почему эти экстремальные уравнения упрощаются
    до вида (5), если сделано особое допущение, приведенное в разд.
    12.3.
    46. Рассмотрите задачу полицейского управления города Шумгам-Сити, приведенную в упражнении 25 гл. 2, а в более общей
    постановке — в упражнении 27 гл. 5. Рассмотрите также результаты, полученные в упражнении 54 гл. 6, в которых утверждается,
    что если число отрезков является нечетным, то модель не эквивалентна сетевой задаче (следовательно, применение линейного программирования может и не давать целочисленного решения). Выясните, каким образом при любой длительности периода Т ставить
    задачу в виде системы экстремальных уравнений, аналогичных (5)
    или (6) из разд. 12.3 для сетевой модели. В частности:
    а) Продемонстрируйте построение требуемой сети. Присвойте
    индексы вершинам таким образом, чтобы они характеризовали
    состояние системы на каждом отрезке. Присвойте индексы дугам
    таким образом, чтобы был ясен характер соответствующего решения, и покажите, как учитываются ограничения задачи.
    б) Напишите экстремальные уравнения, соответствующие результатам, полученным в варианте а), и покажите, почему решение
    поставленных вопросов позволяет получить оптимальную стратегию
    для исходной модели.
    в) Модифицируйте ответы, полученные в вариантах а) и б),
    применительно к ситуации, в которой приступающий к работе в данной системе на отрезке t остается в ней и в течение отрезков t + 1
    и t -f- 2, так что ограничения имеют вид yt_2 + yt-i + Ut ^ rt.
    47. Рассмотрите следующий «смешанный» алгоритм. Примените
    алгоритм итераций по критерию в течение N итераций подряд.
    На итерации JV" используйте пробную стратегию и примените шаг 2
    метода итераций по стратегиям. Прекратите расчеты, если экстремальные уравнения выполняются. В противном случае повторите
    вычисления, приняв в качестве j/f"1"1 значения, полученные по формулам расчета «стоимости вершин» в алгоритме итераций по стратегиям. Объясните, почему этот «смешанный» алгоритм сходится за
    конечное число итераций.

    ГЛАВА 13

    Модели целочисленного программирования
    и комбинаторные модели
    13.1. ПОИСК ФИЛОСОФСКОГО КАМНЯ

    В этой главе, а также и в двух последующих исследуются модели
    математического программирования, в которых ослаблены два допущения: делимости и аддитивности (разд. 2.2). Напомним, что из
    указанных допущений вытекает линейность как целевой функции,
    так и ограничений и, кроме того, при этих условиях переменные
    могут принимать дробные значения, скажем 2,5 или 10/3. Здесь
    снимается допущение делимости и рассматриваются задачи, в которых некоторые или все переменные могут принимать только целочисленные значения. В дальнейшем в гл. 14 и 15 снимается также
    допущение аддитивности.
    Рассмотрим следующую модель:
    71

    Оптимизировать 2 cixi

    (1)

    3=1

    при ограничениях
    п

    2 aijXj^bi,

    i = l, 2, ..., т,

    (2)

    xj^O,
    i = 1, 2, . . ., и,
    xj — целые, / = 1, 2, . . ., р «и).

    (3)
    (4)

    3=1

    Задачи оптимизации такого класса называются задачами целочисленного (или диофантового, или дискретного) программирования. Если
    р = п, т. е. все переменные должны быть целыми числами, то модель
    определяет полностью целочисленную задачу. В противном случае,
    т. е. когда р < п, имеем частично целочисленную задачу.
    В зависимости от конкретного содержания задачи оптимизация
    целевой функции (1) может иметь смысл максимизации или минимизации. (В рассматриваемых ниже алгоритмах и примерах всегда
    указывается характер искомого оптимума целевой функции.) Кроме
    того, любая задача целочисленного программирования может включать ограничения в виде неравенств (^0 и равенств. [Линейные
    ограничения (2) можно считать заданными в канонической форме;
    во всех тех случаях, когда в исходной записи задачи они не соответствуют (2), следует применять преобразования, приведенные
    в гл. 3.]
    Задача целочисленного программирования отличается от любой
    задачи линейного программирования условиями дискретности (4).
    В случае когда линейные ограничения (2) соответствуют некоторой

    МОДЕЛИ ЦЕЛОЧИСЛЕННОГО ПРОГРАММИРОВАНИЯ

    241

    сетевой модели, существует оптимальное решение задачи (1), (2)
    и (3), удовлетворяющее ограничениям целочисленности (4). Этот
    результат уже известен из теоремы о непрерывности для потоков
    в сетях. Однако в общем случае условие (4) накладывает дополнительные ограничения, вследствие которых максимальное значение
    целевой функции задачи целочисленного программирования оказывается меньше значения целевой функции соответствующей задачи
    линейного программирования.
    Значение задач целочисленного программирования. Выше было
    показано, что, как правило, практическое использование моделей
    математического программирования связано с принятием плановых
    решений в сложных ситуациях. Часто встречаются условия, когда
    модели планирования содержат целочисленные переменные.
    1. Использование оборудования. Переменными X) можно обозначить единицы оборудования, которые должны функционировать
    в течение планового периода, описываемого моделью. Если каждая
    единица оборудования имеет большую мощность и высокую стоимость (например, автоматический винторезный станок, океанский
    танкер или 150-дюймовая бумагорезная машина), то дробное значение Xj, скажем 10/3, может и не иметь смысла (т. е. оказаться нереализуемым) в рамках реальной задачи принятия решения. В таком
    случае на значения х} приходится наложить требование целочисленности.
    2. Затраты на подготовку производства. Может возникнуть необходимость рассмотрения операции, выполнение которой связано
    с так называемыми постоянными затратами (или затратами на подготовку производства) С} всегда, когда соответствующее значение
    Xj > 0, причем Cj не зависит от фактического значения Xj. Так,
    например, если X] определяет часовой показатель использования
    объема доменной печи на металлургическом заводе, то Cj соответствует затратам на задувку домны и на ее нагрев до заданной температуры. В разд. 13.2 будет показано, как учесть постоянные
    затраты в модели математического программирования за счет введения целочисленных переменных.
    3. Размеры партий. При разработке некоторых производственных планов на значения X] могут накладываться ограничения вида
    X] = 0 или Xj ^ LJ. Так, например, величина Xj может представлять собой количество определенных изделий, которое нужно выпустить в течение периода t, а Ь} — минимально возможный размер
    партии этих изделий. Подобное условие является примером ограничения вида «или — или», и, как будет показано в разд. 13.2,
    его можно формально ввести в модель, используя целочисленные
    переменные.
    4. Решения типа «да — нет». Может возникнуть необходимость
    определения ситуаций «или — или» иного характера. С этой целью
    на переменные Xj накладываются ограничения х} = 1 или Xj = О,
    соответствующие решениям «принять» или «отвергнуть» либо «да»

    242

    ГЛАВА 13

    или «нет». В качестве примера можно принять, что Xj = 1 соответствует решению строить новое промышленное предприятие, или
    организовать сбыт продукции в новом районе, или приобрести
    новое предприятие, или продать имеющееся в распоряжении фирмы
    оборудование. Довольно часто альтернативы такого рода относятся
    к разряду решений о распределении капиталовложений, поскольку
    их реализация связана с крупными затратами денежных средств
    и ресурсов. Это можно считать основной причиной, объясняющей,
    почему целочисленное программирование играет столь важную роль
    в организационных решениях. Оптимальное решение задачи распределения капиталовложений может принести фирме гораздо большую прибыль, чем приближенное или угаданное. Так, например,
    может оказаться, что фирме, производящей цемент и имеющей
    25 предприятий, удастся значительно повысить получаемую прибыль, сократив число своих предприятий до 20 или менее при условии,
    что такое мероприятие предусматривается оптимальным планом.
    Сокращение накладных расходов при уменьшении числа предприятий может с избытком компенсировать рост транспортных затрат,
    если размещение оставшихся предприятий также подчиняется оптимальному плану.
    В ряде других задач принятия решений может потребоваться
    построение моделей целочисленного программирования. Один класс
    таких задач связан с решениями, определяющими выбор упорядочений, календарных планов (расписаний) и маршрутов. Примером
    задачи, принадлежащей к этому классу, может служить задача
    коммивояжера. В этой задаче нужно отыскать кратчайший маршрут
    коммивояжера, который должен побывать в каждом из п городов,
    причем маршрут начинается и заканчивается городом 1. В качестве
    другого примера задач указанного класса можно взять задачу
    составления расписания обработки деталей на станках. Наиболее
    простым вариантом этой задачи является случай, когда каждая
    из п деталей должна обрабатываться на каждом из k станков. Предположим, что деталь нельзя обрабатывать на станке /, пока не закончена ее обработка на станке / — 1. Предположим, далее, что время
    обработки каждой детали на каждом станке строго фиксировано.
    Тогда оптимальная последовательность определяется расписанием
    обработки, минимизирующим общую продолжительность обработки
    всех деталей на всех станках. Другими примерами задач упорядочения, выбора маршрута и календарного планирования являются
    задачи баланса сборочных линий, сетевого планирования при ограниченных ресурсах (разд. 6.6), предупредительного ремонта при
    ограничениях на рабочую силу и диспетчирования автотранспорта.
    Несмотря на большое внимание, уделяемое в литературе по
    исследованию операций задачам упорядочения, календарного планирования и выбора маршрута, которые отображаются моделями
    целочисленного программирования, до сих пор эти модели находят

    МОДЕЛИ ЦЕЛОЧИСЛЕННОГО ПРОГРАММИРОВАНИЯ

    243

    лишь ограниченное применение на практике. Одна из причин,
    объясняющих такое положение, заключается в том, что в моделях
    целочисленного программирования часто не учитываются некоторые важные условия, характерные для реальных задач календарного
    планирования. Другая причина — вычислительные трудности, оказавшиеся настолько значительными, что затраты, связанные с получением решений для моделей реальной размерности, превышают
    эффект, достигаемый за счет реализации найденного решения.
    Задачи упорядочения, календарного планирования и выбора
    маршрута являются частными случаями комбинаторных задач.
    Комбинаторная оптимизационная задача состоит в отыскании!
    среди конечного множества альтернатив одной, которой отвечает
    экстремальное значение принятой целевой функции. Так, например,
    в задаче коммивояжера при п городах это конечное множествосодержит (п —• 1)! различных допустимых маршрутов, начинающихся и заканчивающихся в городе 1. В самой простой модификации?
    задачи обработки деталей конечное множество альтернатив включает
    (n\)h допустимых последовательностей обработки п деталей на
    k станках.
    При достаточной изобретательности всегда можно сформулировать нетривиальную постановку комбинаторной задачи оптимизации
    в терминах целочисленного программирования. Некоторые математические приемы, приводящие к таким постановкам, изложены
    в разд. 13.2.
    Довольно часто задачи целочисленного программирования имеют
    очень большую размерность (т. е. в них фигурирует огромное число
    переменных и ограничений) и поэтому их постановка не имеет практического смысла. Однако, как будет показано, существует несколько
    алгоритмических методов решения задач целочисленного программирования, которые можно непосредственно применять к комбинаторным моделям без их предварительного преобразования в целочисленные модели.
    Поиск длиною в жизнь. Как решить, что сложнее: задачи целочисленного или линейного программирования? Пожалуй, большинство ответит, что задачи целочисленного программирования
    проще. В защиту этого мнения говорят, что дихотомия, например
    Xj = 0 или Xj = 1, содержит гораздо меньше альтернатив, чем
    непрерывный интервал 0 ^ Xj ==C 1. Исходя из этого делают вывод,
    что поиск оптимума в первом случае должен быть проще. Однако,
    к сожалению, на самом деле справедливо обратное. В моделях математического программирования вычисления значительно проще в случае непрерывных переменных, чем в случае дискретных. Это весьма
    убедительно демонстрирует следующий простой пример, который
    приводится ниже.
    Рассмотрим модель
    Максимизировать 2\xi + 11#2

    (5)

    244

    ГЛАВА 13

    при ограничениях
    7xi + 4хг < 13,
    (6)
    Xi и х2 — неотрицательные целые.
    (7)
    Почти сразу можно определить, что единственным оптимальным
    решением является х^ = 0, х2 = 3. Ясно, что поскольку размерность
    этой задачи чрезвычайно мала, то для отыскания решения и его
    проверки можно воспользоваться самыми различными методами
    (включая метод динамического программирования, изложенный
    в разд. 10.2 применительно к задаче «распределения усилий»).
    Однако, поскольку здесь ставится цель продемонстрировать относительную сложность решения задач целочисленного программирования средней и большой размерности, сразу же исключим из рассмотрения любую схему, подходящую для решения некоторой
    частной задачи, а также общие алгоритмы, позволяющие находить
    решения лишь для задач малой размерности.
    Существует один подход к отысканию целочисленных решений,
    который часто предлагают начинающие. Этот подход сводится
    к тому, что сначала не учитываются условия целочисленности и определяется оптимальное решение обычной задачи линейного программирования. Если полученное решение удовлетворяет ограничениям
    целочисленности, то оно является оптимальным решением и исходной целочисленной задачи (покажите, что это утверждение справед
    ливо). В противном случае предлагается переходить к целочисленному решению с помощью округления решения обычной задачи
    линейного программирования до целых чисел.
    Предположим, что такой подход применяется к примеру (5) —
    (7), Оптимальное дробное решение соответствующей задачи линейного программирования равно х^ = 13/7 и х2 = 0. Очевидное округленное решение равно xt = 2 и х^ = 0, что является недопустимым.
    Решение с округлением в «меньшую сторону» будет х^ = 1 и х2 — 0.
    Это решение допустимо, но оно очень далеко от оптимального. Трудно представить себе даже возможность существования общего, имеющего практическую ценность метода округления дробного решения
    для задач средней и большой размерности, который давал бы оптимальное целочисленное решение.
    Если некоторые коэффициенты ai} в линейных ограничениях (2)
    в какой-либо конкретной модели отрицательны, то сама задача
    округления обычного дробного решения до допустимого целочисленного может оказаться достаточно сложной. Таким образом, хотя
    с помощью метода округления в некоторых случаях и удается отыскивать решения целочисленных задач, нельзя рассчитывать, что этот
    метод ^|можно использовать как универсальный.
    Еще более неприятная особенность, свойственная задачам целочисленного программирования, заключается в том, что нет простого
    способа, позволяющего определить, является ли данное допустимое
    решение оптимальным. В этом одно из важных отличительных раз-

    МОДЕЛИ ЦЕЛОЧИСЛЕННОГО ПРОГРАММИРОВАНИЯ

    245

    личий между задачами целочисленного и линейного программирования. Чтобы показать это различие, предположим, что в приведенной выше задаче (5) — (7) нужно проверить, является ли решение
    х =
    \ #2 = 1 оптимальным. С этой целью нужно проверить, соответствует ли это решение какому-либо локальному оптимуму в том
    смысле, что значение целевой функции не улучшается в любой
    соседней целочисленной точке (или в узле решетки) x t = I -f d
    и xz = 1 + е, где d, e = —1; 0; 1. Покажите, что допустимыми
    соседними точками в данном случае являются точки (xi = xz = 0;
    Xi = 0 и х2 = 1; #1 = 0 и х2 = 2; xi = 1 и х2 = 0). Покажите также,
    что решение х^ — х2 = 1 на самом деле лучше всех этих решений,
    но тем не менее не является оптимальным. Следовательно, некоторая
    точка может быть локально оптимальной по отношению к соседним
    точкам решетки, но все-таки не соответствовать глобальному оптимуму. (Заметим, что такая проверка на локальный оптимум с помощью перебора для задач большой размерности в сущности не
    годится, ибо может существовать огромное число соседних точек.
    В самом деле, если задача описывается полностью целочисленной
    моделью и на каждую переменную Xj наложено ограничение Xj — О
    или Xj = 1, то поиск всех соседних точек любого допустимого решения равносилен перебору всех решений исходной задачи.)
    Сейчас уже пора задать вопрос, сводится ли наилучший общий
    метод решения к простому перебору всех допустимых решений
    и последующему выбору наилучшего из них. Если имеется всего
    несколько допустимых решений, то такой метод действительно проще реализовать, чем любой из рассмотренных далее в этой главе
    алгоритмов. В ряде случаев, встретившихся на практике, именно
    такой метод и применялся (часто многие допустимые решения сразу
    исключаются из рассмотрения как «явно» неоптимальные). Однако,
    как правило, метод полного перебора оказывается неработоспособным. Это объясняется тем, что число допустимых решений не
    всегда конечно, но даже тогда, когда условие конечности не нарушается, это число обычно огромно. Рассмотрим, например, случай
    отыскания оптимального решения задачи целочисленного программирования, содержащей 100 переменных, каждая из которых может
    принимать всего два значения — 0 и 1. Время перебора всех 2100
    возможных решений на самой быстродействующей ЭВМ намного
    превышает продолжительность человеческой жизни.
    Практически эффективные алгоритмы. Из всего изложенного
    выше очевидно, что общий алгоритм решения задач целочисленного
    программирования должен исключать необходимость явного перебора
    всех допустимых альтернатив. Требуются методы, обеспечивающие
    частичный перебор сравнительно небольшого числа допустимых
    вариантов и неявный перебор всех остальных. Напомним, что симплексный метод, применяемый для решения обычных задач линейного программирования, обладает именно такими характеристиками.
    Этот метод предусматривает оценку лишь небольшого числа всех

    246

    ГЛАВА 13

    допустимых базисных решений. (Отметим попутно, что удовлетворительная математическая теория, объясняющая причину столь малого
    числа базисных решений при практическом применении симплексного метода, до сих пор не разработана.) Аналогично в рекуррентных соотношениях, используемых в методе динамического программирования, применяют принцип оптимальности, позволяющий
    устранить необходимость перебора всех допустимых решений. Эффективность этих методов оптимизации, основанных на частичном переборе, оправдывает постановку вопроса о поиске аналогичных подходов к решению задач целочисленного программирования.
    Разработка таких алгоритмов для целочисленных задач представляет собой область интенсивных исследований специалистов
    по прикладной математике. Пока еще преждевременно выделять
    какие-либо алгоритмы, утверждая, что они столь же эффективны
    для целочисленных задач, как симплексный алгоритм для обычных
    задач линейного программирования. По существу, рассматривая
    любой из предложенных до сих пор алгоритмов, легко построить
    примеры целочисленных задач, для решения которых с помощью
    этих алгоритмов требуется объем вычислений, эквивалентный полному перебору. Поэтому практическую эффективность любого из
    алгоритмов нужно в конечном счете оценивать эмпирически, выделяя
    классы задач, для которых рассматриваемый алгоритм оказывается
    наиболее выгодным.
    В различных подходах к целочисленным задачам, которые
    на данном этапе представляются перспективными, складываются
    несколько общих принципов, имеющих фундаментальное значение.
    Эти идеи будут изложены в последующих разделах, начиная с раздела 13.3. Примечательно, что в большинстве алгоритмов в качестве элементарных блоков используются модели линейного программирования и понятия динамического программирования. Опыт
    успешного решения реальных целочисленных задач быстро накапливается. Если операционистам удастся усовершенствовать алгоритмы их решения, то при условии использования быстродействующих ЭВМ этим ученым действительно можно будет приписать честь
    открытия философского камня.
    13.2. ПОСТАНОВКИ ЗАДАЧ ЦЕЛОЧИСЛЕННОГО ПРОГРАММИРОВАНИЯ

    При оценке различных моделей планирования, изложенных
    в гл. 2, легко представить себе ситуации, в которых определенные
    переменные должны принимать только целочисленные значения.
    Имеется бесчисленное множество других примеров, относящихся
    прежде всего к задачам распределения ресурсов в течение короткого
    периода времени (суток, недели, месяца), которые также можно
    отобразить в виде моделей целочисленного линейного программирования. Иллюстрацией таких примеров могут служить задачи

    МОДЕЛИ ЦЕЛОЧИСЛЕННОГО ПРОГРАММИРОВАНИЯ

    247

    выбора автомашин различных габаритов для доставки заданных
    количеств определенных грузов; задачи календарного планирования
    работы бумагоделательных машин и прокатных станов при различных номенклатурах продукции, заданной требованиями заказчика;
    задачи распределения крупных заказов по предприятиям фирмы,
    отличающимся
    производственной мощностью, эффективностью
    и издержками производства. Зная методы построения моделей
    линейного программирования, легко сформулировать такие задачи
    распределения ресурсов в виде моделей целочисленного программирования. Поэтому в данной главе подобные задачи более подробно
    не рассматриваются. Тем не менее было бы неверным, если бы у читателя создалось впечатление, что задачи этого класса составляют
    основное содержание проблемы принятия организационных решений.
    Напротив, наиболее существенными являются задачи, в которых
    рассматриваются вопросы постоянных затрат: задачи двоичного
    (дихотомического) выбора (типа «да — нет» или «принято — отвергнуто») и сложные задачи распределения капиталовложений. Построение моделей целочисленного программирования, отображающих
    подобные ситуации, до некоторой степени являются искусством.
    В связи с этим ниже поясняются некоторые типовые приемы, которые
    полезны для решения этой задачи.
    Для расширения кругозора читателя приводится также пример
    постановки комбинаторной задачи в виде модели целочисленного
    программирования. В качестве такого примера выбрана задача
    коммивояжера. Существенным моментом в этом примере является
    демонстрация связи между комбинаторными задачами и задачами
    целочисленного программирования. Хотя целочисленные постановки
    часто не имеют непосредственно практической ценности, ибо даже
    небольшая комбинаторная задача обычно превращается в целочисленную модель огромной размерности, эта связь позволяет
    выяснить соотношение между идеями, лежащими в основе важнейших алгоритмов решения целочисленных задач.
    Размещение предприятий: пример с постоянными затратами.
    В гл. 6 изучалась классическая транспортная задача
    т

    n

    Минимизировать ^ 2 CijXij
    i=l j = l

    (1)

    при ограничениях
    n

    ij-^Si',

    i = l, 2, ..., т (поставка),

    (2)

    / = 1, 2, ..., п (спрос),

    (3)

    3=1
    771

    2 XH^DJ,

    г=1

    Хц ^ 0 при любом i и ;'.

    (4)

    248

    ГЛАВА 13

    Вспомним, что одна из интерпретаций этой задачи сводилась к тому,
    что имеется т поставщиков (пунктов отправления), располагающих
    товарами, которые нужно доставить п потребителям (в п пунктов
    назначения). Поставщик i может отправить потребителю не более-8{
    изделий, а потребителю j требуется не менее D} изделий. Затраты
    на транспортировку единицы груза из пункта i в пункт / составляют GIJ. В задаче нужно выбрать план перевозок, минимизирующий
    общие транспортные затраты.
    В ряде практических применений часть этой задачи заключается
    в том, чтобы определить, каких именно из т возможных поставщиков
    целесообразно использовать. Поставщиками, как правило, являются
    предприятия или склады, работа которых сопряжена с накладными
    расходами, включаемыми в затраты на транспорт при определении
    прибыли фирмы. Обычно необходимо сопоставить выигрыш (экономию), достигаемый за счет использования меньшего числа поставщиков (предприятий и складов), с потерями, обусловленными повышением собственно транспортных расходов.
    Рассмотрим в качестве примера фирму «Прогресс», намеренную
    расширить сферу своей деятельности, включив в нее обслуживания
    потребителей, проживающих в штатах, которые лежат к западу
    от Скалистых гор. Чтобы обеспечить решение этой проблемы, фирма «Прогресс» планирует открыть несколько новых сборочных
    заводов. Предположим, что пункт i представляет собой одну и»
    возможных точек размещения нового завода. Предположим также,
    что производственная мощность этого завода равна S{, а постоянныезатраты, связанные с его эксплуатацией, равны Ft ^ 0 независимо,
    от фактического объема выпуска. Существует всего т возможных
    пунктов размещения новых предприятий, однако постоянные затраты, связанные с их эксплуатацией, настолько значительны, чтооткрывать их во всех этих пунктах было бы нерационально. Примем,
    что величина Сц ^ 0 представляет собой совокупные производственные и транспортные затраты, которые необходимы для доставки
    одного изделия из пункта изготовления i в пункт сбыта /'. Кроме
    того, примем, что существуют постоянные затраты Рц ^ 0, связанные с обеспечением транспортировки грузов по маршруту из.
    пункта i в пункт /. Значение величины Рц не зависит от значенияхи^> 0, но при Хц = 0 она также равна нулю.
    Для того чтобы построить математическую модель, введем целочисленные управляемые переменные:
    1,
    О

    если выбран пункт размещения г,
    в противном случае,
    1, если маршрут из пункта i
    в район j используется,
    О в противном случае

    для всех i и /.

    МОДЕЛИ ЦЕЛОЧИСЛЕННОГО ПРОГРАММИРОВАНИЯ

    249

    Тогда вместо целевой функции (1) в обычном виде получаем целевую
    функцию следующего вида:
    m

    Минимизировать 2 FtUi-\- S S Сцхц+ S S fazij-

    (5)

    Вместо ограничения (2) на мощности поставщиков вводим ограничения на пропускные способности:
    п

    2 Xij — Styi^.0, i = l, 2, ..., m (поставки).
    (6)
    j=i
    Если пункт размещения i не выбран, т. е. yt = 0, то ограничение (6)
    обеспечивает недопустимость неравенства Хц ~> 0. Ограничения (3)
    по спросу потребителей и требование (4) неотрицательности переменных остаются без изменений. Для некоторых алгоритмов решения задач целочисленного программирования достаточно, кроме
    того, указать, что все переменные i/, и ztj должны быть равны либо О,
    либо 1. Однако существуют также алгоритмы, для которых эти
    ограничения должны быть выражены в развернутой форме;
    yi ^ I, z t j ^ 1 при любом г и /,

    (7)

    UiZij — неотрицательные целые при любом i и /.

    (8)

    [Объясните, почему условия (7) и (8) совместно гарантируют, что
    любая величина у г или z t j равна либо 0, либо 1.1
    Построение модели еще не закончено, ибо не установлена зависимость между значениями ztj и xtj. Нужно добиться того, чтобы
    условие Хц> 0 выполнялось только в случае, когда zt] = 1. Это
    достигается с помощью линейных ограничений
    x t j — UijZij ^ 0 при любом i и у,
    (9)
    где Ui} — коэффициент, имеющий достаточно большое значение.
    Например, можно принять U t j — min (Sj, Dj). Покажите, что если
    Zij = 0, то из условия неотрицательности (4) и условия (9) следует,
    что значение XD должно быть равно нулю, а если zlt = 1, то условие (9) при наличии нового ограничения (6) на мощности поставщиков и ограничения (3) на спрос потребителей является избыточным.
    [Убедитесь также в том, что в оптимальном решении никогда не
    требуется, чтобы выполнялось условие z t j = 1 и xij = 0.]
    Легко построить примеры, в которых обычная задача линейного
    программирования, определяемая (5) — (7), (9), имеет оптимальное
    решение с дробными значениями переменных. Поэтому ограничение
    (8), требующее целочисленных значений у, и z^, весьма существенно. Как и в обычной транспортной задаче, необходимо только
    поставить условие неотрицательности всех x £j -, поскольку свойство
    целочисленности этой задачи сохраняется при условии целочисленности yi и г .

    250

    ГЛАВА 13

    Условие (9) обобщается на другие случаи. При наличии постоянных затрат Cj ^ 0, сопоставляемых обычной переменной Xj в модели
    линейного программирования, для постановки целочисленной задачи
    /
    f I\
    нужно ввести двоичную (булеву) переменную z,- = s /,и ) и огра\
    !. /
    ничение (Xj — Uzj ^ 0), где значение U выбирается достаточно
    большим. Заметим, что при этом модель усложняется, поскольку
    добавляются одна целочисленная переменная и по линейному ограничению на каждую переменную, входящую в постоянные затраты.
    Размеры партий. Пример с альтернативными ограничениями.
    Предположим, что Xj есть количество изделий, которое выпускается
    в течение некоторого планового периода. При этом возможны две
    ситуации: Xj ^ LJ, где Ls — наименьший допустимый размер партии, либо Xj = 0 в течение всего рассматриваемого периода. Предположим, что можно задать достаточно большое число £/,-, такое,
    что ограничение (Xj ^ U}) в оптимальном решении наверняка выполняется. Тогда дихотомию (xj = 0 или Xj ^ LJ) можно выразить,
    введя булеву переменную (у} = 0 или г/;- = 1) и два линейных ограничения
    х, - lift, < 0,
    (10)
    х} - Ljyj > 0.
    (И)
    При У] = 0 из ограничений (10) и (11) следует, что изделия не выпускаются (xj = 0). При г/у = 1 ограничение (10) теряет смысл, а из
    ограничения (11) вытекает заданное условие на размер партии.
    Изложенный подход можно обобщить, распространив его на
    случаи, когда решение должно удовлетворять по крайней мере
    k из р ограничений:
    п

    2j aijXj^bi,

    i = l, 2, ..., p.

    (12)

    Введем р булевых переменных yt = 0 или 1, г = 1, 2, . . „ , / ?
    и наложим 1 + р линейных ограничений:
    (13)

    S y,>k,

    ИЛИ

    S aiiX] - (bt - U,) yt^Ui,

    3=1

    где значение
    п

    (S

    3=1

    a

    ijXj^Ui)

    V\ выбирается

    (14)

    t + Ut(l~yi)

    э' = 1

    столь

    г = 1, 2, ..., р,
    большим,

    чтобы

    условие

    обязательно выполнялось в опти