Оптимального Управления Математическая Теория

Раздел математики, в к-ром изучаются способы формализации и методы решения задач о выборе наилучшего в заранее предписанном смысле способа осуществления управляемого динамич. процесса. Этот динамический процесс может быть, как правило, описан при помощи дифференциальных, интегральных, функциональных, конечноразностных уравнении (или иных формализованных эволюционных соотношений), зависящих от системы функций или параметров, наз. управлениями и подлежащих определению. Искомые управления, а также реализации самого процесса следует в общем случае выбирать с учетом ограничений, предписанных постановкой задачи. В более специальном смысле термином "О. у. м. т." принято называть математич. теорию, в к-рон изучаются методы решения неклассических вариационных задач оптимального управления (как правило, с дифференциальными связями), допускающих рассмотрение негладких функционалов и произвольных ограничений на параметры управления или иные зависимые переменные (обычно рассматривают ограничения, задаваемые нестрогими неравенствами). Термину "О. у. м. т." иногда придают более широкий смысл, имея в виду теорию, изучающую математич. методы исследования задач, решения к-рых включают какой-либо процесс статической или динамич. оптимизации, а соответствующие модельные ситуации допускают интерпретацию в терминах той или иной прикладной процедуры принятия наилучшего решения. В таком толковании О. у. м. т. содержит элементы исследования операций, математического программирования и игр теории. Задачи, рассматриваемые в О. у. м. т., возникли из практич. потребностей, прежде всего в области механики космич. полета и автоматического управления теории (см. также Вариационное исчисление). Формализация и решение этих задач поставили новые вопросы, напр, в теории обыкновенных дифференциальных уравнений, как в области обобщения понятия решения и вывода соответствующих условий существования, так и в изучении динамических и экстремальных свойств траекторий управляемых дифференциальных систем; в частности, О. у. м. т. стимулировала изучение свойств дифференциальных включений. Соответствующие направления О. у. м. т. поэтому часто рассматриваются как раздел теории обыкновенных дифференциальных уравнений. В О. у. м. т. содержатся математич. основы теории управления движением — нового раздела общей механики, в к-ром исследуются законы формирования управляемых механич. движений и смежные математич. вопросы. По методам исследования и по своим приложениям О. у. м. т. тесно связана с аналитич. механикой, в особенности с разделами, относящимися к вариационным принципам классической механики. Хотя частные задачи оптимального управления и неклассические вариационные задачи встречались и ранее, основы общей О, у. м. т. были заложены в 1956 — 1961. Ключевым пунктом этой теории послужил Понтрягина принцип максимума, сформулированный Л. С. Понтрягиным в 1956 (см. [1]). Важными стимулами создания О. у. м. т. были открытие метода динамического программирования, выяснение роли функционального анализа в теории оптимальных систем, открытие связей решений задач оптимального управления с результатами теории устойчивости по Ляпунову, появление работ, связанных с понятиями управляемости и наблюдаемости динамич. систем (см. [2]-[5]). В последующие годы были развиты основы теории стохастич. управления и стохастич. фильтрации динамич. систем, построены общие методы решения неклассических вариационных задач, получены обобщения основных положений О. у. м. т. на более сложные классы динамич. систем, изучены связи с классическим вариационным исчислением (см. [6]-[11]). О. у. м. т. интенсивно развивается, в частности, в направлении изучения игровых задач динамики (см. Дифференциальные игры), задач управления в условиях неполной или неопределенной информации, систем с распределенными параметрами, уравнений на многообразиях и т. д. Результаты О. у. м. т. нашли широкие приложения в формировании процессов управления, относящихся к самым разным областям современной техники, в изучении экономич. динамики, в решении ряда задач из области биологии, медицины, экологии, демографии и т. д. Задача оптимального управления в общем виде может быть описана следующим образом. 1) Дана управляемая система S, состояние к-рой в момент времени tизображается величиной х(напр., вектором обобщенных координат и обобщенных импульсов механич. системы, функцией от пространственных координат в распределенной системе, вероятностным распределением, характеризующим текущее состояние стохастич. системы, вектором выпуска продукции в динамич. модели экономики и т. д.). Предполагается, что к системе Sприложены управляющие воздействия и, оказывающие влияние на ее динамику. Они могут, напр., иметь смысл механич. сил, температурных или электрич. потенциалов, программы капиталовложений и т. д. 2) Дано уравнение, связывающее переменные х, и, t и описывающие динамику системы. Указан промежуток времени, на к-ром рассматривается уравнение. В типичном случае это может быть обыкновенное дифференциальное уравнение вида с заранее оговоренными свойствами функции f (часто требуют, напр., непрерывности f по t, x, и и непрерывной дифференцируемости по х). 3) Известен характер информации, к-рая может быть использована для формирования управляющих воздействий (напр., в каждый момент времени или в заранее предписанные моменты становятся известными доступные измерению величины — значения фазовых координат системы (1) или функций от этих координат). Оговорен класс функций, описывающих управления, допускаемые к рассмотрению: множество кусочно непрерывных функций вида u=u(t), множество линейных по хфункций вида u=u(t, x)=P'(t)xс непрерывными коэффициентами и т. д. 4) Установлены ограничения на процесс, подлежащий реализации. Сюда прежде всего входят условия, определяющие цель управления (напр., для системы (1) — попадание в заданную точку или на заданное множество фазового пространства , требование стабилизации решений около заданного движения и т. д.). Кроме того, ограничения могут быть наложены на величины управляющих воздействий иили координат состояния х, на функции от этих величин, на функционалы от их реализаций и т. д. В системе (1), напр., возможны ограничения на параметры управления и на координаты здесь U, X — замкнутые множества, j, y -- дифференцируемые функции. Могут рассматриваться и более сложные ситуации, когда множество Uзависит от t, х или задано неравенство вида (случай смешанных ограничений) и т. д. 5) Задан показатель (критерий) качества процесса, подлежащего реализации, представимый в виде функционала от реализации переменных х, и на рассматриваемом отрезке времени. Условия 1)- 4) теперь дополняются требованием оптимальности процесса — минимума, максимума, минимакса и т. д. показателя Таким образом, в заданном классе управлений для заданной системы требуется выбрать управление и, оптимизирующее показатель (при условии достижения цели управления и при выполнении наложенных ограничений). Функция (напр., вида u=u(t).или u=u(t, х).и т. д.), решающая задачу оптимального управления, наз. оптимальным управлением (пример формулировки типичной задачи оптимального управления см. в ст. Понтрягина принцип максимума). Среди динамич. объектов, охватываемых задачами О. у. м. т., принято отличать конечномерные от бесконечномерных — в зависимости от размерности фазового пространства соответствующих систем дифференциальных уравнений, описывающих их, или от вида ограничений, наложенных на фазовые переменные. Различают задачи оптимального управления программного и оптимального управления позиционного. В первом случае воздействие иформируется в виде функции времени. Во втором случае воздействие иформируется в виде стратегии управления по принципу обратной связи, как функция от доступных значений текущих параметров процесса. В изучении задач О. у. м. т. выделяют вопросы существования решений, вывод необходимых условий экстремума (оптимальности управления), исследование достаточных условий, построение численных алгоритмов. Рассматриваются также соотношения между решениями задач О. у. м. т., полученных в классе программных и позиционных управлений. Описанные варианты постановок задач оптимального управления предполагают существование корректной математич. модели процесса и рассчитаны на полную априорную или даже на полную текущую информацию о соответствующей системе. Однако в прикладных постановках доступной информации о системе (напр., сведений о начальных и конечных условиях, о коэффициентах соответствующих уравнений, о значениях дополнительных параметров или доступных измерению координат и т. д.) часто оказывается недостаточно для прямого применения отмеченной выше теории. Последнее приводит к задачам оптимального управления, сформулированным в иных информационных предположениях. Большой раздел О. у. м. т. посвящен задачам, где описание недостающих величин носит статистич. характер (т. н. теория стохастического оптимального управления). Если какая-либо статистич. информация о недостающих величинах отсутствует, но заданы лишь допустимые области их изменения, то соответствующие задачи рассматриваются в рамках теории оптимального управления в условиях неопределенности. К решению этих задач тогда привлекают методы минимакса и теории игр. Задачи стохастического оптимального управления и оптимального управления в условиях неопределенности особенно содержательны, когда речь идет о позиционном оптимальном управлении. Хотя формализованное описание управляемых систем может принимать достаточно абстрактную форму (см. [11]), простейшая классификация допускает также деление их на системы с непрерывным временем (описываемые, напр., дифференциальными уравнениями — обыкновенными или с частными производными, уравнениями с отклоняющимся аргументом, уравнениями в банаховом пространстве, а также дифференциальными включениями, интегральными, интегро-дифференциальными уравнениями и т. д.) и многошаговые (дискретные) системы, описываемые рекуррентными разностными уравнениями и рассматриваемые лишь в изолированные (дискретные) моменты времени. Дискретные системы управления, помимо самостоятельного интереса, имеют серьезное значение как конечно-разностные модели непрерывных систем. Последнее важно для построения численных методов решения задач оптимального управления (см. [12], [13]), в особенности в тех случаях, когда исходная задача подвергается дискретизации, начиная с самой постановки. К дискретным системам применимы основные указанные выше постановки задач. Хотя теоретико-функциональная сторона исследования здесь оказывается проще, перенесение основных фактов теории оптимального управления для непрерывных систем и изложение их в компактной форме связано со специфич. трудностями и не всегда возможно (см. [14], [15]). Теория оптимальных линейных дискретных систем управления с ограничениями, задаваемыми выпуклыми функциями, разработана достаточно полно (см. [15]). Она смыкается с методами линейного и выпуклого программирования (особенно с соответствующими "динамическими" или "нестационарными" вариантами) (см. [16]). Важное значение в этой теории приобретают решения, позволяющие соединять в рекуррентном процессе оптимизацию дискретной динамической системы с реализацией адекватного численного дискретного алгоритма. Отдельный круг проблем О. у. м. т. образуют вопросы аппроксимации решений задач оптимального управления для непрерывных систем дискретными, тесно связанные с проблемой регуляризации некорректно поставленных задач (см. [17]). Лит.:[1] Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф., Математическая теория оптимальных процессов, 3 изд., М., 1976; [2] Беллман Р., Динамическое программирование, пер. с англ., М., 1900; [3] Красовский Н. Н., Теория управления движением, М., 1968; [4] его же, в сб.: Механика в СССР за 50 лет, т. 1, М., 1968, с. 179-244; [5] Калман Р., в кн.; Труды 1 Международного конгресса Международной федерации по автоматическому управлению, т. 2, М., 1961, с. 521-47; [6] Флеминг У., Ришел Р., Оптимальное управление детерминированными и стохастическими системами, пер. с англ., М., 1978; [7] Алексеев В. М., Тихомиров В. М., Фомин С. В,, Оптимальное управление, М., 1979; [8] Варга Дж., Оптимальное управление дифференциальными и функциональными уравнениями, пер. с англ., М., 1977; [9] HestenesM., Calculus of variations and optimal control theory, N. Y., 1966; [10] Я н г Л., Лекции по вариационному исчислению и теории оптимального управлений, пер. е англ., М., 1874; [11] Калман Р.., Фалб П., Арбиб М., Очерки по математической теории систем, пер. с англ., М., 1971; [12] Моисеев Н. Н., Элементы теории оптимальных систем, М., 1975; [13] Черноусько Ф. Л., Колмановский В. Б., в кн.: Итоги науки и техники. Сер. Математический анализ, т. 14, М., 1977, с. 101-66; [14] Болтинский В. Г., Оптимальное управление дискретными системами, М., 1973; [15] Саnоn М. D., Сu11um С. D., Ро1ak E., Theory of optimal control and mathematical programming, N. Y., 1970; [l6] Пропой А. И., Элементы теории оптимальных дискретных процессов, М., 1973; i!7] Тихонов А. Н., Арсенин В. Я., Методы решения некорректных задач, 2 изд., М., 1979. А. Б. Куржанский.

Источник: Математическая энциклопедия на Gufo.me