Теория оптимального управления. Оптимальное управление технологическими процессами (Лекция) Аналитическое конструирование регуляторов

Под оптимальной САУ понимается наилучшая в некотором смысле система. Критерии оптимальности могут быть различны и зависят от решаемой задачи. Наиболее часто встречаются такие критерии оптимальности:

1) Точность САУ при изменяющемся воздействии,

2) Время переходного процесса,

3) Экономичность;

    Производительность;

    Интегральные критерии.

К настоящему времени наибольшее развитие получили 2 направления в теории оптимальности систем:

1) Теория оптимального управления движением систем с полной информацией об объекте и возмущениях;

    Теории оптимального управления при случайных возмущениях.

Для реализации оптимального управления необходимо:

    Определить цель управления. Цель выражается либо целевой функцией, либо критерием оптимизации.

Целевая функция или критерий оптимизации позволяют найти количественный эффект любого решения.

    Выбрать модель для анализа и определения эффективности принятого решения.

    Изучить все состояния среды функционирования объекта, влияющие на прошлое, настоящее и будущее процесса управления.

При решении задачи оптимального управления используются методы вариационного исчисления, принципы максимума, а также динамическое и математическое программирование.

Задачу оптимального управления в общем случае можно сформировать следующим образом:

1)Цель управления, представленная математически в виде некоторого функционалаили критерия управления

2)Уравнения системы - они обычно задаются в виде уравнений состояний

3)Система граничных уравнений в начальный и конечный момент времени.

4)Система ограни­чений, которым должны удовлетворять переменные состояния и уравнения.

Требуется найти:

Вектор управления, при котором критерий цели управления имеет экстремум (max или min).

Необходимо отметить, что оптимальное управление в ряде случаев может не существовать, и об этом нельзя судить не решая задачу. Решение задачи нахождения оптимального управления является неоднозначным, т.е. каждое найденное решение дает локальный оптимум. Если найдены все локальные оптимумы, то в этом случае может быть выделен глобальный оптимум. Найденный глобальный оптимум является решением задачи оптимального управления.

Интегральные критерии качества:

    Оптимальное Быстродействие

Функционал имеет вид

    Оптимальная Производительность

Критерием оптимальности явл-ся угол поворота  за определенное время t и функционал имеет вид

    Оптимальная экономичность

Критерием оптимальности явл-ся расход энергии за определенное время и функционал имеет вид

28. Аналитическое конструирование регуляторов. Постановка задачи.

При исследовании качества переходных в линейных САУ вводились разлитые интегральные критерии качества, с помощью которых оценивался переходной процесс на бесконечном интервале времени. При рассмотрении интегральных критериев качества мы убедились в том, что эти критерии позволяют определить параметры регулятора, если задана его структура. Можно поставить более общую задачу: найти закон регулирования - аналитическую функцию, связывающую управляющую координату и управляющее воздействие при этом доставляющее min интегральному критерию качества. Такое оптимальное конструирование дифференциального уравнения регулятора получило название аналитического конструирования регуляторов. По методам решения и постановке задачи эта задача сродни задачам оптимального регулирования.

Это вариационная задача, где в качестве экстремали ищется функция связывающая Х и U.

При аналитическом конструировании задача состоит в том, что бы найти закон регулирования который с учетом уравнений объекта и граничных условий доставлял бы min интегралу, характеризующему квадратичную ошибку системы и гарантирующему ее устойчивость.

Постановка задачи оптимального конструирования регуляторов.

Объект регулирования задан с помощью дифуравнений, что в операторной форме соответствует заданию передаточной функции Wор(S) (или W(S))

Считают что на систему не действуют внешние возмущения, а переходной процесс происходит при изменении начальных условий.

X = y 0 – y - рассогласование

Вустойчивой линейной САУ в результате переходного процесса все функции координат должны стремиться к 0. х 1 () = х 2 () = … х n () = U() = 0 (2)

В качестве критерия оптимальности выберем интеграл вида

(3), где V- положительно определённая квадратичная форма.

Т.е. если подставитьV в  (3) то это будет квадратичная ошибка системы.

Член U 2 в (4) характеризует стоимость процесса управления, т.е. затраты энергии на нагрев. U 2 гарантирует отсутствие нереализуемых в линейных регуляторах законов, он гарантирует отсутствие управляющих воздействий, при которых скорость превращается в бесконечность.

Само существование (3) гарантирует устойчивость системы. При аналитическом конструирование задание состоит в том чтобы найти в аналитической форме функцию Ф(U,U,x 1 …x k) = 0 (5) – который с учётом уравнений объекта и приграничных условий (1) и (2) доставлял бы минимум интегралу (3).

Задачи оптимального управления относятся к теории экстремальных задач, то есть задач определения максимальных и минимальных значений. Уже то обстоятельство, что в этой фразе встретилось несколько латинских слов (maximum - наибольшее, minimum - наименьшее, extremum - крайнее, optimus - оптимальное), указывает, что теория экстремальных задач была предметом исследования с древних времен. О некоторых таких задачах писали еще Аристотель (384-322 годы до н.э.), Евклид (III в. до н.э.) и Архимед (287-212 годы до н.э.). Основание города Карфагена (825 год до н.э.) легенда ассоциирует с древнейшей задачей определения замкнутой плоской кривой, охватывающей фигуру максимально возможной площади. Подобные задачи именуются изопериметрическими.

Характерной особенностью экстремальных задач является то, что их постановка была порождена актуальными запросами развития общества. Более того, начиная с XVII века доминирующим становится представление о том, что законы окружающего нас мира являются следствием некоторых вариационных принципов. Первым из них был принцип П. Ферма (1660 год), в соответствии с которым траектория света, распространяющегося от одной точки к другой, должна быть такова, чтобы время прохождения света вдоль этой траектории было минимально возможным. Впоследствии были предложены раз- личные широко используемые в естествознании вариационные принципы, например: принцип стационарного действия У.Р. Гамильтона (1834 год), принцип виртуальных перемещений, принцип наименьшего принуждения и др. Параллельно развивались и методы решения экстремальных задач. Около 1630 года Ферма сформулировал метод исследования на экстремум для полиномов, состоящий в том, что в точке экстремума производная равняется нулю. Для общего случая этот метод получен И. Ньютоном (1671) и Г.В. Лейбницем (1684), работы которых знаменуют зарождение математического анализа. Начало развития классического вариационного исчисления датируется появлением в 1696 году статьи И. Бернулли (ученика Лейбница), в которой сформулирована постановка задачи о кривой, соединяющей две точки А и В, двигаясь по которой из точки А в В под действием силы тяжести материальная точка достигнет В за минимально возможное время.

В рамках классического вариационного исчисления в XVIII-XIX веках установлены необходимые условие экстремума первого порядка (Л. Эйлер, Ж.Л. Лагранж), позднее развиты необходимые и достаточные условия второго порядка (К.Т.В. Вейерштрасс, А.М. Лежандр, К.Г.Я. Якоби), построены теория Гамильтона-Якоби и теория поля (Д. Гиль- берт, А. Кнезер). Дальнейшее развитие теории экстремальных задач привело в XX веке к созданию линейного программирования, выпуклого анализа, математического программирования, теории минимакса и некоторых иных разделов, одним из которых является теория оптимального управления.

Эта теория подобно другим направлениям теории экстремальных задач, возникла в связи с актуальными задачами автоматического регулирования в конце 40-х годов (управление лифтом в шахте с целью наискорейшей остановки его, управление движением ракет, стабилизация мощности гидроэлектростанций и др.). Заметим, что постановки отдельных задач, которые могут быть интерпретированы как задачи оптимального управления, встречались и ранее, например в “Математических началах натуральной философии” И. Ньютона (1687). Сюда же относятся и задача Р. Годдарда (1919) о подъеме ракеты на заданную высоту с минимальными затратами топлива и двойственная ей задача о подъеме ракеты на максимальную высоту при заданном количестве топлива. За прошедшее время были установлены фундаментальные принципы теории оптимального управления: принцип максимума и метод динамического программирования.

Указанные принципы представляют собой развитие классического вариационного исчисления для исследования задач, содержащих сложные ограничения на управление.

Сейчас теория оптимального управления переживает период бурного развития как в связи с наличием трудных и интересных математических проблем, так и в связи с обилием приложений, в том числе и в таких областях, как экономика, биология, медицина, ядерная энергетика и др.

Все задачи оптимального управления можно рассматривать как задачи математического программирования и в таком виде решать их численными методами.

При оптимальном управлении иерархическими многоуровневыми системами, например, крупными химическими производствами, металлургическими и энергетическими комплексами, применяются многоцелевые и многоуровневые иерархические системы оптимального управления. В математическую модель вводятся критерии качества управления для каждого уровня управления и для всей системы в целом, а также координация действий между уровнями управления.

Если управляемый объект или процесс является детерминированным, то для его описания используются дифференциальные уравнения. Наиболее часто используются обыкновенные дифференциальные уравнения вида. В более сложных математических моделях (для систем с распределёнными параметрами) для описания объекта используются дифференциальные уравнения в частных производных. Если управляемый объект является стохастическим, то для его описания используются стохастические дифференциальные уравнения.

Если решение поставленной задачи оптимального управления не является непрерывно зависящим от исходных данных (некорректная задача), то такая задача решается специальными численными методами.

Система оптимального управления, способная накапливать опыт и улучшать на этой основе свою работу, называется обучающейся системой оптимального управления.

Реальное поведение объекта или системы всегда отличается от программного вследствие неточности в начальных условиях, неполной информации о внешних возмущениях, действующих на объект, неточности реализации программного управления и т.д. Поэтому для минимизации отклонения поведения объекта от оптимального обычно используется система автоматического регулирования.

Иногда (например, при управлении сложными объектами, такими как доменная печь в металлургии или при анализе экономической информации) в исходных данных и знаниях об управляемом объекте при постановке задачи оптимального управления содержится неопределённая или нечёткая информация, которая не может быть обработана традиционными количественными методами. В таких случаях можно использовать алгоритмы оптимального управления на основе математической теории нечётких множеств (Нечёткое управление). Используемые понятия и знания преобразуются в нечёткую форму, определяются нечёткие правила вывода принимаемых решений, затем производится обратное преобразование нечётких принятых решений в физические управляющие переменные.

Для проектирования оптимальной САУ необходима полная информация об ОУ, возмущающих и задающих воздействиях, начальном и конечном состояниях ОУ. Далее требуется выбрать критерий оптимальности. В качестве такого критерия можно использовать один из показателей качества системы. Однако требования к отдельным показателям качества, как правило, противоречивы (например, повышение точности системы достигается уменьшением запаса устойчивости). Кроме того, оптимальная система должна иметь минимально возможную ошибку не только при отработке какого-то конкретного управляющего воздействия, но в течение всего времени работы системы. Следует также учитывать, что решение задачи оптимального управления зависит не только от структуры системы, но и от параметров составляющих ее элементов.

Достижение оптимального функционирования САУ во многом определяется тем, как осуществляется управление во времени, какова программа, или алгоритм управления. В связи с этим для оценки оптимальности систем используют интегральные критерии, вычисляемые как сумма значений интересующего проектировщиков параметра качества системы за все время процесса управления.

В зависимости от принятого критерия оптимальности рассматривают следующие виды оптимальных систем.

1. Системы , оптимальные по быстродействию , которые обеспечивают минимальное время перевода ОУ из одного состояния в другое. В этом случае критерий оптимальности выглядит следующим образом:

где / н и / к - моменты начала и окончания процесса управления.

В таких системах длительность процесса управления минимальна. Простейший пример - система управления двигателем, обеспечивающая минимальное время разгона его до заданной частоты вращения с учетом всех имеющихся ограничений.

2. Системы , оптимальные по расходу ресурсов , которые гарантируют минимум критерия

где к - коэффициент пропорциональности; U(t) - управляющее воздействие.

Такая система управления двигателем обеспечивает, например, минимальный расход топлива за все время управления.

3. Системы , оптимальные по потерям управления (или по точности), которые обеспечивают минимальные ошибки управления на основании критерия где e(f) - динамическая ошибка.

В принципе задача проектирования оптимальной САУ может быть решена простейшим методом перебора всех возможных вариантов. Конечно, такой метод требует больших затрат времени, но современные ЭВМ позволяют в некоторых случаях им воспользоваться. Для решения задач оптимизации разработаны специальные методы вариационного исчисления (метод максимума, метод динамического программирования и др.), позволяющие учесть все ограничения реальных систем.

В качестве примера рассмотрим, каким должно быть оптимальное по быстродействию управление электродвигателем постоянного тока, если подаваемое на него напряжение ограничено предельной величиной {/ лр, а сам двигатель можно представить в виде апериодического звена 2-го порядка (рис. 13.9, а).

Метод максимума позволяет рассчитать закон изменения и(г), обеспечивающий минимальное время разгона двигателя до частоты вращения (рис. 13.9, б). Процесс управления данным двигателем должен состоять из двух интервалов, в каждом из которых напряжение u(t) принимает свое предельное допустимое значение (в интервале 0 - /,: u(t) = +?/ пр, в интервале /| - / 2: u(t) = -?/ пр)* Для обеспечения такого управления в состав системы должен быть включен релейный элемент.

Как и обычные системы, оптимальные системы бывают разомкнутыми, замкнутыми и комбинированными. Если оптимальное управление, переводящее ОУ из начального состояния в конечное и не зависящее или слабо зависящее от возмущающих воздействий, может быть задано как функция времени U = (/(/), то строится разомкнутая система программного управления (рис. 13.10, а).

В программное устройство ПУ закладывается оптимальная программа П, рассчитанная на достижение экстремума принятого критерия оптимальности. По такой схеме осуществляется управ-


Рис. 13.9.

а - с обшим управляющим устройством; б - с двухуровневым управляющим

устройством

Рис. 13.10. Схемы оптимальных систем: а - разомкнутой; б - комбинированной

ление станками с числовым программным управлением и простейшими роботами, производится вывод ракет на орбиту и т.д.

Наиболее совершенными, хотя и наиболее сложными, являются комбинированные оптимальные системы (рис. 13.10, б). В таких системах разомкнутый контур осуществляет оптимальное управление по заданной программе, а замкнутый контур, оптимизированный по минимуму ошибки, отрабатывает отклонение выходных параметров. Используя канат измерения возмущений /*, система становится инвариантной относительно всего множества задающих и возмущающих воздействий.

Для того чтобы реализовать столь совершенную систему управления, необходимо точно и быстро измерять все возмущаюшие воздействия. Однако такая возможность имеется далеко не всегда. Гораздо чаще о возмущающих воздействиях известны только усредненные статистические данные. Во многих случаях, особенно в системах телеуправления, даже задающее воздействие поступает в систему вместе с помехами. А так как помеха представляет собой в общем случае случайный процесс, то удается синтезировать только статистически оптимальную систему. Такая система не будет оптимальной для каждой конкретной реализации процесса управления, но она будет в среднем наилучшей для всего множества его реализаций.

Для статистически оптимальных систем в качестве критериев оптимальности используют усредненные вероятностные оценки. Например, для следящей системы, оптимизированной по минимуму ошибки, в качестве статистического критерия оптимальности используют математическое ожидание квадрата отклонения выходного воздействия от заданного значения, т.е. дисперсию:

Используются и другие вероятностные критерии. Например, в системе обнаружения целей, где важно только наличие или отсутствие цели, в качестве критерия оптимальности применяют вероятность ошибочного решения Р ош:

где Р п ц - вероятность пропуска цели; Р ЛО - вероятность ложного обнаружения.

Во многих случаях рассчитанные оптимальные САУ оказываются практически не реализуемыми ввиду их сложности. Как правило, требуется получение точных значений производных высоких порядков от входных воздействий, что технически очень трудно осуществимо. Зачастую даже теоретический точный синтез оптимальной системы оказывается невозможен. Однако методы оптимального проектирования позволяют строить квазиоптимальные системы, хотя и упрощенные в той или иной степени, но все- гаки позволяющие достичь значений принятых критериев оптимальности, близких к экстремальным.

Оптимальное управление

Андрей Александрович Аграчёв

Человеку свойственно стремление к совершенству. В математике оно проявляется в поиске наилучших (оптимальных) решений, включая все задачи на максимум и минимум. К теории оптимального управления относятся те из них, где решение имеет некоторую протяженность во времени или в пространстве. Подходящий образ — прокладывание наилучшего пути при движении по сильно пересечённой местности.

Вообще, математики, как и все люди, очень любят зрительные образы, но в действительности речь идёт о любой системе, которую можно непрерывно менять в определённых пределах, как мы меняем направление движения при прокладывании пути. Другие подходящие примеры: управление автомобилем, летательным аппаратом, технологическим процессом, своим телом, в конце концов.

Требуется наилучшим образом перевести систему из заданного состояния в желаемое: как можно быстрее, или наиболее экономным образом, или с наибольшей выгодой, или в соответствии с каким‐то более сложным критерием; мы сами решаем, что важнее. Если мгновенная реакция системы на наши действия хорошо известна, то теория оптимального управления призвана помочь нам найти наилучшую долговременную стратегию. Вот простой пример: нужно как можно быстрее остановить колебания (скажем, остановить «качели»), прикладывая свою невеликую силу то с одной стороны, то с другой. Переходить с одной стороны на другую придётся многократно. По какому правилу это делать? Понятно, что «качели» могут быть и финансовыми, и экономическими, и физико‐техническими…

Стоит заметить, что такой очевидно прикладной предмет, как теория оптимального управления, был создан в Математическом институте имени Стеклова чистыми математиками, Львом Семёновичем Понтрягиным и его учениками, профессиональными топологами. Первые впечатляющие применения этой теории, принесшие ей славу, относятся к советской космической программе и американской программе «Аполлон». В этих программах всё делалось на пределе возможностей, и без умной оптимизации было не справиться. Среди популярных тогда задач можно отметить наиболее экономный перевод космического аппарата с одной эллиптической орбиты на другую и мягкое прилунение. Главное достижение того периода — принцип максимума Понтрягина — мощное универсальное средство, позволяющее отобрать достаточно узкий класс управляющих стратегий, среди которых только и может быть оптимальная.

Принцип максимума Понтрягина особенно хорош в применении к простым «линейным» моделям, но теряет свою эффективность и должен быть дополнен другими средствами при исследовании систем с более сложной нелинейной структурой. Вернёмся к примеру с качелями. Если амплитуда колебаний небольшая, то система почти линейна и период колебаний почти не зависит от амплитуды. Принцип максимума даёт простой и однозначный закон оптимального поведения для линейного приближения: надо переходить с одной стороны на другую ровно через полпериода и всякий раз применять максимально возможную силу. В то же время при большой амплитуде, когда система существенно нелинейна, рекомендации принципа максимума сильно усложняются и перестают быть однозначными.

Новые правила оптимального поведения, дополняющие принцип максимума, даёт активно развиваемая в настоящее время геометрическая теория управления. Дело в том, что современная геометрия позволяет очень сильно расширять возможности управления, играя порядком и длительностью применения нескольких простых манёвров, отбирая оптимальные «гармоничные» сочетания манёвров, результат каждого из которых хорошо известен и вполне банален. Похоже на то, как из нескольких нот составляется симфония, только в математике всё точнее, строже и симметричней, хотя и не столь эмоционально.

Геометрическая теория управления применяется в космической навигации, робототехнике и многих других областях, но наиболее популярные современные приложения относятся, пожалуй, к квантовым системам (от медицинских аппаратов ядерного магнитного резонанса до химических манипуляций с отдельными молекулами). Обаяние геометрической теории управления состоит, среди прочего, в редкой возможности материализовать, увидеть и «пощупать» красивые и глубокие абстрактные математические концепции, ну и, конечно, создавать новые!

Литература

Тихомиров В. М. Рассказы о максимумах и минимумах. — М.: Наука, 1986. — (Библиотечка «Квант»; Вып. 56). — [Переиздания: М.: МЦНМО, 2006, 2017].

Протасов В. Ю. Максимумы и минимумы в геометрии. — М.: МЦНМО, 2012. — (Библиотека «Математическое просвещение»; Вып. 31).

АННОТАЦИЯ

Настоящее пособие знакомит с основными условиями оптимальности и методами решения задач вариационного исчисления и оптимального управления. Будет полезно для подготовки и проведения практических занятий по разделу "Оптимальное управление", а также при выполнении домашних заданий по этой теме студентами.

Учебное пособие является электронной версией книги:
Оптимальное управление в примерах и задачах. Сотсков А.И., Колесник Г.В. - М.: Российская экономическая школа, 2002 - 58 с.

Предисловие

1. Простейшая задача вариационного исчисления.
Уравнение Эйлера
Примеры
Упражнения

2. Задача оптимального управления. Принцип максимума
Примеры
Упражнения

3. Фазовые ограничения в задаче оптимального управления
Примеры
Упражнения

4. Динамическое программирование и уравнение Беллмана
Примеры
Упражнения

Литература

Предисловие

Теория оптимального управления является одним из разделов курса "Математика для экономистов", читаемого в Российской экономической школе.
Опыт преподавания показывает, что данный раздел - один из наиболее сложных для освоения. Это прежде всего связано с концептуальными отличиями изучаемых в нем задач оптимального управления от задач конечномерной оптимизации, и, как следствие, с существенным усложнением используемых в них условий оптимальности.
В связи с этим представляется полезным дать наглядную иллюстрацию применения данных условий оптимальности к решению задач различных типов. Настоящее пособие и является попыткой дать такую иллюстрацию. В нем содержатся примеры и задачи по четырем темам:
. вариационному исчислению;
. принципу максимума в задачах без ограничений;
. принципу максимума при наличии фазовых ограничений;
. динамическому программированию.
Каждый раздел состоит из теоретической части, описывающей базовые понятия и результаты, используемые при решении соответствующих задач, примеров с решениями, а также задач для самостоятельной работы студентов.
Следует подчеркнуть, что данное пособие ни в коем случае не является теоретическим курсом, а ориентировано прежде всего на практическое применение методов оптимального управления. В качестве теоретического пособия по данному разделу можно порекомендовать, например, книгу.
По мнению авторов, данное пособие будет полезным преподавателям при подготовке и проведении практических занятий по разделу "Оптимальное управление", а также студентам при выполнении домашних заданий по этой теме.

Электронная версия книги : [Скачать, PDF, 633.8 КБ ].

Для просмотра книги в формате PDF требуется программа Adobe Acrobat Reader, новую версию которой можно бесплатно скачать с сайта компании Adobe.