математическая дисциплина, посвященная отысканию экстремальных (наибольших и наименьших) значений функционалов — переменных величин, зависящих от выбора одной или нескольких функций. В. и. является естественным развитием той главы математического анализа, которая посвящена задаче отыскания Экстремумов функций. Возникновение и развитие В. и. тесно связано с задачами механики, физики и т.д.
Одной из первых задач В. и. была знаменитая задача о брахистохроне (См. Брахистохрона) (И. Бернулли, 1696): определить форму кривой, лежащей в вертикальной плоскости, по которой тяжёлая материальная точка, двигаясь под действием только одной силы тяжести и не имеющая начальной скорости, перейдёт из верхнего положения А в нижнее положение В за минимум времени. Эта задача сводится к отысканию функции у (х), доставляющей минимум функционалу
где а и b — абсциссы точек А и В.
Другой такой же «исторической» задачей является задача об отыскании пути, вдоль которого распространяется свет, идущий от источника света (точка А) к некоторой точке В, в среде с переменной оптической плотностью (то есть в среде, где скорость распространения v есть функция координат). Для решения этой задачи может быть использован, так называемый, Ферма принцип, согласно которому из всех кривых, соединяющих точки А и В, луч света распространяется вдоль той, по которой свет приходит из A в B за кратчайшее время. В простейшем случае, когда свет распространяется в плоскости, задача сводится к отысканию кривой y (x), доставляющей минимум функционалу
Из разрозненных задач подобного рода постепенно в 18 в. начало формироваться В. и. Но и после оформления В. и. в самостоятельную дисциплину она продолжала оставаться связанной с различными проблемами механики и физики. На протяжении 2-й половины 18 в. и всего 19 в. делались интенсивные попытки построить здание механики, опираясь на некоторые общие вариационные принципы (см. Вариационные принципы механики). Со 2-й половины 19 в. начинают разрабатываться различные вариационные принципы в механике сплошных сред, затем позднее в квантовой механике, электродинамике и т.д. Возникают вариационные принципы и в средах с диссипацией энергии. Исследования во всех подобных областях продолжают служить базой формирования новых задач В. и. и областью приложения её методов. Однако со временем появились и новые классы задач, далеко раздвинувших традиционные границы дисциплины и превративших В. и. в одну из наиболее обширных ветвей современной математики, включающей в себя, с одной стороны, самые абстрактные вопросы, относящиеся в равной степени к топологии и функциональному анализу, а с другой — разнообразные вычислительные методы решения технических или экономических задач.
Прямые методы. В. и. как самостоятельная научная дисциплина сформировалась в 18 в., главным образом благодаря работам Л. Эйлера.
Простейшей задачей В. и. называют задачу отыскания функции x (t), доставляющей экстремум функционалу
где F — непрерывная и дифференцируемая функция своих аргументов. При этом функция x (t) должна удовлетворять следующим условиям:
а) она должна быть кусочно дифференцируемой,
б) при t = to и t = T она должна принимать значения
х (to) = х0, х (Т) = хт. (2)
Обе задачи, рассмотренные в начале статьи, являются частными случаями простейшей задачи В. и.
Первые вариационные задачи были задачами механики. Они были поставлены в 18 в. и, следуя традициям того времени, первый вопрос, на который надо было ответить, был вопрос о способе фактического отыскания функции x (t), реализующей минимум функционала (1).
Эйлер создал численный метод решения задач В. и., который получил название Эйлера метода ломаных (См. Эйлера метод ломаных). Этот метод был первым среди большого класса, так называемых, прямых методов (См. Прямые методы); все они основаны на редукции задачи отыскания экстремума функционала к задаче отыскания экстремума функции многих переменных. Поскольку для получения решения с высокой точностью задачу приходится сводить к отысканию экстремума функции с большим числом переменных, она становится весьма сложной для ручного счёта. Поэтому долгое время прямые методы были вне основного русла, по которому направлялись усилия математиков, занимавшихся В. и.
В 20 в. интерес к прямым методам значительно усилился. Прежде всего были предложены новые способы редукции к задаче об экстремуме функции конечного числа переменных. Поясним эти идеи на простом примере. Рассмотрим снова задачу отыскания минимума функционала (1) при дополнит. условии
x (to) = x (T) = 0 (3)
и будем разыскивать решение задачи в форме
где φn (t) — некоторая система функций, удовлетворяющих условиям типа (3). Тогда функционал J (x) становится функцией коэффициентов ai:
J = J (ai,..., aN),
и задача сводится к отысканию минимума этой функции N переменных. При известных условиях, наложенных на систему функций {φn}, решение этой задачи стремится при N → ∞ к решению задачи (1) (см. Ритца и Галёркина методы).
Другая причина усиления интереса к прямым методам — это систематическое изучение конечноразностных методов в задачах математической физики, начавшееся с 20-х гг. 20 в. Применение ЭВМ превращает постепенно прямые методы в основной инструмент решения вариационных задач.
Метод вариаций. Второе направление исследований — это изучение необходимых и достаточных условий, которым должна удовлетворять функция x (t), реализующая экстремум функционала J (x). Его возникновение также связано с именем Эйлера. Предположим, что тем или иным способом построена функция x (t). Как проверить, является ли эта функция решением задачи? Первый вариант ответа на этот вопрос был дан Эйлером в 1744. В приведённой ниже формулировке этого ответа употребляется введённое в 60-х гг. 18 в. Ж. Лагранжем понятие вариации (отсюда название — В. и.), являющееся обобщением понятия дифференциала на случай функционалов.
Пусть x (t) — функция, удовлетворяющая условию (2), a h (t) — произвольная гладкая функция, удовлетворяющая условию h (to) = h (T) = 0. Тогда величина
J (x + εh) = J*(ε),
где ε — произвольное действительное число будет функцией ε. Вариацией δJ функционала J называют производную
(dJ*/dε)ε = 0.
Для простейшей задачи В. и.
Разлагая полученное выражение в ряд по степеням ε, получим
где о (ε) — члены более высокого порядка. Так как h (to) = h (T) = 0, то, проведя интегрирование по частям во втором интеграле, найдём
Пусть теперь x (t) реализует экстремум. Тогда функция J*(ε) имеет экстремум при ε = 0. Поэтому величина δJ должна обратиться в нуль. Отсюда следует: для того чтобы функция x (t) доставляла экстремум функционалу (1), необходимо, чтобы она удовлетворяла уравнению
называемому уравнением Эйлера.
Это — дифференциальное уравнение 2-го порядка относительно функции x (t). Необходимое условие δJ = 0 может быть применено в ряде случаев для эффективного отыскания решения вариационной задачи, поскольку функция x (t) необходимо должна быть решением краевой задачи x (to) = xo, x (T) = xT для уравнения (4). Если найдено это решение и оно единственно, то найдено тем самым и решение исходной вариационной задачи. Если краевая задача допускает несколько решений, то достаточно вычислить значение функционала для каждого из решений краевой задачи и выбрать из них то, которому отвечает наименьшее значение J (x). Однако указанный путь обладает одним существенным недостатком: не существует универсальных способов решения краевых задач для обыкновенных (нелинейных) дифференциальных уравнений.
Уже во 2-й половине 18 в. круг задач, изучаемых В. и., значительно расширился. Прежде всего основные результаты, относящиеся к простейшей задаче В. и., были перенесены на общий случай интегральных функционалов вида
где x (t) — вектор-функция произвольной размерности, и на функционалы ещё более общего вида.
Условный экстремум. Задача Лагранжа. В конце 18 в. был сформулирован ряд задач на условный экстремум. Этим термином принято называть задачи отыскания функции x (t), доставляющей экстремум функционалу J (x) при каких-либо дополнительных условиях, кроме условий на концах интервала (t0, T). Простейшей задачей подобного вида является класс так называемых изопериметрических задач (См. Изопериметрические задачи). Своим названием этот класс задач обязан следующей: среди всех замкнутых кривых данной длины найти ту, которая ограничивает максимальную площадь.
Значительно более сложной задачей является та, в которой ограничения носят характер дифференциальных уравнений. Эту задачу называют задачей Лагранжа; особое значение она приобрела в середине 20 в. в связи с созданием теории оптимального управления (См. Оптимальное управление). Поэтому её формулировка даётся ниже на языке этой теории, возникшем после работ Л. С. Понтрягина и его учеников.
Пусть x (t) и u (t) — вектор-функции размерностей n и m соответственно, причём функция x (t), которую называют фазовым вектором, при t = to и t = T удовлетворяет граничным условиям:
x (t0) ∈ ε0, x (T) ∈ εT (5)
где ε0 и εT — некоторые множества. Простейшим примером условий типа (5) являются условия (2). Функция x (t) и функция u (t), которую называют управлением, связаны условием
dx/dt = f (x, u, t), (6)
где f — дифференцируемая вектор-функция своих аргументов. Рассматриваемая задача состоит в следующем: определить функции x (t) и u (t), доставляющие экстремум функционалу
Заметим, что и простейшая задача В. и. и изопериметрическая задача являются частным случаем задачи Лагранжа.
Задача Лагранжа имеет огромное прикладное значение. Пусть, например, уравнение (6) описывает движение какого-либо динамического объекта, например космического корабля. Управление u — это вектор тяги его двигателя. Множества ε0 и εT — это две орбиты разных радиусов. Функционал (7) описывает расход горючего на выполнение маневра. Следовательно, задачу Лагранжа, применительно к данной ситуации, можно сформулировать следующим образом: определить закон изменения тяги двигателя космического аппарата, совершающего переход с орбиты ε0 на орбиту εT за заданное время так, чтобы расход топлива на этот маневр был минимальным.
Важную роль в теории подобных задач играет функция Гамильтона H (x, ψ, u) = (f, ψ) - F.
Здесь ψ — вектор, называется множителем Лагранжа (или импульсом), (f, ψ) означает скалярное произведение векторов f и ψ. Необходимое условие в задаче Лагранжа формулируется следующим образом: для того чтобы функции x̃(t) и ũ(t) была стационарной точкой функции Гамильтона Н (х, ψ, u), то есть, чтобы при
было ∂H/∂u = 0, где ψ — не равное тождественно нулю решение уравнения
∂ψ/t = —∂H/∂x = φ(x, ψ, u, t). (8)
Эта теорема имеет важное прикладное значение, так как она открывает известные возможности для фактического нахождения векторов x (t) и u (t).
Развитие В. и. в 19 в. Основные усилия математиков в 19 в. были направлены на исследование условий, необходимых или достаточных для того, чтобы функция x (t) реализовала экстремум функционала J (x). уравнение Эйлера было первым из таких условий; оно аналогично необходимому условию
которое устанавливается в теории функций конечного числа переменных. Однако в этой теории известны ещё и другие условия. Например, для того, чтобы функция f (x) имела в точке
каков бы ни был произвольный вектор h. Естественно поставить вопрос: в какой степени эти результаты переносятся на случай функционалов? Для того чтобы представить себе сложность, которая здесь возникает, заметим, что функция x̃(t) может реализовать минимум среди функций одного класса и не давать минимум среди функций другого класса и т.д.
Подобные вопросы послужили источником разнообразных и глубоких исследований А. Лежандра, К. Якоби, М. В. Остроградского (См. Остроградский), У. Гамильтона, К. Вейерштрасса и многих других. Эти исследования не только обогатили математический анализ, но и сыграли большую роль в формировании идей аналитической механики и оказали серьезное влияние на развитие разнообразных отделов теоретической физики.
Развитие В. и. в 20 в. В 20 в. возник целый ряд новых направлений В. и., связанных с интенсивным развитием техники, смежных вопросов математики и вычислительной техники. Одно из основных направлений развития В. и. в 20 в. — рассмотрение неклассических задач В. и., приведшее к открытию принципа максимума Л. С. Понтрягина.
Рассмотрим снова задачу Лагранжа: определить минимум функционала
при условии
фазовый вектор x (t) должен удовлетворять ещё некоторым граничным условиям.
В своей классической постановке условия задачи Лагранжа не предусматривают никаких ограничений на управление u (t). Выше (см. раздел Условный экстремум. Задача Лагранжа) подчёркивалась тесная связь между задачей Лагранжа и задачей управления. В рассмотренном там примере u (t) — тяга ракетного двигателя. Эта величина подчинена ограничениям: тяга двигателя не может превосходить некоторой величины, и угол поворота вектора тяги также ограничен. В данном конкретном примере компонента ui (i = 1,2,3) вектора тяги двигателя подчинена ограничениям
где а-i и a+i — некоторые заданные числа. Подобных примеров можно привести много.
Таким образом, в технике появилось много задач, которые сводятся к задаче Лагранжа, но при дополнительных ограничениях типа (10), записываемых в форме u ∈ Gu, где Gu — некоторое множество, которое, в частности, может быть замкнутым. Такие задачи получили название задач оптимального управления. В задаче Лагранжа можно исключить управление u (t) при помощи уравнения (8) и получить систему уравнений, которая содержит только фазовую переменную х и множитель Лагранжа φ. Для теории оптимального управления должен был быть разработан специальный аппарат. Эти исследования привели к открытию принципа максимума Л. С. Понтрягина. Он может быть сформулирован в форме следующей теоремы: для того чтобы функции x̃(t) и ũ(t) были решением задачи оптимального управления чтобы они доставляли минимум функционалу (9)], необходимо, чтобы u (t) доставляла максимум функции Гамильтона
где ψ — множитель Лагранжа (импульс), который является ненулевым решением векторного уравнения
Принцип максимума позволяет свести задачу оптимального управления к краевой задаче для системы обыкновенных дифференциальных уравнений порядка 2n (n — размерность фазового вектора). Принцип максимума и в этом случае даёт более сильный результат, чем теорема Лагранжа, поскольку он требует, чтобы Н, а доставляло максимум Н.
Возможен и другой подход к тем же проблемам теории оптимального управления. Пусть s (х, t) — значение функционала (9) вдоль оптимального решения. Тогда для того чтобы функция ũ(t) была оптимальным управлением, необходимо (а в некоторых случаях и достаточно), чтобы функция s (х, t) удовлетворяла следующему дифференциальному уравнению с частными производными:
называемому уравнением Беллмана (см. Динамическое программирование).
Круг вопросов, которыми занимается В. и., непрерывно расширяется. В частности, всё большее и большее внимание уделяется изучению функционалов J (x) весьма общего вида, задаваемых на множествах Gx элементов из нормированных пространств. Для задач такого рода уже трудно использовать метод вариаций. Возникли новые методы, основанные на использовании понятия конуса в банаховых пространствах, опорных функционалов и т.д.
Уже в 19 в. была обнаружена глубокая связь между некоторыми проблемами теории уравнений с частными производными и вариационными задачами. П. Дирихле показал, что решение краевых задач для уравнения Лапласа эквивалентно решению некоторой вариационной задачи. Эта проблема привлекает к себе всё больше и больше внимания. Рассмотрим один пример.
Предположим, что имеется некоторое линейное операторное уравнение
Ax = f, (11)
где х (ξ, η) — некоторая функция двух независимых переменных, обращающаяся в нуль на замкнутой кривой Г. При предположениях, естественных для некоторого класса задач физики, задача отыскания решения уравнения (11) эквивалентна отысканию минимума функционала
где Ω — область, ограниченная кривой Г.
уравнение (11) в этом случае является уравнением Эйлера для функционала (12). Редукция задачи (11) к (12) возможна, например, если А — самосопряжённый и положительно определённый оператор. Оператор Лапласа
удовлетворяет этим требованиям. Связь между проблемами для уравнений с частными производными и вариационными задачами имеет большое практическое значение. Она позволяет, в частности, устанавливать справедливость различных теорем существования и единственности и сыграла важную роль в кристаллизации понятия об обобщённом решении. Эта редукция очень важна также и для вычислит, математики, поскольку она позволяет использовать прямые методы вариационного исчисления.
В перечислении основных разделов современного В. и. нельзя не указать на глобальные задачи В. и., решение которых требует качественных методов. Искомое решение вариационной задачи удовлетворяет некоторому сложному нелинейному уравнению и краевым условиям. Естественно поставить вопрос о том, сколько решений допускает эта задача. Примером такой задачи является вопрос о количестве геодезических, которые можно провести между двумя точками на заданной поверхности. Проблема подобного рода относится уже к компетенции качественной теории дифференциальных уравнений и топологии. Последнее обстоятельство очень характерно. Методы, специфические для смежных дисциплин, топологии, функционального анализа и т.д., всё шире начинают применяться в В. и. В свою очередь, идеи В. и. проникают во всё новые области математики, и грань между В. и. и смежными областями математики теперь провести уже трудно.
Лит.: Лаврентьев М. А., Люстерник Л. А., Курс вариационного исчисления, 2 изд., М. — Л., 1950; Блисе Г. А., Лекции по вариационному исчислению, пер. с англ., М., 1950; Михлин С. Г., Вариационные методы в математической физике, М., 1957; Смирнов В. И., Курс высшей математики, 5 изд., т. 4, М., 1958; Гельфанд И. М., Фомин С. В., Вариационное исчисление, М., 1961; Математическая теория оптимальных процессов, М., 1969.
Н. Н. Моисеев.
Большая советская энциклопедия. — М.: Советская энциклопедия. 1969—1978.