Введение
Во многих областях науки и в практической деятельности часто приходится сталкиваться с задачами поиска экстремума функции. Дело в том, что многие технические, экономические и т.д. процессы моделируются функцией или несколькими функциями, зависящими от переменных – факторов, влияющих на состояние моделируемого явления. Требуется найти экстремумы таких функций для того, чтобы определить оптимальное (рациональное) состояние, управление процессом. Так в экономике, часто решаются задачи минимизации издержек или максимизации прибыли – микроэкономическая задача фирмы. В этой работе мы не рассматриваем вопросы моделирования, а рассматриваем только алгоритмы поиска экстремумов функций в простейшем варианте, когда на переменные не накладываются ограничения (безусловная оптимизация), и экстремум ищется только для одной целевой функции.
ЭКСТРЕМУМЫ ФУНКЦИИ
Рассмотрим график непрерывной функции y=f(x), изображенной на рисунке. Значение функции в точке x1 будет больше значений функции во всех соседних точках как слева, так и справа от x1. В этом случае говорят, что функция имеет в точке x1 максимум. В точке x3 функция, очевидно, также имеет максимум. Если рассмотреть точку x2, то в ней значение функции меньше всех соседних значений. В этом случае говорят, что функция имеет в точке x2 минимум. Аналогично для точки x4.
Функция y=f(x) в точке x0 имеет максимум, если значение функции в этой точке больше, чем ее значения во всех точках некоторого интервала, содержащего точку x0, т.е. если существует такая окрестность точки x0, что для всех x≠x0, принадлежащих этой окрестности, имеет место неравенство f(x)<f(x0).
Функция y=f(x) имеет минимум в точке x0, если существует такая окрестность точки x0, что для всех x≠x0, принадлежащих этой окрестности, имеет место неравенство f(x)>f(x0.
Точки, в которых функция достигает максимума и минимума, называются точками экстремума, а значения функции в этих точках экстремумами функции.
Обратим внимание на то, что функция, определенная на отрезке, может достигать максимума и минимума только в точках, заключенных внутри рассматриваемого отрезка.
Отмети, что если функция имеет в точке максимум, то это не означает, что в этой точке функция имеет наибольшее значение во всей области определения. На рисунке, рассмотренном выше, функция в точке x1 имеет максимум, хотя есть точки, в которых значения функции больше, чем в точке x1. В частности, f(x1) < f(x4) т.е. минимум функции больше максимума. Из определения максимума следует только, что это самое большое значение функции в точках, достаточно близких к точке максимума.
Теорема 1. (Необходимое условие существования экстремума.) Если дифференцируемая функция y=f(x) имеет в точке x= x0 экстремум, то ее производная в этой точке обращается в нуль.
Доказательство. Пусть для определенности в точке x0 функция имеет максимум. Тогда при достаточно малых приращениях Δx имеем f(x0+ Δx)<f(x0), т.е.
Но тогдаПереходя в этих неравенствах к пределу при Δx→ 0 и учитывая, что производная f '(x0) существует, а следовательно предел, стоящий слева, не зависит от того как Δx → 0, получаем: при Δx → 0 – 0 f'(x0) ≥ 0 а при Δx → 0 + 0 f'(x0) ≤ 0. Так как f '(x0) определяет число, то эти два неравенства совместны только в том случае, когда f '(x0) = 0.
Доказанная теорема утверждает, что точки максимума и минимума могут находиться только среди тех значений аргумента, при которых производная обращается в нуль.
Мы рассмотрели случай, когда функция во всех точках некоторого отрезка имеет производную. Как же обстоит дело в тех случаях, когда производная не существует? Рассмотрим примеры.
Примеры.
y=|x|.
Функция не имеет производной в точке x=0 (в этой точке график функции не имеет определенной касательной), но в этой точке функция имеет минимум, так как y(0)=0, а при всех x≠ 0y > 0.
Функция
не имеет производной при x=0, так как обращается в бесконечность приx=0. Но в этой точке функция имеет максимум.Функция
не имеет производной при x=0, так как при x→0. В этой точке функция не имеет ни максимума, ни минимума. Действительно, f(x)=0 и при x<0f(x)<0, а при x>0f(x)>0.Таким образом, из приведенных примеров и сформулированной теоремы видно, что функция может иметь экстремум лишь в двух случаях: 1) в точках, где производная существует и равна нулю; 2) в точке, где производная не существует.
Однако, если в некоторой точке x0 мы знаем, что f '(x0)=0, то отсюда нельзя делать вывод, что в точке x0 функция имеет экстремум.
Например.
.Но точка x=0 не является точкой экстремума, поскольку слева от этой точки значения функции расположены ниже оси Ox, а справа выше.
Значения аргумента из области определения функции, при которых производная функции обращается в нуль или не существует, называются критическими точками.
Из всего вышесказанного следует, что точки экстремума функции находятся среди критических точек, и, однако, не всякая критическая точка является точкой экстремума. Поэтому, чтобы найти экстремум функции, нужно найти все критические точки функции, а затем каждую из этих точек исследовать отдельно на максимум и минимум. Для этого служит следующая теорема.
Теорема 2. (Достаточное условие существования экстремума.) Пусть функция непрерывна на некотором интервале, содержащем критическую точку x0, и дифференцируема во всех точках этого интервала (кроме, быть может, самой точки x0). Если при переходе слева направо через эту точку производная меняет знак с плюса на минус, то в точке x = x0 функция имеет максимум. Если же при переходе через x0 слева направо производная меняет знак с минуса на плюс, то функция имеет в этой точке минимум.
Таким образом, если
f '(x)>0 при x<x0 и f '(x)<0 при x> x0, то x0 – точка максимума;
при x<x0 и f '(x)>0 при x> x0, то x0 – точка минимума.Доказательство. Предположим сначала, что при переходе через x0 производная меняет знак с плюса на минус, т.е. при всех x, близких к точке x0f '(x)>0 для x< x0, f '(x)<0 для x> x0. Применим теорему Лагранжа к разности f(x) - f(x0) = f '(c)(x- x0), где c лежит между x и x0.
Пусть x < x0. Тогда c< x0 и f '(c)>0. Поэтомуf '(c)(x- x0)<0и, следовательно,
f(x) - f(x0)<0,т.е. f(x)< f(x0).
Пусть x > x0. Тогда c> x0 и f '(c)<0. Значитf '(c)(x- x0)<0. Поэтому f(x) - f(x0)<0,т.е.f(x) < f(x0).
Таким образом, для всех значений x достаточно близких к x0f(x) < f(x0). А это значит, что в точке x0 функция имеет максимум.
Аналогично доказывается вторая часть теоремы о минимуме.
Проиллюстрируем смысл этой теоремы на рисунке. Пусть f '(x1)=0 и для любых x, достаточно близких к x1, выполняются неравенства
f '(x)<0 при x< x1, f '(x)>0 при x> x1.
Тогда слева от точки x1 функция возрастает, а справа убывает, следовательно, при x = x1 функция переходит от возрастания к убыванию, то есть имеет максимум.
Аналогично можно рассматривать точки x2 и x3.
Схематически все вышесказанное можно изобразить на картинке:
Правило исследования функции y=f(x) на экстремум
Найти область определения функции f(x).
Найти первую производную функции f '(x).
Определить критические точки, для этого:
найти действительные корни уравнения f '(x)=0;
найти все значения x при которых производная f '(x) не существует.
Определить знак производной слева и справа от критической точки. Так как знак производной остается постоянным между двумя критическими точками, то достаточно определить знак производной в какой-либо одной точке слева и в одной точке справа от критической точки.
Вычислить значение функции в точках экстремума.