Выбор длины шага из условия минимизации функции вдоль заданного направления
Коэффициенты ak в методе (2.3) можно определять из условия
, (2.15)
где для методов спуска, т. е. при hkÎ U(хk, f), минимум берется по a ³ 0. Такой способ выбора ak является в некотором смысле наилучшим, ибо он обеспечивает достижение наименьшего значения функции вдоль заданного направления. Однако он требует решения на каждом шаге одномерной задачи минимизации. Эти задачи решаются, как правило, приближенно с помощью численных методов, что приводит к значительному объему вычислений.
В простейших случаях величины ak, удается найти в явном виде.
Адаптивный способ отыскания коэффициентовak, не требующий дополнительных вычислений характеристик целевой функции
Ранее рассмотрен способ выбора коэффициентов ak, требующий решения вспомогательных одномерных задач. В процессе их решения приходится, как правило, производить дополнительные вычисления характеристик целевой функции f в точках, отличных от x0, х1,..., xk.
Ниже приводятся явные формулы для ak. В них используются лишь значения f'(xk) и некоторые константы, характеризующие глобальные свойства функции f. Эти формулы выбраны с целью обеспечить при соответствующих предположениях о f выполнение неравенства
, (2.17)
где e Î (0, 1), направление hk таково, что áf'(xk), hkñ < 0 и, стало быть, hkÎ U(хk, f). Неравенство (2.17) необходимо для обоснования сходимости многих методов минимизации. Из него, в частности, следует, что f(xk+1) < f(хk), и соответствующий метод минимизации является, таким образом, методом спуска.
Лемма 2.2. Пусть функция f дифференцируема наRn, а ее градиент удовлетворяет условию Липшица
Тогда для произвольных xk ÎRn, eÎ (0, 1) и xk, удовлетворяющего неравенству áf'(xk), hkñ < 0, условие (2.17) выполнено при
. (2.19)
В этом методе точки располагаются близко к середине очередного отрезка [а; b] ,т.е.
(2)
где — малое число.
При этом отношение длин нового и исходного отрезков близко к 1/2, этим и объясняется название метода.
Отметим, что для любых точек величина , поэтому указанный выбор пробных точек объясняется стремлением обеспечить максимально возможное относительное уменьшение отрезка на каждой итерации поиска . В конце вычислений по методу дихотомии в качестве приближенного значения берут середину последнего из найденных отрезков [а; b], убедившись предварительно, что достигнуто неравенство —— .
Опишем алгоритм метода деления отрезка пополам.
Шаг 1. Определить по формулам (2). Вычислить
Ш а г 2. Сравнить , если , то перейти к отрезку , иначе — к отрезку .
Ш а г 3. Найти достигнутую точность . Если , то перейти к следующей итерации, вернувшись к шагу 1. Если , то завершить поиск, перейдя к шагу 4.