Grundlegendes zu den Wolfe-Bedingungen für eine ungenaue Liniensuche

12

Nach Nocedal & Wrights Buch Numerical Optimization (2006) sind die Wolfe-Bedingungen für eine ungenaue Liniensuche für eine Abstiegsrichtung p :

Ausreichende Abnahme: Curvature Zustand: f ( x + α p ) T p c 2f ( x ) T p für 0 < c 1 < c 2 < 1f(x+αp)f(x)+c1αkf(x)Tp
f(x+αp)Tpc2f(x)Tp
0<c1<c2<1

Ich kann sehen, wie die Bedingung der ausreichenden Abnahme besagt, dass der Funktionswert am neuen Punkt unter der Tangente bei x liegen muss . Aber ich bin nicht sicher, was der Krümmungszustand mir geometrisch sagt. Warum muss auch die Beziehung c 1 < c 2 auferlegt werden? Was leistet dies geometrisch?x+αpxc1<c2

Paul
quelle

Antworten:

12

f(x)p<0ppf=0x+αppf(x+αp)pist immer noch so negativ wie bei x. Vielmehr wollen wir an einer Stelle anhalten, an der der Gradient weniger negativ oder sogar positiv ist.

|f(x+αp)p|c2|f(x)p|

c1<c2.

Wolfgang Bangerth
quelle
So, no matter what smooth function f Ich wähle, Einstellung c2<c1wird entweder die ausreichende Abnahme- oder die Krümmungsbedingung nicht erfüllt?
Paul
1
Nein, anders herum. Wenn du wählstc2<c1 dann gibt es funktionen f(x)wenn eine der beiden Bedingungen nicht erfüllt ist, obwohl Sie eine Abstiegsrichtung haben. In einem solchen Fall würde die Zeilensuche keine Schrittlänge finden.
Wolfgang Bangerth