ウルフ条件
From Wikipedia, the free encyclopedia
ウルフ条件(ウルフじょうけん、英: Wolfe conditions)とは、無制約最適化問題において非厳密直線探索を行う際に用いられる一連の不等式をいう。特に準ニュートン法を行う際によく用いられる。1969年にフィリップ・ウルフが初めて発表した[1][2]。
ある滑らかな関数 について無制約最適化問題 を解く際、近似的な部分問題 を解くことがしばしばある。ここで xk は現在の反復における最適推定解、 は探索方向、 はステップ長である。
非厳密直線探索は、損失関数を厳密に最小化するのではなく、「十分に」小さくするステップ長 を得る効率的な方法を提供する。これを行う際、ウルフ条件は新たな探索方向 pk を探索する前にある α の推定値が満たすべき条件として用いられる。
アルミホ条件と曲率条件
あるステップ長 αk がウルフ条件を満たすとは、探索方向 pk が与えられたものとして以下の2つの不等式が成り立つことをいう。
ここで、0 < c1 < c2 < 1 である(不等式iiを評価する際、たとえば最急降下法の場合は 、ニュートン法の場合は で H が正定値行列であるため が成り立つことに留意する)。
c1 は十分に小さく、c2 は十分に大きくとることが多い。ノセダルとライトはニュートン法および準ニュートン法については c1 = 10−4, c2 = 0.9、非線形共役勾配法については c2 = 0.1 を例として与えている[3]。不等式iはアルミホ条件[注釈 1][4]と呼ばれ、不等式iiは曲率条件と呼ばれる。不等式iはステップ長 αk が f を「十分に」減少させることを、iiは勾配が十分に減少したことを保証する。条件iおよびiiはステップ長の上限と下限をそれぞれ与えるものとして解釈することができる。
強いウルフ条件
理論的根拠
注意
ウルフ条件はアルミホ条件よりも複雑であり、ウルフ条件にもとづく勾配降下法よりもアルミホ条件に基づいた値のほうがより良い理論的保証がある(Backtracking line searchの"Upper bound for learning rates"節および"Theoretical guarantee"節を参照)。