AODE
From Wikipedia, the free encyclopedia
AODEは、特徴変数の実現値 x1, ... xn を条件とした各クラス y の確率、P(y | x1, ... xn) を求める。これを計算するため、AODEは以下の式を用いる。
ここで、 は確率 の推定値を表し、 は引数の変数値が訓練データに現れる頻度を表し、 m は加算される各項が満たす条件として、各項を代表する変数が訓練データに現れるべき最小頻度を表す。 通常、m としては 1 が指定される。
AODE 分類器の導出
確率 P(y | x1, ... xn) を求める。条件付き確率の定義より、次の式が成り立つ。
ベイズの定理より、任意の について、次の式が成り立つ。
x1, ... xn が y と xi を条件として独立であることを仮定すると、次の式を得る。
この式は、単純ベイズ分類器の条件付き独立の仮定を緩和した、1 つの One Dependence Estimator (ODE) の定義を与えている(ODE は、条件とするxiの個数、すなわち、変数の個数分、存在する)。したがって、それぞれの ODE は、単純ベイズ分類器に比べて、バイアスの小さな推定器となるはずである。しかしながら、分類器を構成する各確率の条件となる変数の個数が、単純ベイズ分類器では 1 つであるのに対して、ODE では 2 つとなるため、推定に利用できる訓練事例数が少なくなりがちである(訓練事例は 2 つの条件を満たさなければならない)。そのため、ODE はバリアンスが大きくなる傾向がある。そこで、AODE は、このような全ての ODE による推定結果を平均することによって、バリアンスを削減している。