事前知識

事前知識（じぜんちしき、英: prior knowledge）とは、機械学習や統計学において、モデルの学習の際の、訓練データ外の知識のこと。

パターン認識は、機械学習と密接に関連した、非常に活発な研究分野である。分類または統計的分類としても知られるパターン認識は、入力パターンのクラスを決定できる分類器を構築することを目的とする。基本的には、学習の際は、訓練データ（または訓練セット）を形成する入出力ペア $(x_{i},y_{i})$ の集合のみに基づいて学習する。しかしながら、例えば手書き文字認識のような実世界の応用では、問題に関するある程度の訓練データ外の情報が通常、事前に知られている。この事前知識を訓練に組み込むことが、多くの応用において性能向上を可能にする重要な要素となる。^[1]

事前知識とは、訓練データに加えて利用可能な、問題に関するすべての情報を指す。事前知識なしに有限の訓練データ集合からモデルを決定するという方法は、一意なモデルが存在しない可能性があるという意味で、不良設定問題である。ほとんどの分類器は、ある訓練データに類似したテストデータは同じクラスに割り当てられる傾向があるという、一般的な連続性の仮定を取り入れている。^[2]

機械学習における事前知識の重要性は、探索と最適化におけるその役割によって示唆される。大まかに言えば、ノーフリーランチ定理は、すべての探索アルゴリズムはすべての問題に対して同じ平均性能を持つと述べており、したがって、特定のアプリケーションで性能を向上させるためには、その問題に関する何らかの事前知識を含む特化したアルゴリズムを使用しなければならないことを意味する。

極論として、事前知識を一切使用しなかった場合、類似した入力は類似した出力になるという連続性の事前知識すら使用しなかった場合、機械学習は入力と出力の対応関係を覚えるだけのルックアップテーブルになり、未知のデータに正しく回答する汎化能力はなくなる。つまり、汎化能力のある機械学習は何らかの事前知識を必ず使用していて、帰納バイアスが必須である。

ベイズ統計学の事前確率分布も事前知識の一種である。

パターン認識で遭遇するさまざまな種類の事前知識は、クラス不変性とデータに関する知識という2つの主要なカテゴリに分類される。

クラス不変性

変換不変性

→「データ拡張」も参照

パターン認識における非常に一般的な事前知識の一種は、入力パターンの変換に対するクラス（分類器の出力）の不変性である。この種の知識は変換不変性と呼ばれる。画像認識ではアフィン変換（平行移動、回転、鏡映、拡大縮小、せん断写像）がよく使われる。

$\theta$ でパラメータ化された変換 $T_{\theta }:{\boldsymbol {x}}\mapsto T_{\theta }{\boldsymbol {x}}$ への不変性を、入力パターン ${\boldsymbol {x}}$ に対する出力 $f({\boldsymbol {x}})$ を持つ分類器に組み込むことは、次の等式を課すことに対応する。