データ拡張

From Wikipedia, the free encyclopedia

データ拡張(データかくちょう、: data augmentation)は、量が不十分な訓練データからの最尤推定を可能にする統計的手法[1][2]。データ拡張はベイズ解析において重要な応用があり[3]、また、この手法は、既存のデータをわずかに変更した複数のコピーでモデルを訓練することにより、機械学習モデルの訓練時における過学習を減らし汎化能力を高めるために、機械学習の分野で広く使用されている[4]

例えば、手書き文字の画像認識において「データ拡張として画像に-15~15度の回転をかける」というのは「手書き文字は-15~15度の回転をかけても文字の種類が変わらない」という事前知識をモデルの学習に使用することを意味している。数字の6を180度回転すると9になるが「データ拡張に180度の回転を含めない」というのは「手書き文字は180度の回転をかけると文字の種類が変わる」という事前知識を使用している。

幾何学的変換

参照

Related Articles

Wikiwand AI