弾性歪み

From Wikipedia, the free encyclopedia

弾性歪み(だんせいひずみ、: elastic distortion)や弾性変形(だんせいへんけい、: elastic transformation[1])とは、機械学習画像に対するデータ拡張の手法。2003年マイクロソフトの研究者等がMNIST手書き数字データセットに対する手法として発表した。[2]

この手法は「手書き文字は多少線の位置が変わっても線のつながり方が変わらなければ文字の種類が変わらない」という事前知識をモデルの学習に導入する。

二次元グレースケール画像に対する弾性歪みの計算手法は以下の通り。畳み込みの演算子。

  1. 連続一様分布からランダムノイズを生成する:
  2. ガウスぼかしを適用してα倍する:
  3. 補間して新画像を作成する:

論文のMNISTデータセットに対する推奨値はα=34, σ=4である[2]。この数字は何ピクセル平行移動させるかという数字であり、MNISTの画像サイズの28x28ピクセルに依存していることに注意。

アフィン変換との比較

実装例

参照

Related Articles

Wikiwand AI