特徴抽出

機械学習およびデータマイニング

問題分類クラスタリング回帰異常検知相関ルール（英語版）強化学習構造化予測（英語版）特徴量設計（英語版）表現学習（英語版）オンライン学習半教師あり学習教師なし学習ランキング学習（英語版）文法獲得（英語版）
教師あり学習（分類 • 回帰）決定木（英語版）アンサンブル（バギング、ブースティング、ランダムフォレスト） k-NN 線形回帰単純ベイズニューラルネットワークロジスティック回帰パーセプトロン関連ベクトルマシン (RVM)（英語版）サポートベクトルマシン (SVM)
クラスタリング BIRCH（英語版）階層的（英語版） k平均法期待値最大化法 (EM) DBSCAN OPTICS（英語版）平均値シフト（英語版）
次元削減因子分析 CCA ICA LDA（英語版） NMF PCA t-SNE
構造化予測（英語版）グラフィカルモデルベイジアンネットワーク CRF HMM
異常検知 k-NN 局所外れ値因子法
ニューラルネットワークオートエンコーダディープラーニング DeepDream 多層パーセプトロン RNN LSTM GRU 制約ボルツマンマシン（英語版） SOM CNN
強化学習 TD学習 Q学習 SARSA
理論偏りと分散のトレードオフ計算論的学習理論（英語版）経験損失最小化（英語版）オッカム学習（英語版） PAC学習統計的学習（英語版） VC理論（英語版）
学会・論文誌等 NIPS（英語版） ICML（英語版） ML（英語版） JMLR（英語版） ArXiv:cs.LG
応用学習物理学
全般統計学および機械学習の評価指標
Category:機械学習 Category:データマイニング
表話編歴

特徴抽出（とくちょうちゅうしゅつ、Feature engineering）とは、教師あり学習や統計モデルにおける前処理の一つで、元の学習データから有用な情報を抽出する次元削減の一種である。各入力は元の学習データよりコンパクトな特徴量で構成される。特徴抽出では関連性の高い情報に絞ったデータを入力することで学習モデルの予測精度と意思決定アルゴリズムの性能を大幅に向上し得る。^[1]^[2]^[3]

特徴抽出は機械学習だけでなく物理学を含むさまざまな科学分野で応用されている。例えば、力学では流体力学におけるレイノルズ数、アルキメデス数、伝熱におけるヌセルト数などの無次元量がある。また、構造力学の構造解析でも用いられる。^[4]

特徴抽出の応用としてデータセット内の特徴量やサンプル値のクラスタ解析がある。特に行列の分解に基づく特徴抽出は、特徴量の係数に非負制約を課したデータクラスタ解析に広く利用される。例えば、非負値行列因子分解(NMF)^[5]、非負値行列三因子分解(NMTF)^[6]、非負値テンソル因子分解(NTD)^[7]^[8]などが該当する。上記のアルゴリズムによって抽出された特徴量ベクトルの係数に非負制約を課すことで、部分空間の表現が得られ、異なる因子行列が自然なクラスタ特性を表す。上記の特徴抽出法の拡張利用がいくつかの文献で報告されており、ハードクラスタ解析のための直交制約付非負値行列因子分解や、先程挙げたアルゴリズムに内在する問題を克服するための多様体学習などがある。

他にも、複数の相互関連するデータセット間で隠れた共通構造を活用し、共通のクラスタ解析方式を得る特徴抽出アルゴリズムがある。例とえば、複数のデータセットに渡って共通のクラスタ解析を抽出するMCMD法^[1]がある。MCMD法は、2種類のクラスラベル(スケール変動クラスタ解析とスケール不変クラスタ解析)を出力するものであり以下のような特徴がある。

欠損情報に対して計算的に堅牢である。
形状およびスケールに基づいた外れ値を取得可能である。
高次元データを効果的に処理可能である。

行列およびテンソルの因子分解は、多視点特徴抽出で一般的に利用される。^[9]

予測モデル構築

関連項目

脚注

Related Articles