学習物理学

機械学習およびデータマイニング

問題分類クラスタリング回帰異常検知相関ルール（英語版）強化学習構造化予測（英語版）特徴量設計（英語版）表現学習（英語版）オンライン学習半教師あり学習教師なし学習ランキング学習（英語版）文法獲得（英語版）
教師あり学習（分類 • 回帰）決定木（英語版）アンサンブル（バギング、ブースティング、ランダムフォレスト） k-NN 線形回帰単純ベイズニューラルネットワークロジスティック回帰パーセプトロン関連ベクトルマシン (RVM)（英語版）サポートベクトルマシン (SVM)
クラスタリング BIRCH（英語版）階層的（英語版） k平均法期待値最大化法 (EM) DBSCAN OPTICS（英語版）平均値シフト（英語版）
次元削減因子分析 CCA ICA LDA（英語版） NMF PCA t-SNE
構造化予測（英語版）グラフィカルモデルベイジアンネットワーク CRF HMM
異常検知 k-NN 局所外れ値因子法
ニューラルネットワークオートエンコーダディープラーニング DeepDream 多層パーセプトロン RNN LSTM GRU 制約ボルツマンマシン（英語版） SOM CNN
強化学習 TD学習 Q学習 SARSA
理論偏りと分散のトレードオフ計算論的学習理論（英語版）経験損失最小化（英語版）オッカム学習（英語版） PAC学習統計的学習（英語版） VC理論（英語版）
学会・論文誌等 NIPS（英語版） ICML（英語版） ML（英語版） JMLR（英語版） ArXiv:cs.LG
応用学習物理学
全般統計学および機械学習の評価指標
Category:機械学習 Category:データマイニング
表話編歴

学習物理学（がくしゅうぶつりがく　英: Machine Learning Physics）とは、物理学と機械学習の2分野の垣根を超えて互いの分野の発展を目指して作られた学問である^[1]。

物理学情報ニューラルネットワーク・PINNs

古典物理学の法則は通常、微分方程式で記述される。機械学習では、そのような微分方程式を解く順問題と、解の振る舞いが知られている場合にそれが従う物理法則を探求するという逆問題の両方に対応可能である。これらを機械学習で解決する代表的手法が Physics-Informed Neural Networks（PINNs）^{[注釈 1]} であり、これは偏微分方程式で表される物理法則をニューラルネットワークの損失関数に組み込んで学習する手法である。ニューラルネットワークは万能近似定理により、十分に大きければ任意の関数を近似できるため、物理の場、いわゆる時空の関数を表現できる可能性がある。関数 $f_{\theta }(t,x)$ をネットワークの出力とし、微分方程式

${\partial \over \partial t}f=F(t,x,f)$

を満たすように、誤差関数

$\varepsilon =\int dtdx{\Bigl (}{\partial \over \partial t}f-F(t,x,f){\Bigr )}^{2}$

を最小化することで、物理法則を満たす解を得る。ここで右辺のFはfに作用する微分を含んでおり、例を挙げると典型的にラプラシアンなども含まれる。オイラー・ラグランジュ方程式など高階微分が含まれる場合も、ハミルトン形式により一階微分で扱える。微分方程式を解くには初期条件^{[注釈 2]}が必要であり、例えば $f_{\theta }(t=t_{0},x)=g(x)$ を満たす場合、誤差関数に初期条件項 $\int dx[f_{\theta }(t=t_{0},x)-g(x)^{2}]$ を加える。さらに実験データ $D={\biggl (}(t_{i},x_{i},g_{i}){\biggr )}_{i=1}^{N}$ を解に反映させるには、誤差関数に $\varepsilon _{D}=\sum _{i=1}^{N}[f(t_{i},x_{i})-g_{i}]^{2}$ を加える。この手法の利点は、

(1) 実験データと矛盾しない解を得られること

(2) 微分方程式に不定性があっても適用できることである。^{[注釈 3]}

例えば係数λが未知の場合でも ${\partial \over \partial t}f=F(t,x,f;\lambda )$ として誤差最小化によりλを学習で決定できる。 ^[1]

ニューラルネットワークの局所性

フィードフォワード型のニューラルネットワークでは各層 $x^{(l)}$ が直前の層 $x^{(l-1)}$ で決まり、これは物理学の局所性に対応する。つまり、層を時空方向に見立てると、ある点の測定値は隣接点にのみ影響するという考え方である。

層内の局所性

畳み込みニューラルネットワークは空間局所性を持っているニューラルネットワークである。

層内のユニットに空間的な意味を持たせるなら、全結合ニューラルネットワークよりも局所性を持つ畳み込みニューラルネットワークを用いるべきである。右図の縦方向を座標 $x$ の空間を離散化したものとし、離散点を $x=x_{k}=k\Delta x(k=\ldots ,-1,0,1,2\cdots )$ とする。このとき入力は場 $\phi (x)$ の各点での値となり、層内のk番目のユニットの入力は $\phi (x_{k})$ となる。時間方向も離散化すると発展方程式は $\phi (t_{n+1},x_{k})=\phi (t_{n},x_{k})+(\Delta t)f(\phi (t_{n},x_{k}))$ のように表せる。ここで、 $f$ は空間微分を含む演算子であり、 $f\sim w\phi (t,x)+w_{i}^{'}{\partial \over \partial x_{i}}\phi (t,x)+w_{ij}^{''}{\partial \over \partial x_{i}}{\partial \over \partial x_{j}}\phi (t,x)+\cdots$ と書ける（「 $\sim$ 」は連続極限での表現を意味する）。離散化された形では、 $f\phi (t_{n},x_{k})=w\phi (t_{n},x_{k})+w^{'}{\Bigl (}\phi (t_{n},x_{k+1})-\phi (t_{n},x_{k}){\Bigr )}(\Delta x)+w^{''}{\Bigl (}\phi (t_{n},x_{k+1})-2\phi (t_{n},x_{k})+\phi (t_{n},x_{k-1}){\Bigr )}(\Delta x)^{2}+\cdots$ となる。つまり、微分の階数が上がるほど、より遠くのユニットとの結合が必要になる。物理学における局所性は微分の階数を有限に保つことで成立しており、これはニューラルネットワークにおいても同様である。^[1]

量子力学と機械学習

エネルギー期待値が基底状態に近いかどうかはテンソルネットワーク波動関数などで評価できる。テンソルネットワークは量子状態を正規直行基底で展開した係数を小さなテンソル積の縮約で記述した波動関数であり、この係数をニューラルネットワークで表したものがニューラルネットワーク波動関数^{[注釈 4]}である。一部のNN波動関数は電子系のジャストロー相関因子を表現でき、またNN波動関数の一部とテンソルネットワーク波動関数の一部は同等である。^[1]

例：小さな量子系におけるNN波動関数の適用

一次元横磁場イジング模型のハミルトニアンは ${\hat {H}}_{Ising}=-\sum _{i=1}^{L}{\hat {\sigma }}_{i}^{z}{\hat {\sigma }}_{i+1}^{z}-g\sum _{i=1}^{L}{\hat {\sigma }}_{i}^{x}$ である。ここで ${\hat {\sigma }}^{\alpha }(\alpha =x,z)$ はパウリ演算子であり、 ${\hat {\sigma }}^{z}|\uparrow \rangle =|\uparrow \rangle$ , ${\hat {\sigma }}^{z}|\downarrow \rangle =-|\downarrow \rangle$ , ${\hat {\sigma }}^{x}|\uparrow \rangle =-|\downarrow \rangle$ , ${\hat {\sigma }}^{x}|\downarrow \rangle =-|\uparrow \rangle$ と作用する。周期境界条件として ${\hat {\sigma }}_{L+1}^{z}={\hat {\sigma }}_{1}^{z}$ を課す。 $g(>0)$ は横磁場の強さ、 $L$ はサイト数である。熱力学極限で $g$ を変化させると量子相転移が起こり、 $g<1$ で自発的対称性の破れを伴う強磁性相、 $g>1$ で対称性の破れない常磁性相となる。この問題の解はNN波動関数で近似できる。^[1]

トランスフォーマ

学習物理学ではトランスフォーマは場の理論の相互作用の一種であると考えられる。場の理論では高次の相互作用が運動方程式に存在するが、自身の積を取る構造はトランスフォーマの自己注意機構と似ている。^[2]重みをゲージ場、バイアスをヒッグス場と解釈すると、ニューラルODEの対称性が重力場の基本対称性と一致する。なので、ニューラルネットワークは重力と時空構造と等価な幾何学的存在である。^[3]

年表

2016年ー富谷昭夫と田中章詞は、囲碁AIであるアルファ碁の活躍に驚嘆し、機械学習の凄やさや物理学への応用可能性を感じて、研究を始めた。^[1]

2017年ー橋本幸士は、2017年、ある研究会を開いた。その中である講演者が見せたオートエンコーダがAdsブラックホールのペンローズ図のように見えた。そこから、物理学にAIを適用できるかもしれないと考えた。^[4]
2022年ー「『学習物理学』の創成ー機械学習と物理学の融合新領域による基礎物理学の変革」という領域が誕生^[5]
2023年-学習物理学の国際会議が開かれる。^[6]