学習物理学

From Wikipedia, the free encyclopedia

学習物理学(がくしゅうぶつりがく : Machine Learning Physics)とは、物理学機械学習の2分野の垣根を超えて互いの分野の発展を目指して作られた学問である[1]

物理学情報ニューラルネットワーク・PINNs

古典物理学の法則は通常、微分方程式で記述される。機械学習では、そのような微分方程式を解く順問題と、解の振る舞いが知られている場合にそれが従う物理法則を探求するという逆問題の両方に対応可能である。これらを機械学習で解決する代表的手法が Physics-Informed Neural Networks(PINNs)[注釈 1] であり、これは偏微分方程式で表される物理法則をニューラルネットワークの損失関数に組み込んで学習する手法である。ニューラルネットワークは万能近似定理により、十分に大きければ任意の関数を近似できるため、物理の場、いわゆる時空の関数を表現できる可能性がある。関数 をネットワークの出力とし、微分方程式

を満たすように、誤差関数

を最小化することで、物理法則を満たす解を得る。ここで右辺のFはfに作用する微分を含んでおり、例を挙げると典型的にラプラシアンなども含まれる。オイラー・ラグランジュ方程式など高階微分が含まれる場合も、ハミルトン形式により一階微分で扱える。 微分方程式を解くには初期条件[注釈 2]が必要であり、例えばを満たす場合、誤差関数に初期条件項を加える。さらに実験データを解に反映させるには、誤差関数にを加える。この手法の利点は、

(1) 実験データと矛盾しない解を得られること

(2) 微分方程式に不定性があっても適用できることである。[注釈 3]

例えば係数λが未知の場合でもとして誤差最小化によりλを学習で決定できる。 [1]

ニューラルネットワークの局所性

フィードフォワード型のニューラルネットワークでは各層が直前の層で決まり、これは物理学の局所性に対応する。つまり、層を時空方向に見立てると、ある点の測定値は隣接点にのみ影響するという考え方である。

層内の局所性

畳み込みニューラルネットワークは空間局所性を持っているニューラルネットワークである。

層内のユニットに空間的な意味を持たせるなら、全結合ニューラルネットワークよりも局所性を持つ畳み込みニューラルネットワークを用いるべきである。右図の縦方向を座標の空間を離散化したものとし、離散点とする。このとき入力は場の各点での値となり、層内のk番目のユニットの入力はとなる。 時間方向も離散化すると発展方程式のように表せる。ここで、空間微分を含む演算子であり、 と書ける(「」は連続極限での表現を意味する)。離散化された形では、 となる。つまり、微分の階数が上がるほど、より遠くのユニットとの結合が必要になる。物理学における局所性は微分の階数を有限に保つことで成立しており、これはニューラルネットワークにおいても同様である。[1]

量子力学と機械学習

エネルギー期待値基底状態に近いかどうかはテンソルネットワーク波動関数などで評価できる。テンソルネットワークは量子状態正規直行基底で展開した係数を小さなテンソル積の縮約で記述した波動関数であり、この係数をニューラルネットワークで表したものがニューラルネットワーク波動関数[注釈 4]である。一部のNN波動関数は電子系のジャストロー相関因子を表現でき、またNN波動関数の一部とテンソルネットワーク波動関数の一部は同等である。[1]

例:小さな量子系におけるNN波動関数の適用

一次元横磁場イジング模型のハミルトニアンは である。ここでパウリ演算子であり、, , , と作用する。周期境界条件としてを課す。は横磁場の強さ、サイト数である。熱力学極限を変化させると量子相転移が起こり、自発的対称性の破れを伴う強磁性相で対称性の破れない常磁性相となる。この問題の解はNN波動関数で近似できる。[1]

トランスフォーマ

学習物理学ではトランスフォーマ場の理論相互作用の一種であると考えられる。場の理論では高次の相互作用が運動方程式に存在するが、自身の積を取る構造はトランスフォーマの自己注意機構と似ている。[2]重みをゲージ場バイアスをヒッグス場と解釈すると、ニューラルODE対称性重力場の基本対称性と一致する。なので、ニューラルネットワークは重力と時空構造と等価な幾何学的存在である。[3]

年表

Adsブラックホールのペンローズ図
オートエンコーダ

背景

脚注

関連項目

Related Articles

Wikiwand AI