確率行列

From Wikipedia, the free encyclopedia

数学における確率行列(かくりつぎょうれつ、: stochastic matrix)とは、マルコフ連鎖の遷移確率を表す正方行列である。全ての成分が、確率を表す非負実数となっている[1][2]:9-11。文脈によって遷移行列: transition matrix)、置換行列: substitution matrix)、マルコフ行列: Markov matrix)と呼ばれることもある。また : probabilistic matrix と呼ばれることもある[2]:9-11

確率行列は20世紀初頭にアンドレイ・マルコフによって初めて導入され、確率論統計学数理ファイナンス線形代数学計算機科学集団遺伝学といった様々な分野で活用されてきた[2]:1-8

確率行列には、いくつかの異なる定義・形式がある[2]:9-11

右確率行列: right stochastic matrix)とは、任意の行の和が1となる非負実数成分の正方行列である。
左確率行列: left stochastic matrix)とは、任意の列の和が1となる非負実数成分の正方行列である。
二重確率行列: doubly stochastic matrix)とは、任意の行、任意の列の和が1となる非負実数成分の正方行列である。

同様にして、確率ベクトル英語版: stochastic vector, probability vector) を、全ての成分が非負の実数で和が1となるベクトルと定義できる。右確率行列の全ての行(左確率行列の全ての列)は確率ベクトルである[2]:9-11

数学の文献での慣習に従い、本項では行ベクトルが確率ベクトルとなる右確率行列について述べる[2]:1-8

アンドレイ・マルコフ(1886年)

確率行列は、ロシア人数学者サンクトペテルブルク大学教授であったアンドレイ・マルコフによってマルコフ連鎖とともに考案された。出版物への初めての記載は1906年である[2]:1-8 [3]。マルコフは当初、これらを言語分析やカードシャッフル等の数学的題材に用いるつもりだったが、たちまち他の分野でも有用であることが分かってきた[2]:1-8 [3][4]

確率行列はアンドレイ・コルモゴロフ等の学者によってさらなる研究がなされ、連続時間マルコフ過程にも適用できるよう拡張が行われた[5]。1950年代までに、計量経済学[6]回路網解析[7]といった分野にも確率行列を用いた論文が現れた。1960年代には行動科学[8]から地質学[9][10]居住地計画[11]まで、さらに広範な科学領域で確率行列が用いられるようになった。同時に、この期間には確率行列やマルコフ過程の応用範囲や有用性を押し広げるような数学的研究もより一般的に行われた。

1970年代から現在にかけて、確率行列は建築構造設計[12]から医療診断[13]人事労務管理[14]まで、形式的な分析を必要とするほとんどあらゆる分野で用いられるようになってきた。土地利用変化モデリング英語版(land change modeling、この分野では「マルコフ行列」と呼ばれることが多い)においても広範に応用されている[15]

定義と性質

確率行列は、要素が有限個の状態空間 S濃度 )上のマルコフ連鎖 を記述する。

1ステップで状態 から状態 へ遷移する確率が であるとき、確率行列 行・列成分を とする行列で与えられる。例えば、

状態 から次の状態へ遷移する確率の総和は1なので、

となり右確率行列であるための条件を満たす[2]:1-8。この性質を とも表せる[16]。ここで は全ての成分が 次元列ベクトルである。 これを使うと、2つの確率行列 , もまた右確率的であることがわかる:

一般に、確率行列 もまた確率行列である。状態 から状態 へ2ステップで遷移する確率は の第 成分

に等しく、さらに一般に、ある状態から次の状態へ ステップで遷移する確率は で与えられる。

初期状態の確率分布(系がどのような状態をどのような確率でとっているか)は行ベクトルとして与えられる。

定常: stationary)確率ベクトル とは、右確率行列が右から作用しても不変な行確率ベクトルのことである。つまり、集合 上の確率分布であって、左固有値1に対する左固有ベクトルとなるもののことである:

任意の右確率行列のスペクトル半径の最大値は1であることがゲルシュゴリンの定理によりわかる。また右固有値1に対する右固有ベクトル が存在することは明らかである。正方行列に対する右固有値と左固有値は一致するから、右確率行列に対して左固有値1が存在し、全ての左固有値の絶対値が1以下であることも同時に分かる。

行確率ベクトルに右確率行列を右から作用させて得られる行ベクトルもやはり確率ベクトルであるから、(各成分が非負で和が1に等しい 次元実ベクトル全体がコンパクト凸集合をなすことに注意すると)ブラウワーの不動点定理より定常な確率ベクトルが少なくとも一つは存在することが分かる。

一方でペロン=フロベニウスの定理によっても、任意の既約な確率行列(任意の に対し の第 成分が正になる自然数 が存在するような行列。行列の既約性を参照)が定常な確率ベクトルを持ち、固有値の絶対値の最大値が1となることが分かる。しかし、この定理は既約であるとは限らない確率行列には直接的に適用できない。

一般に定常な確率ベクトルは複数存在するかもしれないが、確率行列の全ての成分が正であれば(より一般的には、確率行列が既約かつ非周期的(エルゴード的英語版: ergodic))であれば)、このようなベクトルは一意的であり、任意の状態 に対し次の極限をとることで計算できる。

ここで は行ベクトル の第 成分。これより、長期的に見たとき状態 に到る確率は初期状態 に依らないことが分かる。どのような初期分布から計算しても極限では同一の定常分布に到るという事実はエルゴード定理の一形態であり、多様な散逸構造(系が時間発展し、安定的な状態に達する)において一般的に成り立っている。

直観的には確率行列はマルコフ連鎖を表し、(行ベクトルとしての)確率分布に右確率行列を右から作用させることは、元の分布の確率質量を(総和1を保ちつつ)次の確率分布へ再分配することに相当する。この作用を反復していくとマルコフ連鎖の定常状態に収束する[2]:55–59

例:ネコとネズミ

関連項目

脚注

Related Articles

Wikiwand AI