ポリアの壺モデル

From Wikipedia, the free encyclopedia

ポリアの壺モデル (ポリアのつぼモデル、: Pólya urn model)あるいは単にポリアの壺 (: Pólya's urn)は、確率論統計学における壺モデルの一種。ハンガリー出身のアメリカの数学者ジョージ・ポリアに因んで名付けられている。

壺モデルでは、興味のある対象(原子、人、車など)を壺の中の色のついた玉へと単純化することで、多くの一般的に使われている統計モデルを解釈できる形とする。基本的なポリアの壺では、まず白い玉と赤い玉がそれぞれ複数個入った壺を用意する。各ステップで、壺から1個の玉が均一に無作為に選ばれ、その色を観察する。その後、取り出した玉および取り出した玉と同じ色の玉の合計2個を壺に入れる。

もし初期の数回の抽選で偶然にも赤い玉が白い玉より多く引かれた場合、その後も赤い玉がより多く引かれる可能性が高まり、白い玉についても同様の傾向が生じる。これは各ステップで取り出した玉を壺に戻さない問題(非復元抽出)とは正反対の性質である。非復元抽出では特定の値が観測されるたびに、その値が再び観測される確率は低下する。一方、ポリアの壺では観測された値が再び観測される可能性が高まる。また、ポリアの壺では、時間の経過に伴う連続した測定行為は将来の測定への影響を次第に弱めていくが、非復元抽出では逆の現象が起こる。すなわち、非復元抽出においては特定の値が一定回数(具体的には、最初に壺の中に入っていた個数)測定されると、その値は二度と観測されなくなる。

ポリアの壺は、単純な復元抽出とも異なる。ここで、単純な復元抽出は各ステップで取り出した玉だけをそのまま元に戻すような壺問題で表現される。単純な復元抽出では、それまでに観測された結果が将来の観測値の確率に何の影響も及ぼさない。

ポリアの壺において興味深い問題は、壺の中身の内訳がどう変化していくかということ、すなわち、取り出される玉の色の順序である。

最初に白玉が 、赤玉が 個入っている壺を考える。 回の試行を終えた後に、壺の中に白玉が 個、赤玉が 個入っている確率 (ただし、 ) は、二項係数を用いて となる。ただし、上昇階乗冪 を表すものとした。これはそれぞれの可能な構成のパスカルの三角形を描くことで証明できる。

特に の場合(最初に壺の中に入っているのが赤玉、白玉それぞれ1個ずつ)であれば、 回のステップの後に壺の中にある白玉が 個 (ただし ) である確率は に依らず となる。

より一般的に、最初壺の中に 色の玉があり、 () の玉が 個あるとする。 回のステップの後、 番目の色の玉が 個だけ壺の中にある確率は、多項係数を用いてである。

回のステップの後に最終的に 番目の色の玉が 個あるような遷移は 通りある。それぞれの遷移を実際に通る条件付き確率はいずれも である。

関連する分布

  • ベータ二項分布: 2色だけのポリアの壺で、 回のステップの後にある色が何回取り出されたかを記述する。
  • ベータ負二項分布英語版: 2色のポリアの壺で、一方の色の玉が特定の回数取り出されるまでの間に、もう一方の色の玉が何回取り出されるかを記述する。
  • ディリクレ多項分布英語版 色のポリアの壺で、各色の玉が 回のステップの後にある色がそれぞれ何回取り出されたかを記述する。
  • ディリクレ負多項分布英語版: 色のポリアの壺で、ある特定の色の玉が特定の回数取り出されるまでの間に、それぞれの色の玉がそれぞれ何回取り出されるかを記述する。
  • マルチンゲールベータ二項分布ベータ分布: 最初に壺に入っているのは白玉が 個、赤玉が 個であるとし、 回のステップの後に壺の中にある白玉の個数を であるとする。すると、確率変数の列 それぞれはベータ二項分布に従う。さらに、この確率変数列について、 ステップまで進めた状態での ステップ目の状態に関する期待値が を満たすので、この確率変数列はマルチンゲールである。さらに、この変数列の での収束先の確率分布はベータ分布に従う。
  • ディリクレ過程英語版中華料理店過程、ホップの壺(: Hoppe's urn): ポリアの壺の変種として、以下のような壺問題が考えられる。最初に白玉が 個だけ入っている壺を用意する。壺から無作為に玉を取り出し色を確認して戻していくのだが、もし白玉が取り出されたら、それまで壺の中になかった色を無作為に1つ選び、その色の玉と白玉を一つずつ壺に戻す。この際、このステップでは新しく壺に追加した色を「壺から取り出した」とみなすこととする。一方、白以外の色の玉が壺から取り出されたら、通常のポリアの壺と同様に同じ色の玉を2個壺に追加する。このようにして「取り出された」玉の色の列は中華料理店過程に従う。一方、新しい色を壺に追加する代わりに、ある基底となる確率分布からランダムな値を抽出し、その値をラベルとしてボールに付ける過程を考えると、ラベルの列はディリクレ過程に従う。[1]
  • モラン過程英語版: 理論的な集団遺伝学における遺伝的浮動をモデル化するための壺モデル。ポリアの壺と同様、取り出した玉と同色の玉の2個をステップ毎に壺に戻すが、この際壺から無作為な玉が1個取り除かれる。したがって、壺の中の玉の総数がステップを経ても変化しない。この操作を十分な回数繰り返すと、最終的には壺の中の玉は全て同じ色となる。最終的な状態としてどの色に統一されるかの確率は最初の壺の中の割合に一致する。モラン過程の変種として、「観測の後壺から取り除かれる玉が、当該ステップで最初に取り出されたそれであってはならない」と規定するものや、「壺から取り除かれる玉は当該ステップで追加したばかりの玉であっても良い」とするものなどがある。これらの追加のルールによって、全ての玉が同一の色となるまでの時間にわずかな差異が生じる。

交換可能性

ポリアの壺は交換可能な確率変数英語版の典型的な例である。

引き続き、最初に白玉が 個、赤玉が 個入っている壺があるとし、ポリアの壺のルールに従って玉を取り出し、取り出された色を記録する。 番目のステップの結果に対応する確率変数 を、 番目に取り出された玉が赤玉であれば 、そうでなければ となるように定義する。 番目のステップに至るまでの間に赤玉を偶然にも大量に取り出していた場合、壺の中にも赤玉が(赤玉と白玉を程よく取り出した場合に比べて)多くなるため、 となる確率も高くなる。このことから、確率変数列 は互いに独立ではないことがわかる。

一方、確率変数列 は、弱い交換可能性をもつ[2]。すなわち、同時分布は、それらのラベルの張り替えのもとで不変である。例えば、3回取り出した際に を全て満足する確率と、 を全て満足する確率は一致する。

の交換可能性を示すために、合計で 回のステップを行うとし、そのうち 回赤玉、 回白玉を取り出したとしよう。このような取り出し方の1つとして、最初の 回は連続で赤玉を取り出し、続いて残りの回数は白玉を取り出したとする。このような取り出し方が起こる確率は以下のようになる:

次に、どのような順番で赤玉、白玉を取り出したとしても、それぞれを引き出した合計回数が同じである限りは全て上記の確率となることを示さなければならない。まず、取り出した結果を好きなように入れ替えても、 番目のステップに対応する分数の分母は必ず となる。これは、当該ステップにおいて壺の中にある玉の総数そのものであるからである。よって、分母については順序を入れ替えても変化しない。

回目のステップで累計 回目の赤玉を取り出したという状況を考えると、 となる確率は となる。同様の議論から、白玉についても確率がもとまる。合計で取り出す回数が決まっている以上は、分子には必ず が出現する。以上のことから、任意の数列 であって、 回、 回それぞれ出現する (すなわち、赤玉が 回、白玉が 回順不同で取り出される) 確率は、となる。

この確率は赤玉、白玉を取り出す順序には関係しないが、赤玉、白玉をそれぞれ合計で何回取り出したかには依存する[2]

デ・フィネッティの定理によれば、 上の確率分布 であって、 を満たすものが一意に存在する。すなわち、 となる確率が、尤度を成功確率 でパラメトライズされるベルヌーイ分布とし、さらに 事前確率分布 に従うとしたときの複合確率分布に一致するような が一意に存在する。なお、ポリアの壺モデルの場合、そのような確率分布はベータ分布となることが知られている。実際、上の式で として を与えると、 のもとで元の確率を再現する。[2]

関連項目

脚注

参考文献

Related Articles

Wikiwand AI