複合確率分布
From Wikipedia, the free encyclopedia
複合確率分布とは、確率変数 がパラメータ を持つ分布 に従い、 もまた別の分布 に従う場合の確率分布 のことである。この場合、確率分布 は と との複合分布であると呼ばれる。数学的には、無条件分布 は未知の(複数の場合もある)パラメータ について のもとで周辺化した分布である。その確率密度関数は
で与えられる。
変数の一部または全体がベクトルである場合も、同様の式を当てはめることができる。
上記の式からもわかるように、複合分布とは本質的には特別な周辺分布のことである。 と の同時分布は であり、これを で積分すると複合分布 が得られる。 が離散的な値を取る場合、複合分布は混合分布の特別な場合として解釈される。
性質
一般的性質
複合分布 はそれぞれの分布の具体的な表現や、分布 のどのパラメータが に依存しているかという情報に依存する。 のパラメータには、 のパラメータのうち周辺化されていないものが全て含まれる。 の台は のそれに一致し、 で平均や分散が定義できる場合、いくつかの一般的な性質が成り立つ。
平均・分散
例えば、 の平均値が に従うパラメータであり、 が平均 と分散 を持つ場合は、上記の式から および が導かれる。ここで、を の分散とした。
導出
およびを、平均と分散をパラメータにもつ確率分布とし、を仮定する。確率密度関数は およびとして表すこととし、をの確率密度とすると、以下が成立する:ここで、とのパラメータの与え方からであるので、結局複合分布の平均値についてが示される。
の分散はで定義される。前者についてはと計算される。ただし および を用いた。以上から、示すべきが得られる:
応用
検定
一般的な検定統計量の分布は、帰無仮説の下では複合分布となる。例えば、T検定の検定統計量が従うT分布はそれぞれ正規分布・カイ二乗分布に従う2つのパラメータの比が従う分布であり、F検定の検定統計量が従うF分布もそれぞれ別個のカイ二乗分布に従うパラメータの比が従う分布となる。
過分散モデリング
過分散とは、観測された分散がモデルが予測する分散よりも大きい状況を指す。複合分布は、過分散を示すような結果をモデル化する上で有用である。例えば、計数は通常ポアソン分布に従うとモデル化される。理論的には、ポアソン分布の分散は平均に一致する。ここで、ポアソン分布の平均を表すパラメータのばらつきを許容すると、計数の分布を一般化することができる。具体的には、平均パラメータがガンマ分布に従うとした場合、複合分布は負の二項分布となる。この分布の形状はポアソン分布に類似しているが、その理論的分散ははるかに大きい。
同様に、二項分布の成功確率パラメータがベータ分布に従うとした場合の複合分布はベータ二項分布となる。
ベイズ推定
ベイズ推定においては、複合分布の特別な場合と見做せるありふれた周辺分布以外の用途がある。上記の記法に従えば、 F を将来の観測の分布、G を F のパラメータの観測を基にした事後確率分布とした場合の複合分布であり、 これらの複合分布は事後予測分布を与える。これに対して、事前予測分布は、F を将来のデータ点の分布、G をパラメータの事前確率分布とした場合の複合分布である。
畳み込み
確率変数の和が従う分布の導出には確率分布の畳み込みを行うが、これも複合分布の特別な場合とみなすことができる。 すなわち、一方の被加数をもう一方の被加数の分布の位置をランダムにずらすパラメータとしてみなすということである。[1]
複合分布の計算
複合分布の例
- 正規分布の分散/標準偏差に関連する複合分布:[3][4]
- 正規分布の分散が逆ガンマ分布に従うとした場合の複合分布はT分布である。[5] この分布は、元となる正規分布と同じ中央値を持つ対称分布であるが、分散が大きい裾の重い分布である。
- 正規分布の分散が指数分布に従うとした場合の複合分布はラプラス分布である。 これを一般化し、正規分布の分散をガンマ分布に従うとした場合の複合分布は分散ガンマ分布となる。
- 正規分布の分散が指数分布に従い、その指数分布の比母数がさらにガンマ分布に従うとした場合の複合分布は正規指数ガンマ分布となる。なお、これは2段階の複合分布であり、正規分布の分散は、後述するようにロマックス分布に従う。
- 正規分布の標準偏差の逆数が一様分布に従う場合の複合分布はスラッシュ分布となる。
- 正規分布の標準偏差がコルモゴロフ分布に従う場合の複合分布はロジスティック分布となる。[6][3]
- その他の正規分布の複合分布:
- 正規分布の平均値が別の正規分布に従う場合、それらの複合分布も再び正規分布となる。
- 正規分布の平均値が指数分布に従うとした場合、複合分布はex-Gaussian分布となる。
- ベルヌーイ分布の成功確率が、期待値を定義可能な分布 に従う場合、複合分布は成功確率がであるベルヌーイ分布である。 この複合分布の興味深い帰結として、 のばらけ具合が複合分布に何の影響も与えないということが挙げられる。
- 二項分布の成功確率がベータ分布に従う場合、複合分布はベータ二項分布となる。 この分布は二項分布に由来するサンプル数 およびベータ分布に由来する2つのパラメータ からなる3つのパラメータをもつ。[7][8]
- 多項分布の確率ベクトルがディリクレ分布に従うとした場合、複合分布はディリクレ多項分布である。
- ポアソン分布のレートパラメータがガンマ分布に従うとした場合、複合分布は負の二項分布となる。[9][10]
- ポアソン分布のレートパラメータが指数分布に従うとした場合、複合分布は(台に0を含む)幾何分布となる。
- 指数分布のレートパラメータがガンマ分布に従うとした場合、複合分布はロマックス分布となる。[11]
- ガンマ分布の尺度母数の逆数が別のガンマ分布に従うとした場合、複合分布は第2種ベータ分布である。[12]
- 半正規分布の尺度母数がレイリー分布に従うとした場合、複合分布は指数分布となる。
- ガンマ分布のパラメータとしてをとり、が一様分布に従う場合、複合分布は指数分布である。