Summarize Timeline Top Qs Fact Check
棄却サンプリングでは、任意の確率密度関数
f
(
x
)
{\displaystyle f(x)}
に従う目的確率変数
X
{\displaystyle X}
のサンプリングを、提案確率分布
g
(
y
)
{\displaystyle g(y)}
に従う確率変数
Y
{\displaystyle Y}
のサンプルを用いて行う。具体的には、
X
{\displaystyle X}
を直接サンプルする代わりに、
Y
{\displaystyle Y}
のサンプルを利用して、そのサンプルを確率
f
(
x
)
/
(
M
g
(
x
)
)
{\displaystyle f(x)/(Mg(x))}
で受け入れるという手順を繰り返すことにより、
X
{\displaystyle X}
のサンプルを入手することができる。ここで、
M
<
∞
{\displaystyle M<\infty }
は定数であり、
X
{\displaystyle X}
の台 全体で
f
(
x
)
/
g
(
x
)
{\displaystyle f(x)/g(x)}
の上界 である。言い換えれば、
M
{\displaystyle M}
は全ての
x
{\displaystyle x}
に対して
f
(
x
)
≤
M
g
(
x
)
{\displaystyle f(x)\leq Mg(x)}
を満たさなければならない。なお、この条件により
Y
{\displaystyle Y}
の台は
X
{\displaystyle X}
の台を含んでいなければならない。すなわち、
f
(
x
)
>
0
{\displaystyle f(x)>0}
となるような
x
{\displaystyle x}
に対して
g
(
x
)
>
0
{\displaystyle g(x)>0}
でなければならない。
(
x
,
v
=
u
⋅
M
g
(
x
)
)
{\textstyle (x,v=u\cdot Mg(x))}
のペアをサンプルすると、
v
{\displaystyle v}
は0から
M
g
(
x
)
{\textstyle Mg(x)}
までの一様分布となる。ここで
u
<
f
(
x
)
/
(
M
g
(
x
)
)
{\textstyle u<f(x)/(Mg(x))}
となる
(
x
,
v
)
{\displaystyle (x,v)}
のペアだけを採択することで、
(
x
,
v
)
{\displaystyle (x,v)}
は
f
(
x
)
{\displaystyle f(x)}
以下の領域からの一様分布からのサンプルとみなすことができる。したがって、
x
{\displaystyle x}
の周辺分布 が
f
(
x
)
{\displaystyle f(x)}
となっており、この手法の有効性が示される。
このことから、十分な反復回数のもとで、このアルゴリズムは目的分布
f
(
x
)
{\displaystyle f(x)}
からのサンプルを生成できる。
この手法はモンテカルロ法 一般的な分野に応用される。例として、マルコフ連鎖モンテカルロ法 では提案分布を利用して目的分布からのサンプリングを行う。また、メトロポリス・ヘイスティングス法 の基礎をなす。
二次元空間からの採択確率は、提案されたサンプルのうち採択されるものの割合であり、これは
P
(
U
≤
f
(
Y
)
M
g
(
Y
)
)
=
E
U
,
Y
[
1
[
U
≤
f
(
Y
)
M
g
(
Y
)
]
]
=
E
Y
[
E
U
[
1
[
U
≤
f
(
Y
)
M
g
(
Y
)
]
|
Y
]
]
=
∫
∫
u
=
0
u
=
f
(
y
)
M
g
(
y
)
g
(
y
)
d
u
d
y
=
∫
f
(
y
)
M
g
(
y
)
g
(
y
)
d
y
=
∫
f
(
y
)
M
d
y
=
1
M
{\displaystyle {\begin{aligned}\mathbb {P} \left(U\leq {\frac {f(Y)}{Mg(Y)}}\right)&=\operatorname {E} _{U,Y}\left[\mathbf {1} _{\left[U\leq {\frac {f(Y)}{Mg(Y)}}\right]}\right]\\&=\operatorname {E} _{Y}\left[\operatorname {E} _{U}\left[\mathbf {1} _{\left[U\leq {\frac {f(Y)}{Mg(Y)}}\right]}|Y\right]\right]\\&=\int \int _{u=0}^{u={\frac {f(y)}{Mg(y)}}}g(y){\text{d}}u{\text{d}}y\\&=\int {\frac {f(y)}{Mg(y)}}g(y){\text{d}}y\\&=\int {\frac {f(y)}{M}}{\text{d}}y\\&={\frac {1}{M}}\end{aligned}}}
と計算される。ここで、
U
∼
U
n
i
f
(
0
,
1
)
{\displaystyle U\sim \mathrm {Unif} (0,1)}
であり、
y
{\displaystyle y}
は提案分布
g
(
⋅
)
{\displaystyle g(\cdot )}
に従う確率変数
Y
{\displaystyle Y}
のサンプルとした。なお、最後の式変形の途中で
Y
{\displaystyle Y}
の台が
X
{\displaystyle X}
の台を含んでいることを用いている。
Y
{\displaystyle Y}
からのサンプルで
X
{\displaystyle X}
のサンプルとして採択されるサンプルを得る上で必要となるサンプルの数は確率
1
/
M
{\displaystyle 1/M}
の幾何分布 に従い、その期待値 は
M
{\displaystyle M}
となる。直感的には
M
{\displaystyle M}
は必要となる反復回数の期待値であり、これがアルゴリズムの計算複雑度の尺度となる。
上の式は、
M
=
1
P
(
U
≤
f
(
Y
)
M
g
(
Y
)
)
{\displaystyle M={\frac {1}{\mathbb {P} \left(U\leq {\frac {f(Y)}{Mg(Y)}}\right)}}}
と書ける。
M
{\displaystyle M}
は定義上
1
≤
M
<
∞
{\textstyle 1\leq M<\infty }
を満たすため、
P
(
U
≤
f
(
Y
)
M
g
(
Y
)
)
{\textstyle \mathbb {P} \left(U\leq {\frac {f(Y)}{Mg(Y)}}\right)}
は
[
0
,
1
]
{\displaystyle [0,1]}
に含まれ、したがって確率の公理を満たす。
M
{\displaystyle M}
は
f
(
x
)
/
g
(
x
)
{\textstyle f(x)/g(x)}
の上界であるので、この比率の最大値が小さいほど採択確率も大きくなる。実用上は、
M
{\displaystyle M}
として
1
{\displaystyle 1}
に近い値が好まれるが、これは平均的に棄却されるサンプルの数が少なくなるので、結果としてアルゴリズムの反復回数が減るためである。この意味で、
M
{\displaystyle M}
は小さければ小さいほど好ましい。全領域で
f
(
x
)
≤
M
g
(
x
)
{\displaystyle f(x)\leq Mg(x)}
を満たしながら
M
{\displaystyle M}
を小さくするには、一般的には提案分布
g
(
x
)
{\displaystyle g(x)}
と目的分布
f
(
x
)
{\displaystyle f(x)}
がある意味で似ている必要がある。なお、実際には
M
=
1
{\displaystyle M=1}
の場合は
f
(
x
)
=
g
(
x
)
{\displaystyle f(x)=g(x)}
を意味することになり、したがって通常のサンプリングに一致する。
棄却サンプリングは、
f
(
x
)
{\displaystyle f(x)}
が直接サンプリングすることが困難な場合に頻繁に利用される。 棄却サンプリング1回の反復あたり、提案分布からのサンプリング、一様分布からのサンプリング、
f
(
x
)
/
(
M
g
(
x
)
)
{\displaystyle f(x)/(Mg(x))}
の評価が要求される。そのため、これらの計算コストの
M
{\displaystyle M}
倍 (1個の採択されるサンプルが得られるまでに必要な反復回数の期待値)が他の手法の計算コストより小さい場合、棄却サンプリング法が効率の良い選択肢となる。