逆関数法の概念図。F(x) を確率変数 X の従う確率分布の累積分布関数とし、U を標準一様分布に従う確率変数とする。このとき、確率変数 F-1(U) はX と同じ確率分布に従う。
逆関数法(ぎゃくかんすうほう、英: inversion method, inverse transform method)とは、累積分布関数の逆関数を用いて、標準一様分布に従う確率変数から、所望の分布に従う確率変数を生成させる方法[1][2][3]。逆関数サンプリング法(ぎゃくかんすうサンプリングほう、英: inverse transform sampling)とも呼ばれる。計算機シミュレーションにおいて、一様分布に従う乱数から、所望の乱数を生成させるのに用いられる。
累積分布関数の逆関数 F-1(y) の定義。一般に F(x) は逆関数を持つとは限らないが、右連続かつ単調非減少であり、F-1(y)=inf{x: F(x)≥y} で定義することができる。
X を生成させたい確率分布に従う確率変数とし、 F(x) =Pr{X ≤ x}をその累積分布関数とする。y=F(x) が連続な単調増加関数であれば、逆関数 F-1(y) が存在する。U を[0,1)上の一様分布に従う確率変数とすると、
![{\displaystyle X:=F^{-1}(U)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/39f5fbcbfc8e1e4b61b09903b57d6d1c2cd4da72)
は累積分布関数 F(x) をもつ確率分布に従う確率変数となる。実際、これは
![{\displaystyle \mathrm {Pr} \{F^{-1}(U)\leq x\}=\mathrm {Pr} \{U\leq F(x)\}=F(x)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/132a49a8282d2397e608fe8e7a8e70db4f63c036)
であることから確認できる。
一般に F(x) は右連続な単調非減少関数であり、通常の意味での逆関数が存在するとは限らないが、その逆関数 F-1(y) を
![{\displaystyle F^{-1}(y):=\inf {\{x|F(x)\geq y\}},\quad 0\leq y\leq 1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3ae1c7d1d554b6257e234308b225419b122ce6b9)
で定義すれば、同様な結果が得られる[1][2]。このように、一様分布に従う確率変数 U と累積分布関数の逆関数 F−1(y) から所望の分布に従う確率変数 X=F−1(U) を生成させる方法を逆関数法という。逆関数法は、原理的には連続分布、離散分布に適用可能であるが、必ずしも逆関数が容易にも求まるとは限らず、また高速な乱数生成が得られるとは限らない[2]。
指数分布[編集]
期待値を μ > 0 とする指数分布の累積分布関数
![{\displaystyle F(x)=1-e^{-x/\mu }}](https://wikimedia.org/api/rest_v1/media/math/render/svg/634a381476aaf741839a6cc6c91316157e1c52f2)
に対し、逆関数は
![{\displaystyle F^{-1}(y)=-\mu \ln {(1-y)}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d4789530913033f000c114e313146a2188702c66)
であり、
![{\displaystyle X=-\mu \ln {(1-U)}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/944c713a15bb0f3c3c37a6ab7f885d85faad51fa)
となる。1 − U も標準一様分布に従うため、高速化のために1 − U を U で置き換えた
![{\displaystyle X=-\mu \ln {(U)}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fef535ed566c546022b665b4779571c5b939dfeb)
を使うことができる。この場合、U=0での処理に注意する必要がある。
コーシー分布[編集]
尺度母数(英語版)を σ > 0 とするコーシー分布の累積分布関数
![{\displaystyle F(x)={\frac {1}{2}}+{\frac {1}{\pi }}\arctan {\frac {x}{\sigma }}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/834e86ee21abfce21f35237c3687f7f1d0f620e2)
に対し、その逆関数は
![{\displaystyle F^{-1}(y)=\sigma \tan {\pi \left(y-{\frac {1}{2}}\right)}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3193753d2016da729e9fb44b7d507d50bc02e404)
であり、
![{\displaystyle X=\sigma \tan {\pi \left(U-{\frac {1}{2}}\right)}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/062b82998d9998921561460b8022f4611a2c4b04)
となる。
離散分布[編集]
離散分布に従う確率変数 X についても、累積分布関数の逆関数をF−1(y)=inf{x | F(x) ≥ y}と定義することで、逆関数法を適用できる[2]。値 x1, x2, … ,を取る確率が p1, p2, … , である離散分布において、
![{\displaystyle \sum _{i=1}^{k-1}{p_{i}}<y\leq \sum _{i=1}^{k}{p_{i}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b9139a5ef8997b5611633b59393ab105aa9d323e)
が満たされるならば、
![{\displaystyle F^{-1}(y)=x_{k}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3e93d39f8cd634617fe8359c1ffb8c67797cb3d8)
であるから、
![{\displaystyle X=x_{k},\quad \mathrm {if} \,\,\sum _{i=1}^{k-1}{p_{i}}<U\leq \sum _{i=1}^{k}{p_{i}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7b53d971566c81a0e91babd495f1d0a636ab1296)
となる。但し、この方法は X の取りうる値が多いと大小関係の評価時間がかかり、高速化には不向きである。
逆関数が陽に求まり、逆関数法が直接適用できる連続分布として、以下の例がある[4]。
分布 |
![{\displaystyle F(x)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/71a82805d469cdfa7856c11d6ee756acd1dc7174) |
|
指数分布 (平均値:μ>0) |
![{\displaystyle 1-\exp {\left(-{\frac {x}{\mu }}\right)},\quad x\geq 0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7379a8482579c52c679161b6829764e1ed6be344) |
|
ワイブル分布 (尺度母数:η>0、形状母数:β>0) |
![{\displaystyle 1-\exp {\left(-\left({\frac {x}{\eta }}\right)^{\beta }\right)},\quad x\geq 0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/39350850fc2cc338161acf1cbc0086a2827ecd9d) |
|
ガンベル分布 (尺度母数:η>0、位置母数:−∞<μ<+∞) |
![{\displaystyle \exp {\left(-\exp {\left(-\left({\frac {x-\mu }{\eta }}\right)\right)}\right)},\quad -\infty <x<+\infty }](https://wikimedia.org/api/rest_v1/media/math/render/svg/b788ca6ff1290e64973b7e5a1e969a414af7156b) |
|
コーシー分布 (尺度母数:η>0) |
![{\displaystyle {\frac {1}{2}}+{\frac {1}{\pi }}\arctan {\frac {x}{\eta }},\quad -\infty <x<+\infty }](https://wikimedia.org/api/rest_v1/media/math/render/svg/aa3ab948f006da3dde0464936f9bc10243a3b32e) |
|
ロジスティック分布 (尺度母数:η>0、位置母数:−∞<μ<+∞) |
![{\displaystyle {\frac {1}{1+\exp {\left(-{\frac {x-\mu }{\eta }}\right)}}},\quad -\infty <x<+\infty }](https://wikimedia.org/api/rest_v1/media/math/render/svg/f97c25a7cf0ebb213797d7dc2930eba439442d21) |
|
パレート分布 (尺度母数:b >0、形状母数:a >0) |
![{\displaystyle 1-\left({\frac {b}{x}}\right)^{a},\quad x\geq b}](https://wikimedia.org/api/rest_v1/media/math/render/svg/011c9d2153ef0ac5ce5582c2cc5bdbbc846c0bc6) |
|
積分や逆関数を求めるのが困難な場合[編集]
逆関数サンプリング法では与えられた確率分布の累積分布関数とその逆関数を計算する必要がある。それらの関数の解析解が既知である場合は、単純なプログラムで与えられた分布に従う擬似乱数を生成することができる。しかしこれらを解析的に求めるのは困難な場合もある。
求根アルゴリズムを使用する方法[編集]
確率密度関数を数値積分して累積分布関数の F(x) を求め、F(x) = u は F(x) - u = 0 の事なので求根アルゴリズム(ニュートン法など)で x を求めてサンプリングする方法もある。F(x) - u の導関数は P(x) なので、それを求根アルゴリズムでは使用できる。
区分的線形累積分布関数を使用する方法[編集]
確率密度関数から区分的線形累積分布関数を作り、そこから求める方法もある[5]。
同時確率分布の場合[編集]
条件付き確率の定義 P(A, B) = P(B | A) P(A) を使い、単変量サンプリング問題に分割し、A → B と順番にサンプリングする方法もある。ただし、問題によっては、マルコフ連鎖モンテカルロ法などの他のサンプリング法を使用した方が良い場合もある。
正規分布の場合[編集]
正規分布に従う擬似乱数の生成法としては、ボックス=ミュラー法などが知られる。正規分布の分位関数は解析的に求められないが、分位関数の多項式近似を用いた逆関数法でも十分に精度よく正規分布に従う擬似乱数を生成することができ、実際にR言語では正規分布に従う擬似乱数の生成に逆関数サンプリング法が使われている[6]。計算が高速な手法としてはジッグラト法(英語版)がある。
参考文献[編集]
関連項目[編集]
|
---|
離散単変量で 有限台 | |
---|
離散単変量で 無限台 | |
---|
連続単変量で 有界区間に台を持つ | |
---|
連続単変量で 半無限区間に台を持つ | |
---|
連続単変量で 実数直線全体に台を持つ | |
---|
連続単変量で タイプの変わる台を持つ | |
---|
混連続-離散単変量 | |
---|
多変量 (結合) | |
---|
方向 | |
---|
退化と特異 | |
---|
族 | |
---|
サンプリング法(英語版) | |
---|
|