統計学において、ホルム=ボンフェローニ法(ホルム=ボンフェローニほう、英: Holm–Bonferroni method[1])は、多重比較問題に対抗するために使われる手法である。ホルムの方法またはボンフェローニ=ホルム法とも呼ばれる。ファミリーワイズエラー率(FWER)を制御することが意図されており、ボンフェローニ補正よりも一様により強力な(英語版)(検出力の高い)単純な検定を与える。名称は本手法を体系化したスウェーデンの統計学者スチューレ・ホルム(Sture Holm)とボンフェローニの不等式ひいてはカルロ・エミリオ・ボンフェローニにちなむ。
いくつかの仮説を考慮する時、多重性の問題が生じる。つまり、より多くの仮説を調べる程、第一種過誤(偽陽性)を得る確率がより高くなる。ホルム=ボンフェローニ法は個別の仮説のそれぞれに対する棄却基準を調整することによってファミリーワイズエラー率(1つ以上第一種過誤を犯す確率)を制御するための多くの手法の1つである[要出典]。
本手法は以下の通りである。
- 小さい順
に並べられた
個のp値とそれらに対応する仮説
を持っていることを考える。ファミリーワイズエラー率は事前に設定した特定の有意水準
以下にしたい。
であるならば、
を棄却し、次の段階に進む。さもなければここで検定を止める。
であるならば、
も棄却し、次の段階に進む。さもなければここで検定を止める。
- これを繰り返す。それぞれのP値について、
かどうかを検定し、条件を満たせば
を棄却し、次のより大きなP値について調べる。さもなければここで検定を止める。
この手法はファミリーワイズエラー率が
であることを保証する。
単純なボンフェローニ補正は、1つ以上の真である帰無仮説を棄却する(すなわち、1つ以上の第一種過誤を犯す)危険が最大でも
であることを保証するために、p値が
未満の帰無仮説のみを棄却する。この第一種過誤に対する保護の代償は、1つ以上の偽である帰無仮説を棄却し損う(すなわち、1つ以上の第二種過誤を犯す)危険が増大することである。
ホルム=ボンフェローニ法は水準
で最大ファミリーワイズエラー率も制御するが、古典的なボンフェローニ法よりも第二種過誤の危険の増大がより小さい。ホルム=ボンフェローニ法はp値を小さい順番に並べ、それぞれ
から
の名目α水準(すなわち
)と比較する。
- 指数
は、棄却を有効とするのに十分低くない最初のp値を特定する。結果として、帰無仮説
が既約されるのに対して、帰無仮説
は判断が保留される(棄却されない)。
- もし
ならば、棄却のために十分小さなp値はなく、そのため棄却される帰無仮説はない(すなわち全ての帰無仮説について判断が留保される)。
- こういった指数
を見つけることができなかったならば、全てのp値が棄却のために十分小さく、したがって全ての帰無仮説が棄却される。
ホルム=ボンフェローニ法はFWERを以下のように制御する。
を仮説の族、
を並び換えされたp値とする。
を
個の成員を有する(未知の)真である仮説に対応する指数の組とする。
真である仮説を誤って棄却することを仮定する。この事象の確率が最大でも
であることを証明しなければならない。
を最初に棄却された真である仮説(ボンフェローニ=ホルム検定によって与えられる順序での最初)とする。すると、
は全ての棄却された偽である仮説であり、
である。そこから、
(1) を得る。
は棄却されているため、本検定の定義により
を得る。(1) 式を使うと、右辺は最大でも
である。したがって、もし真である仮説を誤って棄却するならば、最大でも
のP値を持つ真である仮説が存在しなければならない。
そこで、確率変数
を定義する。真の仮説の(未知の)集合
が何であれ、(ボンフェローニの不等式により)
となる。その結果、真である仮説を棄却する確率は最大でも
である。
未調整p値
、
、
、
を持つ4つの帰無仮説が有意水準
で検定されることを考える。本手順はステップダウン(下降)式であうため、初めに最小のp値
を持つ
を検定する。p値は
と比較され、この帰無仮説は棄却されて、次の仮説に進む。
であるため、
も同様に棄却され、次に進む。次の仮説
は
であるため棄却されない。ここで検定を止め、
と
は棄却され、
と
は棄却されないと結論付ける。ここでファミリーワイズエラー率は水準
で制御されている。ここで留意すべきは、
であるにもかかわらず、
は棄却されないという点である。これは、棄却ができなかったらそこで検定手順が停止するためである。
仮説検定が負の依存関係にある時、
を

で置き換えることが可能となる。これによって、わずかにより強力な検定となる。
を並び換えされた未調整p値とする。
について、
を
に対応させる。

であるならば、
を棄却する。
ホルム=ボンフェローニ法に対する調整p値は

である。
前の例では、調整p値は
、
、
、
となる。仮説
および
のみが水準
で棄却される。
重み付けされたp値は、

である[要出典]。調整p値がα未満である時かつその時に限り仮説は水準αで棄却される。等しい重みを用いた前の例では、調整p値は0.03、0.06、0.06、0.02である。これは、α = 0.05を使って、この手順によって仮説1および4のみが棄却されることを見るための別のやり方である。
ホルム=ボンフェローニ法は古典的なボンフェローニ補正よりも「一様に」より検出力が高い。これは、常に少なくとも同等に検出力が高いことを意味する。
ファミリーワイズエラー率を制御するためのホルム=ボンフェローニ法よりも強力なその他の手法が存在する。例えば、ホッホベルクのステップアップ手順では、
の棄却は
であるような「最大の」指数
を見つけた後に成される。したがって、ホッホベルクの手順はホルムの手順よりも一様により強力である。しかしながら、ホッホベルクの手順は仮説が独立である、または正の依存性を持つ特定の形式の下にあることを必要とするが、ホルム=ボンフェローニ法はそういった仮定なしに適用することができる。同様のステップアップ手順にホンメル(Hommel)の手順がある。これはホッホベルクの手順よりも一様により強力である[2]。
カルロ・エミリオ・ボンフェローニは本項で記述したホルム=ボンフェローニ法の考案には関与していない。ホルムは元々本手法を「逐次棄却型ボンフェローニ検定」と呼び、しばらくした後でホルム=ボンフェローニ法と呼ばれるようになった。自身の手法をボンフェローニに因んで命名したホルムの動機は原論文において以下のように説明されている: 『多重推測理論内でのブールの不等式の使用は大抵ボンフェローニ・テクニックと呼ばれ、この理由からこの検定を逐次棄却型ボンフェローニ検出と呼ぶことにする』。
- ^ Holm, S. (1979). “A simple sequentially rejective multiple test procedure”. Scandinavian Journal of Statistics 6 (2): 65–70. JSTOR 4615733. MR538597.
- ^ Hommel, G. (1988). “A stagewise rejective multiple test procedure based on a modified Bonferroni test”. Biometrika 75 (2): 383–386. doi:10.1093/biomet/75.2.383. hdl:2027.42/149272. ISSN 0006-3444.