統計的検定でよく使われる手法をまとめる

思い出すのに時間が掛かってしまうことがあるので、よく行われる検定においてどの手法がどのように使われるか、なぜ使うことができるかをまとめようと思います。

母比率の検定

母比率の検定においては、 $n$ が十分大きいときに二項分布が正規分布に近似できることを用いて $z$ 検定を行います。詳細な流れは以下のようになります。

まず、成功確率が $p$ のベルヌーイ試行を考え、これを $n$ 回独立に繰り返すとします。このとき、 $n$ 回の中で出てきた成功回数を $X$ という確率変数で表すと、 $X$ は二項分布に従います。すなわち、

$\displaystyle X \sim B(n, p)$

と表されます。また、このとき $n$ が大きいと二項分布は正規分布に近似できるため、 $X$ は平均 $np$ 、分散 $np(1-p)$ の正規分布に従います *1 *2 。すなわち、

$\displaystyle X \sim N(np, np(1-p))$

となります。更にこの $X$ を $n$ で割った確率変数、すなわち標本の比率（これを $\hat{p}$ とします）は正規分布の再生性により次のように表されます *3 。

$\displaystyle \hat{p} \sim N(p, \frac{p(1-p)}{n})$

そしてこの確率変数を標準化することで検定が行われます。

このように、母比率の検定では $n$ が十分大きいときに二項分布が正規分布に近似する性質を利用し $z$ 検定を行います。

補足

少し混乱しやすいですが、母比率の検定では上記のように $n$ が大きいときの近似の性質を使っているため、「得られたデータが正規分布に従っているか」ということを考える必要はありません。すなわち、正規性の検定を行う必要はありません。

母比率の差の検定

母比率の差の検定においては、各群が正規分布に従うことと正規分布の再生性を利用し、 $z$ 検定が使われます。詳細な説明としては以下の通りです。

まず、1群目のサンプルサイズを $n_1$ 、母比率を $p_1$ 、標本比率を $\hat{p_1}$ とし、2群目も同様に $n_2$ 、 $p_2$ 、 $\hat{p_2}$ とします。このとき、 $n_1$ と $n_2$ が十分に大きければ、標本比率 $\hat{p_1}$ と $\hat{p_2}$ はそれぞれ正規分布に従います。

また、2群の標本比率の差 $\hat{p_1} - \hat{p_2}$ も正規分布の再生性の性質により平均 $p_1 - p_2$ 、分散 $\frac{p_1(1-p_1)}{n_1} + \frac{p_2(1-p_2)}{n_2}$ の正規分布に従います。すなわち、以下のように表すことができます。

$\displaystyle \hat{p_1} - \hat{p_2} \sim N(p_1 - p_2, \frac{p_1(1-p_1)}{n_1} + \frac{p_2(1-p_2)}{n_2})$

そして、この確率変数を標準化することで検定が行われます。

補足

母比率の差の検定においても事前に正規性の検定を行う必要はなく、また等分散性の検定も不要です *4 。

母平均の検定

母平均の検定では、母分散が既知で $n$ が大きいときには中心極限定理により標本平均が正規分布に従うため、 $z$ 検定を行います *5 。

一方、母分散が未知または $n$ が小さいときには、母集団が正規分布に従っていると考えられる場合、 $t$ 検定を使います。母集団が正規分布に従っていると考えられるかは正規性の検定によって調べ *6 、仮定ができる場合は $t$ 検定を行う、という流れになります *7 。

母平均の差の検定

ここでは2標本に対応がない場合を考えます。このとき、母平均の差の検定では両標本の母集団が正規分布に従っていると考えられる場合、ウェルチの $t$ 検定を使います。

そのため、流れとしてはまず両標本について正規性の検定を行い、その結果正規分布の仮定を満たせる場合にウェルチの $t$ 検定を行う、となります。

なお、等分散性の検定を行ったのち、スチューデントの $t$ 検定 or ウェルチの $t$ 検定のどちらを使うかを判断する方法もありますが、こちらは検定の多重性の問題が生じたり *8 、等分散性の検定結果に関する問題が生じたりする *9 ため、等分散性の検定を行わずウェルチの $t$ 検定を行うことが推奨されています。

正規性の検定で正規分布が仮定できなかった場合は、ノンパラメトリックな手法であるマン・ホイットニーのU検定などを使います *10 。

*1: $n$ が大きいと言えるための条件は、文献によって書かれていることが異なるようです。例えば、以下の Wikipedia のページでは「期待値 $np$ および $np(1-p)$ が 5 よりも大きいとき」と書かれていますが、もう一つ貼った別の解説記事では「 $np > 5$ かつ $n(1-p) > 5$ のとき」と書かれています。 ja.wikipedia.org techtipshoge.blogspot.com

*2:証明は以下のページに載っています。physnotes.jp

*3:正規分布の再生性の内容・その証明は以下の記事に載っています。mathlandscape.com

*4:等分散性の検定が不要なのは、母比率の差の検定では正規分布の再生性を用いて検定しており、 $t$ 検定のように等分散という仮定を置いていないためです（そのため、その仮定が合っているかという検証もする必要がありません）。実際、以下の記事でも等分散性の検定が行われていません。bellcurve.jp

*5: $n$ が大きいと言えるための条件には厳密な定義はなく、サンプルサイズが26以上または31以上と慣習的に言われています。ただ、 $t$ 分布は極限として正規分布を含むので、 $n$ が大きいときでも $z$ 検定ではなく $t$ 検定を使うという考え方もあります。書籍「Rで学ぶ確率統計学　一変量統計編」の P124 より。

*6:正規性の検定をする際には、ダゴスティーノのK二乗検定などを使います。詳細については以下のページが参考になります。bellcurve.jp docs.scipy.org

*7:正規分布が仮定できなかった場合の検定方法についてはうろ覚えですが次のようなものだったはずです。まず、そもそもの $n$ を大きくし、そうすると

不偏分散 $s^{2}$ が母分散に近づいていく（不偏分散の一致性による）
$\frac{\sigma}{\sqrt{n}}$ と $\frac{s}{\sqrt{n}}$ の差が分母の $\sqrt{n}$ の作用により小さくなっていく（ $n$ が大きくなると分母も大きくなり差が小さくなる、という意味です）