カイ二乗分布(カイにじょうぶんぷ、カイじじょうぶんぷ)、またはχ2分布は確率分布の一種で、推計統計学で最も広く利用されるものである。ヘルメルトにより発見され、ピアソンにより命名された。

独立に標準正規分布に従う k 個の確率変数 X1, …, Xk をとる。このとき、統計量

Z = i = 1 k X i 2 {\displaystyle Z=\sum _{i=1}^{k}{X_{i}}^{2}}

の従う分布のことを自由度 k のカイ二乗分布と呼ぶ。

普通はこれを

Z χ k 2 {\displaystyle Z\sim \chi _{k}^{2}}

と書く。カイ二乗分布は k という1個の母数をもつ。これは Xi の自由度に等しい正の整数である(場合によっては非整数自由度のカイ二乗分布も用いられる)。カイ二乗分布はガンマ分布の特殊な場合に当たる。

カイ二乗分布はカイ二乗検定と総称される多くの検定法のほか、フリードマン検定などにも利用される。

性質

カイ二乗分布の確率密度関数は x ≥ 0 に対し

f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) x k / 2 1 e x / 2 {\displaystyle f(x;k)={\frac {1}{2^{k/2}\Gamma (k/2)}}x^{k/2-1}e^{-x/2}}

また x ≤ 0 に対し fk(x) = 0 という形をとる。ここで Γ はガンマ関数である。

分布関数は

F ( x ; k ) = γ ( k / 2 , x / 2 ) Γ ( k / 2 ) {\displaystyle F(x;k)={\frac {\gamma (k/2,x/2)}{\Gamma (k/2)}}}

(ただし γ(k, z) は不完全ガンマ関数)である。

Y = X 1 / ν 1 X 2 / ν 2 {\displaystyle Y={\frac {X_{1}/\nu _{1}}{X_{2}/\nu _{2}}}} (ただし X 1 χ ν 1 2 {\displaystyle X_{1}\sim \chi _{\nu _{1}}^{2}} X 2 χ ν 2 2 {\displaystyle X_{2}\sim \chi _{\nu _{2}}^{2}} はカイ二乗分布に従う独立な確率変数)とすると、 Y F ( ν 1 , ν 2 ) {\displaystyle Y\sim \mathrm {F} (\nu _{1},\nu _{2})} 、つまり自由度で割って比をとるとF分布に従う。

X χ 2 2 {\displaystyle X\sim \chi _{2}^{2}} (自由度2)ならば、X は期待値 2 の指数分布に従う。

自由度 k のカイ二乗分布に従う確率変数の期待値は k で、分散は 2k である。中央値は近似的に

k 2 3 4 27 k 8 729 k 2 {\displaystyle k-{\frac {2}{3}} {\frac {4}{27k}}-{\frac {8}{729k^{2}}}}

となる。

カイ二乗分布は再生性を持つ。すなわち、 X χ m 2 ,   Y χ n 2 {\displaystyle X\sim \chi _{m}^{2},\ Y\sim \chi _{n}^{2}} ならば、 X Y χ m n 2 {\displaystyle X Y\sim \chi _{m n}^{2}} となる。

正規分布による近似

X χ k 2 {\displaystyle X\sim \chi _{k}^{2}} として、k が無限大に近づくと X の分布は正規分布に近づくが、近づき方はゆっくりしている(歪度 8 k {\displaystyle {\sqrt {\frac {8}{k}}}} 、尖度 12/k)ため、X 自体より速く正規分布に近づく次の2つの方法が普通用いられる。

  • 2 X {\displaystyle {\sqrt {2X}}} は近似的に平均 √2k − 1、分散 1 の正規分布に従う(ロナルド・フィッシャー)。
  • X k 3 {\displaystyle {\sqrt[{3}]{\frac {X}{k}}}} は近似的に平均 1 − 2/9k、分散 2/9k の正規分布に従う(ウィルソンとヒルファティ、1931年)。

出典

関連項目

  • 確率分布
  • 確率密度関数
  • カイ二乗検定
  • 非心カイ二乗分布
  • ガンマ関数
  • ガンマ分布
  • 推計統計学

カイ二乗分布とは その意味と用途~制御工学の基礎あれこれ~

【統計学基礎】カイ二乗分布|Pythonでの描画方法も解説 DXCEL WAVE

カイ二乗分布 【Pythonで学ぶ統計】 バイオハッカー見習いバイオ研究生の備忘録

カイ二乗分布とその性質、Juliaによる計算方法 趣味の大学数学

カイ二乗検定とは何か ビジネスリサーチラボ