統計学基礎/確率分布/離散変数

提供: testwiki
ナビゲーションに移動 検索に移動

二項分布

  • 確率質量関数

1 回の試行で得られる結果が、α、β の2種類あるとする。 ここで1回の試行で α が得られる確率を θ とする。

n 回試行した時に α が k 回出る確率を f(k) とすると、

f(k)=(nk)θk(1θ)nk

と表すことができる。この分布を二項分布という。ただし、

(nk)=nCk=n!k!(nk)!

は n 個から k 個を選ぶ組合せの数(二項係数)である。二項分布という名前は、この二項係数にちなんでいる。
また n, θ (および1-θ)は定数である。このようなパラメータのことを母数という。θを母比率という。n,θが与えられれば,この分布は確定するので、この分布を B(n,θ) と表す。

このf(k)は、二項定理により

k=0n(nk)θk(1θ)nk=(θ+(1θ))n=1

を満たすので、確かに確率質量関数となっている。

  • 期待値

期待値 E(X)は、

E(X)=k=0nk(nk)θk(1θ)nk=k=1nkn!k!(nk)!θk(1θ)nk=k=1nn(n1)!(k1)!(nk)!θk(1θ)nk=nθk=1n(n1k1)θk1(1θ)nk=nθ(θ+(1θ))n1=nθ

である。

  • 分散

分散 V(X)は

V(X)=k=0nk2(nk)θk(1θ)nk(nθ)2=k=1n(k(k1)+k)(nk)θk(1θ)nk(nθ)2=k=2nk(k1)(nk)θk(1θ)nk+nθ(nθ)2=k=2nk(k1)n!k!(nk)!θk(1θ)nk+nθ(nθ)2=k=2nn(n1)(n2)!(k2)!(nk)!θk(1θ)nk+nθ(nθ)2=n(n1)θ2k=2n(n2k2)θk2(1θ)nk+nθ(nθ)2=n(n1)θ2(θ+(1θ))n2+nθ(nθ)2=nθ(1θ)

である。

負の二項分布

  • 確率質量関数

rを自然数の定数とし、p0<p<1を満たす実数の定数とする。0以上の整数kに対し、

f(k)=(k+r1k)(1p)rpk

と定める。ただし、(k+r1k)は二項係数である。このf(k)が確率質量関数であることは、以下のように確かめられる。

級数

k=0xk=11x

の両辺をr1階微分すると、

k=0(k+r1)!k!xk=(r1)!(1x)r

であるから、両辺にx=pを代入して(1p)r(r1)!をかけると、

k=0(k+r1k)(1p)rpk=1

を得る。

以上により、このf(k)が確率質量関数であることが確かめられた。この確率質量関数によって定まる確率分布を、負の二項分布という。

  • 期待値

期待値 E(X)は、

E(X)=k=0k(k+r1k)(1p)rpk=k=1k(k+r1k)(1p)rpk=k=1(k+r1)(k+r2k1)(1p)rpk=k=0(k+r)(k+r1k)(1p)rpk+1=p(k=0k(k+r1k)(1p)rpk+rk=0(k+r1k)(1p)rpk)=p(E(X)+r)

であるから、これを整理すると、

E(X)=pr1p

を得る。

  • 分散

分散 V(X)は、

V(X)=k=0k2(k+r1k)(1p)rpk(pr1p)2=k=0(k(k1)+k)(k+r1k)(1p)rpkp2r2(1p)2=k=2k(k1)(k+r1k)(1p)rpk+k=0k(k+r1k)(1p)rpkp2r2(1p)2=k=2(k+r1)(k+r2)(k+r3k2)(1p)rpk+pr1pp2r2(1p)2=k=0(k+r+1)(k+r)(k+r1k)(1p)rpk+2+pr1pp2r2(1p)2=p2(k=0k2(k+r1k)(1p)rpk+(2r+1)k=0k(k+r1k)(1p)rpk+r(r+1)k=0(k+r1k)(1p)rpk)+pr1pp2r2(1p)2=p2(V(X)+p2r2(1p)2+(2r+1)pr1p+r(r+1))+pr1pp2r2(1p)2=p2V(X)(1p2)p2r2(1p)2+pr(2p2r+p2+1)1p+p2r(r+1)=p2V(X)(1+p)p2r21p+pr(2p2r+p2+1)1p+(1p)p2r(r+1)1p=p2V(X)+pr(1+p)1p

であるから、これを整理すると、

V(X)=pr(1+p)(1p)(1p2)=pr(1p)2

を得る。

ポアソン分布

  • 確率質量関数

λを正の定数とする。0以上の整数kに対し、

f(k)=λkeλk!

と定める。このとき、

k=0λkeλk!=eλk=0λkk!=eλeλ=1

を満たすので、このf(k)は確率質量関数である。この確率質量関数によって定まる確率分布を、ポアソン分布という。

  • 期待値

期待値 E(X)は、

E(X)=k=0kλkeλk!=λeλk=1λk1(k1)!=λeλk=0λkk!=λeλeλ=λ

である。

  • 分散

分散 V(X)は、

V(X)=k=0k2λkeλk!λ2=k=0(k(k1)+k)λkeλk!λ2=k=2k(k1)λkeλk!+λλ2=λ2eλk=2λk2(k2)!+λλ2=λ2eλk=0λkk!+λλ2=λ2eλeλ+λλ2=λ

である。

超幾何分布

  • 確率質量関数

N,K,nは自然数の定数で、nKNnを満たすとする。0knを満たす自然数の定数kに対し、

f(k)=(Kk)(NKnk)(Nn)

と定める。ただし、(Nn)などは二項係数である。このf(k)が確率質量関数であることは、以下のように確かめられる。

xについての恒等式

(1+x)K(1+x)NK=(1+x)N

の両辺を展開したときのxnの項の係数を考えると、右辺の係数は二項定理により(Nn)である。一方左辺の係数は、

k=0n(Kk)(NKnk)

である。よって、

k=0n(Kk)(NKnk)=(Nn)
k=0n(Kk)(NKnk)(Nn)=1

である。

以上により、このf(k)が確率質量関数であることが確かめられた。この確率質量関数によって定まる確率分布を、超幾何分布という。

  • 期待値

期待値 E(X)は、

E(X)=k=0nk(Kk)(NKnk)(Nn)=k=1nk(Kk)(NKnk)(Nn)=k=1nK(K1k1)(NKnk)(Nn)=k=0n1K(K1k)(NKnk1)(Nn)=nKNk=0n1(K1k)(NKnk1)(N1n1)=nKNk=0n(Kk)(NKnk)(Nn)=nKN

である。ただし、6行目ではn=n1, K=K1, N=N1とした。

  • 分散

分散 V(X)は

V(X)=k=0nk2(Kk)(NKnk)(Nn)(nKN)2=k=0nk(k1)(Kk)(NKnk)(Nn)+nKNn2K2N2=k=2nk(k1)(Kk)(NKnk)(Nn)+nK(NnK)N2=k=2nK(K1)(K2k2)(NKnk)(Nn)+nK(NnK)N2=k=0n2K(K1)(K2k)(NKnk2)(Nn)+nK(NnK)N2=n(n1)K(K1)N(N1)k=0n2(K2k)(NKnk2)(N2n2)+nK(NnK)N2=n(n1)K(K1)N(N1)k=0n(Kk)(NKnk)(Nn)+nK(NnK)N2=n(n1)K(K1)N(N1)+nK(NnK)N2=nKN2(N1)(N(n1)(K1)+(NnK)(N1))=nKN2(N1)(N2(n+K)N+nK)=nK(NK)(Nn)N2(N1)

である。ただし、7行目ではn=n2, K=K2, N=N2とした。