統計学基礎/確率分布/連続変数

提供: testwiki
2024年3月8日 (金) 15:04時点におけるimported>MathXploreによる版 (removed Category:統計学; added Category:確率分布 using HotCat)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
ナビゲーションに移動 検索に移動

一様分布

  • 確率密度関数

α,βα<βを満たす定数とする。αxβを満たすxに対し、

f(x)=1βα

と定める。このとき、

αβ1βαdx=[1βαx]αβ=1

を満たすので、このf(x)は確率密度関数である。この確率密度関数によって定まる確率分布を、一様分布という。

  • 期待値

期待値E(X)は、

E(X)=αβ1βαxdx=[12(βα)x2]αβ=β2α22(βα)=(βα)(β+α)2(βα)=β+α2

である。

  • 分散

分散V(X)は、

V(X)=αβ1βαx2dx(β+α2)2=[13(βα)x3]αβ(β+α2)2=β2+βα+α23β2+2βα+α24=β22βα+α212=(βα)212

である。

正規分布

  • 確率密度関数

実数xに対し、

f(x)=12πex22

と定める。このとき

I=f(x)dx

とすると

I2=12πex2+y22dxdy

であり、x=rcosθ,y=rsinθと極座標変換するとdxdy=|cosθrsinθsinθrcosθ|drdθ=rdrdθなので、

I2=12π02π(0er22rdr)dθ=12π02π([er22]0)dθ=12π02πdθ=1

である。I>0であることと併せて、I=1であることがわかる。すなわち、このf(x)は確率密度関数である。この確率密度関数によって定まる確率分布を、(標準)正規分布という。

  • 期待値

期待値E(X)は、

E(X)=12πxex22dx=12π[ex22]=0

である。

  • 分散

分散V(X)は、

V(X)=12πx2ex22dx=12π[xex22]+12πex22dx=1

である。

ガンマ分布

  • 確率密度関数

k,λを正の定数とする。正の数xに対し、

f(x)=λkΓ(k)xk1eλx

と定める。ただし、Γ(k)ガンマ関数である。このとき、

0λkΓ(k)xk1eλxdx=1Γ(k)0(λx)k1eλxλdx=Γ(k)Γ(k)=1

であるから、このf(x)は確率密度関数である。この確率密度関数によって定まる確率分布を、ガンマ分布という。

  • 期待値

期待値E(X)は、

E(X)=0λkΓ(k)xkeλxdx=[λk1Γ(k)xkeλx]0+kλΓ(k)0(λx)k1eλxλdx=kλ

である。

  • 分散

分散V(X)は、

V(X)=0λkΓ(k)xk+1eλxdx(kλ)2=[λk1Γ(k)xk+1eλx]0+(k+1)λk1Γ(k)0xkeλxdxk2λ2=[(k+1)λk2Γ(k)xkeλx]0+k(k+1)λ2Γ(k)0(λx)k1eλxλdxk2λ2=k(k+1)λ2k2λ2=kλ2

である。

ベータ分布

  • 確率密度関数

a.bを正の定数とする。0x1を満たすxに対し、

f(x)=xa1(1x)b1B(a,b)

と定める。ただし、B(a,b)ベータ関数である。このとき、

01xa1(1x)b1B(a,b)dx=B(a,b)B(a,b)=1

であるから、このf(x)は確率密度関数である。この確率密度関数によって定まる確率分布を、ベータ分布という。

  • 期待値

期待値E(X)は、

E(X)=1B(a,b)01xa(1x)b1dx=[1bB(a,b)xa(1x)b]01+abB(a,b)01xa1(1x)bdx=abB(a,b)01(xa1(1x)b1xa(1x)b1)dx=abB(a,b)(B(a,b)B(a,b)E(X))=ab(1E(X))

であるから、これを整理すると

E(X)=aa+b

が得られる。

  • 分散

分散V(X)は、

V(X)=1B(a,b)01xa+1(1x)b1dx(aa+b)2=[1bB(a,b)xa+1(1x)b]01+a+1bB(a,b)01xa(1x)bdxa2(a+b)2=a+1bB(a,b)01(xa(1x)b1xa+1(1x)b1)dxa2(a+b)2=a+1bB(a,b)(aB(a,b)a+bB(a,b)(V(X)+a2(a+b)2))a2(a+b)2=a(a+1)(a+b)a2(a+1)a2bb(a+b)2a+1bV(X)=a(a+b)2a+1bV(X)

であるから、これを整理すると

V(X)=ab(a+b+1)(a+b)2

が得られる。

指数分布

  • 確率密度関数

λを正の定数とする。正の数xに対し、

f(x)=λeλx

と定めると、

0λeλxdx=[eλx]0=1

なので、このf(x)は確率密度関数である。この確率密度関数によって定まる確率分布を、指数分布という。

  • 期待値

期待値E(X)は、

E(X)=0λxeλxdx=[xeλx]0+0eλxdx=[1λeλx]0=1λ

である。

  • 分散

分散V(X)は、

V(X)=0λx2eλxdx1λ2=[x2eλx]0+02xeλxdx1λ2=2λ1λ1λ2=1λ2

である。

カイ二乗分布

  • 確率密度関数

kを正整数の定数とする。正の数xに対し、

f(x)=xk21ex22k2Γ(k2)

と定める。ただし、Γ(k2)ガンマ関数である。このとき、

0xk21ex22k2Γ(k2)dx=1Γ(k2)0(x2)k21ex212dx=Γ(k2)Γ(k2)=1

なので、このf(x)は確率密度関数である。この確率密度関数によって定まる確率分布を、カイ二乗分布という。

  • 期待値

期待値E(X)は、

E(X)=0xk2ex22k2Γ(k2)dx=[xk2ex22k21Γ(k2)]0+k2k2Γ(k2)0xk21ex2dx=kΓ(k2)0(x2)k21ex212dx=kΓ(k2)Γ(k2)=k

である。

  • 分散

分散V(X)は、

V(X)=0xk2+1ex22k2Γ(k2)dxk2=[xk2+1ex22k21Γ(k2)]0+k2+12k21Γ(k2)0xk2ex2dxk2=(k+2)E(X)k2=(k+2)kk2=2k

である。

t分布

  • 確率密度関数

nを4以上の自然数とする。実数xに対して、

f(x)=1n1Γ(n2)Γ(12)Γ(n12)(1+x2n1)n2

と定める。ただし、Γガンマ関数である。このとき、x=n1tanθと置換するとdx=n1cos2θdθなので、

1n1Γ(n2)Γ(12)Γ(n12)(1+x2n1)n2dx=π2π21n1Γ(n2)Γ(12)Γ(n12)(1+tan2θ)n2n1cos2θdθ=Γ(n2)Γ(12)Γ(n12)π2π2cosn2θdθ=Γ(n2)Γ(12)Γ(n12)20π2cosn2θdθ=Γ(n2)Γ(12)Γ(n12)Γ(12)Γ(n12)Γ(n2)=1

である。ただし、途中補遺で導いた式

Γ(a)Γ(b)Γ(a+b)=20π2sin2a1θcos2b1θdθ

a=12,b=n12とした式を用いた。この計算より、このf(x)は確率密度関数である。この確率密度関数によって定まる確率分布を、t分布という。

  • 期待値

期待値E(X)は、

E(X)=1n1Γ(n2)Γ(12)Γ(n12)x(1+x2n1)n2dx=[n12nΓ(n2)Γ(12)Γ(n12)(1+x2n1)1n2]=0

である。

  • 分散

分散V(X)は、

V(X)=1n1Γ(n2)Γ(12)Γ(n12)x2(1+x2n1)n2dx=2n1Γ(n2)Γ(12)Γ(n12)0x2(1+x2n1)n2dx

である。ここで、1+x2n1=u1とおくと、x=(n1)(1u)uであり、2xn1dx=u2duよりdx=n12u32(1u)12duである。また、u|x=0=1,limxu=0である。よって、

V(X)=Γ(n2)Γ(12)Γ(n12)01(n1)(1u)uun2u32(1u)12du=(n1)Γ(n2)Γ(12)Γ(n12)01un52(1u)12du=(n1)Γ(n2)Γ(12)Γ(n12)B(n32,32)=(n1)Γ(32)Γ(12)Γ(n32)Γ(n12)=(n1)122n3=n1n3

である。ただし、途中補遺で導いた式

B(a,b)=Γ(a)Γ(b)Γ(a+b)

a=n32,b=32とした式を用いた。

F分布

  • 確率密度関数

d1,d2を正整数の定数とし、特にd2は4より大きいとする。正の数xに対し、

f(x)=1xB(d12,d22)(d1xd1x+d2)d12(1d1xd1x+d2)d22

と定める。ただし、B(d12,d22)ベータ関数である。

このとき、t=d1xd1x+d2と置くと、t|x=0=0,limxt=1であり、dt=d1d2(d1x+d2)2dx=t(1t)xdxであることに注意すると、

01xB(d12,d22)(d1xd1x+d2)d12(1d1xd1x+d2)d22dx=1B(d12,d22)01td121(1t)d221dt=B(d12,d22)B(d12,d22)=1

なので、このf(x)は確率密度関数である。この確率密度関数によって定まる確率分布を、F分布という。

  • 期待値

期待値E(X)は、

E(X)=01B(d12,d22)(d1xd1x+d2)d12(1d1xd1x+d2)d22dx

である。ここで、先ほどの置換をすると

x=d2td1(1t)

であることに注意すると、

E(X)=d2d1B(d12,d22)01td12(1t)d222dt=d2d1(d221)B(d12,d22)[td12(1t)d221]01+d2(d22)B(d12,d22)01td121(1t)d221dt=d2B(d12,d22)(d22)B(d12,d22)=d2d22

である。

  • 分散

分散V(X)は、

V(X)=0xB(d12,d22)(d1xd1x+d2)d12(1d1xd1x+d2)d22dx(d2d22)2

である。同様に、先ほどの置換をすると

V(X)=d22d12B(d12,d22)01td12+1(1t)d223dt(d2d22)2=d22d12(d222)B(d12,d22)[td12+1(1t)d222]01+d22(d12+1)d12(d222)B(d12,d22)01td12(1t)d222dt(d2d22)2=d2(d1+2)d1(d24)d2d22(d2d22)2=d22d22(d1+2d1(d24)1d22)=2d22(d1+d22)d1(d22)2(d24)

である。

パレート分布

  • 確率密度関数

a,ba>2,b>0の定数とする。xbを満たす実数xに対し、

f(x)=abaxa+1

と定めると、

babaxa+1dx=[baxa]b=1

なので、このf(x)は確率密度関数である。この確率密度関数によって定まる確率分布を、パレート分布という。

  • 期待値

期待値E(X)は、

E(X)=babaxadx=[aba(a1)xa1]b=aba1

である。

  • 分散

分散V(X)は、

V(X)=babaxa1dx(aba1)2=[aba(a2)xa2]ba2b2(a1)2=ab2a2a2b2(a1)2=ab2(a2)(a1)2

である。

補遺:ガンマ関数とベータ関数

  • ガンマ関数

正の数kに対して、積分

Γ(k)=0xk1exdx

ガンマ関数という。

この積分は広義積分であるから、収束性を確認しておこう。I0=01xk1exdx, I1=1xk1exdxのそれぞれが収束することを示せばよい。I0については、0<x1においてex<1よりxk1ex<xk1であり、01xk1dx=1kであるから、I0は収束する。I1については、limxxk1ex2=0であることに注意すると、ある正の数Mが存在して1xにおいてxk1ex2<Mであるから、xk1ex<Mex2であり、1Mex2dx=2Meであるから、I1は収束する。

ガンマ関数について、

Γ(k+1)=0xkexdx=[xkex]0+k0xk1exdx=kΓ(k)

が成り立つ。このことと、

Γ(1)=0exdx=[ex]0=1

であることを合わせると、自然数nに対しては

Γ(n)=(n1)!

であることがわかる。

  • ベータ関数

正の数a,bに対して、積分

B(a,b)=01xa1(1x)b1dx

ベータ関数という。

この積分は一見すると通常の積分であるが、0<a<1または0<b<1のときは端点での値が発散するので広義積分である。収束性を確認しておこう。I0=012xa1(1x)b1dx, I1=121xa1(1x)b1dxのそれぞれが収束することを示せばよい。I0については、0<x12において(1x)b1<2よりxa1(1x)b1<2xa1であり、0122xa1dx=12a1aであるから、I0は収束する。I1については、12x<1においてxa1<2よりxa1(1x)b1<2(1x)b1であり、1212(1x)b1dx=12b1bであるから、I1は収束する。

  • ガンマ関数とベータ関数の関係

ガンマ関数とベータ関数の間には、

B(a,b)=Γ(a)Γ(b)Γ(a+b)

という関係式が成り立つ。

(証明)
両辺ともに
20π2sin2a1θcos2b1θdθ
という積分と等しくなることを示す。
ベータ関数について、
B(a,b)=01xa1(1x)b1dx
においてx=sin2θとするとdx=2sinθcosθdθであるから、
B(a,b)=0π2sin2a2θ(1sin2θ)b12sinθcosθdθ=20π2sin2a1θcos2b1θdθ
である。
ガンマ関数について、
Γ(a)Γ(b)=0ya1eydy0xb1exdx=00xb1ya1exydxdy
において、x=(rcosθ)2,y=(rsinθ)2と変数変換すると、dxdy=|2rcos2θ2r2sinθcosθ2rsin2θ2r2sinθcosθ|drdθ=4r3sinθcosθdrdθであるから、
Γ(a)Γ(b)=40r2a+2b1er2dr0π2sin2a1θcos2b1θdθ
である。ここでさらにr2=tとすると、2rdr=dtであるから、
20r2a+2b1er2dr=0ta+b1etdt=Γ(a+b)
であることがわかるので、以上より
Γ(a)Γ(b)Γ(a+b)=20π2sin2a1θcos2b1θdθ
である。//

ここで、得られた関係式にa=2,b=2を代入してみよう。すると、左辺、右辺はそれぞれ

B(2,2)=01x(1x)dx
Γ(2)Γ(2)Γ(4)=1!1!3!=16

であり、これは大学受験数学でおなじみの1/6公式そのものである。他にも、

a=2,b=3とすると01x(1x)2dx=1!2!4!=112
a=3,b=3とすると01x2(1x)2dx=2!2!5!=130

なども、大学受験対策の公式として暗記した人もいるかもしれない。本節で示した関係式は、これらの公式を一般化したものといえるものである。