統計学基礎/確率分布/連続変数のソースを表示
←
統計学基礎/確率分布/連続変数
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
== 一様分布 == * 確率密度関数 <math>\alpha,\beta</math>を<math>\alpha<\beta</math>を満たす定数とする。<math>\alpha \le x \le \beta</math>を満たす<math>x</math>に対し、 :<math>f(x)=\frac{1}{\beta-\alpha}</math> と定める。このとき、 :<math>\int_\alpha^\beta \frac{1}{\beta-\alpha} dx=\left[\frac{1}{\beta-\alpha} x \right]_\alpha^\beta=1</math> を満たすので、この<math>f(x)</math>は確率密度関数である。この確率密度関数によって定まる確率分布を、'''一様分布'''という。 * 期待値 期待値E(X)は、 :<math>\begin{align} E(X) &= \int_\alpha^\beta \frac{1}{\beta-\alpha} x dx \\ &= \left[\frac{1}{2(\beta-\alpha)} x^2 \right]_\alpha^\beta \\ &= \frac{\beta^2-\alpha^2}{2(\beta-\alpha)} \\ &= \frac{(\beta-\alpha)(\beta+\alpha)}{2(\beta-\alpha)} \\ &= \frac{\beta+\alpha}{2} \\ \end{align}</math> である。 * 分散 分散V(X)は、 :<math>\begin{align} V(X) &= \int_\alpha^\beta \frac{1}{\beta-\alpha} x^2 dx - \left(\frac{\beta+\alpha}{2}\right)^2 \\ &= \left[\frac{1}{3(\beta-\alpha)} x^3\right]_\alpha^\beta - \left(\frac{\beta+\alpha}{2}\right)^2 \\ &= \frac{\beta^2+\beta\alpha+\alpha^2}{3} - \frac{\beta^2+2\beta\alpha+\alpha^2}{4} \\ &= \frac{\beta^2-2\beta\alpha+\alpha^2}{12} \\ &= \frac{(\beta-\alpha)^2}{12} \end{align}</math> である。 == 正規分布 == * 確率密度関数 実数<math>x</math>に対し、 :<math>f(x)=\frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}</math> と定める。このとき :<math>I=\int_{-\infty}^\infty f(x) dx</math> とすると :<math>I^2=\frac{1}{2\pi}\int_{-\infty}^\infty\int_{-\infty}^\infty e^{-\frac{x^2+y^2}{2}} dxdy</math> であり、<math>x=r\cos\theta,y=r\sin\theta</math>と極座標変換すると<math>dxdy=\begin{vmatrix}\cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{vmatrix}drd\theta=rdrd\theta</math>なので、 :<math>\begin{align} I^2 &= \frac{1}{2\pi}\int_0^{2\pi}\left(\int_0^\infty e^{-\frac{r^2}{2}}rdr\right)d\theta \\ &= \frac{1}{2\pi}\int_0^{2\pi} \left(\left[-e^{-\frac{r^2}{2}}\right]_0^\infty\right) d\theta \\ &= \frac{1}{2\pi}\int_0^{2\pi} d\theta \\ &= 1 \end{align}</math> である。<math>I>0</math>であることと併せて、<math>I=1</math>であることがわかる。すなわち、この<math>f(x)</math>は確率密度関数である。この確率密度関数によって定まる確率分布を、'''(標準)正規分布'''という。 * 期待値 期待値E(X)は、 :<math>\begin{align} E(X) &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^\infty xe^{-\frac{x^2}{2}} dx \\ &= \frac{1}{\sqrt{2\pi}} \left[-e^{-\frac{x^2}{2}}\right]_{-\infty}^\infty \\ &= 0 \end{align}</math> である。 * 分散 分散V(X)は、 :<math>\begin{align} V(X) &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^\infty x^2e^{-\frac{x^2}{2}} dx \\ &= \frac{1}{\sqrt{2\pi}} \left[-xe^{-\frac{x^2}{2}}\right]_{-\infty}^\infty + \frac{1}{\sqrt{2\pi}} \int_{-\infty}^\infty e^{-\frac{x^2}{2}} dx \\ &= 1 \end{align}</math> である。 == ガンマ分布 == * 確率密度関数 <math>k,\lambda</math>を正の定数とする。正の数<math>x</math>に対し、 :<math>f(x)=\frac{\lambda^k}{\Gamma(k)}x^{k-1}e^{-\lambda x}</math> と定める。ただし、<math>\Gamma(k)</math>は[[#補遺:ガンマ関数とベータ関数|ガンマ関数]]である。このとき、 :<math>\int_0^\infty \frac{\lambda^k}{\Gamma(k)}x^{k-1}e^{-\lambda x}dx = \frac{1}{\Gamma(k)} \int_0^\infty (\lambda x)^{k-1} e^{-\lambda x} \lambda dx = \frac{\Gamma(k)}{\Gamma(k)}=1</math> であるから、この<math>f(x)</math>は確率密度関数である。この確率密度関数によって定まる確率分布を、'''ガンマ分布'''という。 * 期待値 期待値E(X)は、 :<math>\begin{align} E(X)&= \int_0^\infty \frac{\lambda^k}{\Gamma(k)} x^k e^{-\lambda x}dx \\ &= \left[-\frac{\lambda^{k-1}}{\Gamma(k)} x^k e^{-\lambda x} \right]_0^\infty +\frac{k}{\lambda \Gamma(k)}\int_0^\infty (\lambda x)^{k-1} e^{-\lambda x} \lambda dx \\ &= \frac{k}{\lambda} \end{align}</math> である。 * 分散 分散V(X)は、 :<math>\begin{align} V(X)&= \int_0^\infty \frac{\lambda^k}{\Gamma(k)} x^{k+1} e^{-\lambda x}dx -\left(\frac{k}{\lambda}\right)^2 \\ &= \left[ -\frac{\lambda^{k-1}}{\Gamma(k)} x^{k+1} e^{-\lambda x} \right]_0^\infty + \frac{(k+1)\lambda^{k-1}}{\Gamma(k)} \int_0^\infty x^k e^{-\lambda x} dx - \frac{k^2}{\lambda^2} \\ &= \left[ -\frac{(k+1)\lambda^{k-2}}{\Gamma(k)} x^k e^{-\lambda x} \right]_0^\infty + \frac{k(k+1)}{\lambda^2 \Gamma(k)} \int_0^\infty (\lambda x)^{k-1} e^{-\lambda x} \lambda dx - \frac{k^2}{\lambda^2} \\ &= \frac{k(k+1)}{\lambda^2} - \frac{k^2}{\lambda^2} \\ &= \frac{k}{\lambda^2} \end{align}</math> である。 == ベータ分布 == * 確率密度関数 <math>a.b</math>を正の定数とする。<math>0 \le x \le 1</math>を満たす<math>x</math>に対し、 :<math>f(x)=\frac{x^{a-1} (1-x)^{b-1}}{\Beta(a,b)}</math> と定める。ただし、<math>\Beta(a,b)</math>は[[#補遺:ガンマ関数とベータ関数|ベータ関数]]である。このとき、 :<math>\int_0^1 \frac{x^{a-1} (1-x)^{b-1}}{\Beta(a,b)} dx = \frac{\Beta(a,b)}{\Beta(a,b)} = 1</math> であるから、この<math>f(x)</math>は確率密度関数である。この確率密度関数によって定まる確率分布を、'''ベータ分布'''という。 * 期待値 期待値E(X)は、 :<math>\begin{align} E(X) &= \frac{1}{\Beta(a,b)} \int_0^1 x^a (1-x)^{b-1} dx \\ &= \left[ -\frac{1}{b\Beta(a,b)} x^a (1-x)^b \right]_0^1 + \frac{a}{b\Beta(a,b)} \int_0^1 x^{a-1} (1-x)^b dx \\ &= \frac{a}{b\Beta(a,b)} \int_0^1 \left(x^{a-1} (1-x)^{b-1}-x^a (1-x)^{b-1} \right) dx \\ &= \frac{a}{b\Beta(a,b)} \left(\Beta(a,b)-\Beta(a,b)E(X)\right) \\ &= \frac{a}{b} \left(1-E(X)\right) \end{align}</math> であるから、これを整理すると :<math>E(X) = \frac{a}{a+b}</math> が得られる。 * 分散 分散V(X)は、 :<math>\begin{align} V(X) &= \frac{1}{\Beta(a,b)} \int_0^1 x^{a+1} (1-x)^{b-1} dx - \left(\frac{a}{a+b}\right)^2 \\ &= \left[ -\frac{1}{b\Beta(a,b)} x^{a+1} (1-x)^b \right]_0^1 + \frac{a+1}{b\Beta(a,b)} \int_0^1 x^a (1-x)^b dx - \frac{a^2}{(a+b)^2} \\ &= \frac{a+1}{b\Beta(a,b)} \int_0^1 \left(x^a (1-x)^{b-1}-x^{a+1}(1-x)^{b-1} \right) dx - \frac{a^2}{(a+b)^2} \\ &= \frac{a+1}{b\Beta(a,b)} \left(\frac{a\Beta(a,b)}{a+b}-\Beta(a,b)\left(V(X)+\frac{a^2}{(a+b)^2}\right)\right) - \frac{a^2}{(a+b)^2} \\ &= \frac{a(a+1)(a+b)-a^2(a+1)-a^2 b}{b(a+b)^2} - \frac{a+1}{b} V(X) \\ &= \frac{a}{(a+b)^2} - \frac{a+1}{b} V(X) \\ \end{align}</math> であるから、これを整理すると :<math>V(X)=\frac{ab}{(a+b+1)(a+b)^2}</math> が得られる。 == 指数分布 == * 確率密度関数 <math>\lambda</math>を正の定数とする。正の数<math>x</math>に対し、 :<math>f(x)=\lambda e^{-\lambda x}</math> と定めると、 :<math>\int_0^\infty \lambda e^{-\lambda x} dx = \left[-e^{-\lambda x} \right]_0^\infty = 1</math> なので、この<math>f(x)</math>は確率密度関数である。この確率密度関数によって定まる確率分布を、'''指数分布'''という。 * 期待値 期待値E(X)は、 :<math>\begin{align} E(X) &= \int_0^\infty \lambda xe^{-\lambda x} dx \\ &= \left[-xe^{-\lambda x}\right]_0^\infty + \int_0^\infty e^{-\lambda x} dx \\ &= \left[-\frac{1}{\lambda} e^{-\lambda x} \right]_0^\infty \\ &= \frac{1}{\lambda} \end{align}</math> である。 * 分散 分散V(X)は、 :<math>\begin{align} V(X) &= \int_0^\infty \lambda x^2e^{-\lambda x} dx-\frac{1}{\lambda^2} \\ &= \left[-x^2 e^{-\lambda x}\right]_0^\infty + \int_0^\infty 2xe^{-\lambda x} dx -\frac{1}{\lambda^2} \\ &= \frac{2}{\lambda}\frac{1}{\lambda}-\frac{1}{\lambda^2} \\ &= \frac{1}{\lambda^2} \end{align}</math> である。 == カイ二乗分布 == * 確率密度関数 <math>k</math>を正整数の定数とする。正の数<math>x</math>に対し、 :<math>f(x)=\frac{x^{\frac{k}{2}-1} e^{-\frac{x}{2}}}{2^\frac{k}{2} \Gamma\left(\frac{k}{2}\right)}</math> と定める。ただし、<math>\Gamma\left(\frac{k}{2}\right)</math>は[[#補遺:ガンマ関数とベータ関数|ガンマ関数]]である。このとき、 :<math>\int_0^\infty \frac{x^{\frac{k}{2}-1} e^{-\frac{x}{2}}}{2^\frac{k}{2} \Gamma\left(\frac{k}{2}\right)} dx = \frac{1}{\Gamma\left(\frac{k}{2}\right)} \int_0^\infty \left(\frac{x}{2}\right)^{\frac{k}{2}-1} e^{-\frac{x}{2}} \frac{1}{2} dx = \frac{\Gamma\left(\frac{k}{2}\right)}{\Gamma\left(\frac{k}{2}\right)} = 1</math> なので、この<math>f(x)</math>は確率密度関数である。この確率密度関数によって定まる確率分布を、'''カイ二乗分布'''という。 * 期待値 期待値E(X)は、 :<math>\begin{align} E(X)&= \int_0^\infty \frac{x^\frac{k}{2} e^{-\frac{x}{2}}}{2^\frac{k}{2} \Gamma\left(\frac{k}{2}\right)} dx \\ &= \left[ -\frac{x^\frac{k}{2} e^{-\frac{x}{2}}}{2^{\frac{k}{2}-1} \Gamma\left(\frac{k}{2}\right)} \right]_0^\infty + \frac{k}{2^\frac{k}{2} \Gamma\left(\frac{k}{2}\right)} \int_0^\infty x^{\frac{k}{2}-1} e^{-\frac{x}{2}} dx \\ &= \frac{k}{\Gamma\left(\frac{k}{2}\right)} \int_0^\infty \left(\frac{x}{2}\right)^{\frac{k}{2}-1} e^{-\frac{x}{2}} \frac{1}{2} dx \\ &= \frac{k\Gamma\left(\frac{k}{2}\right)}{\Gamma\left(\frac{k}{2}\right)} \\ &= k \end{align}</math> である。 * 分散 分散V(X)は、 :<math>\begin{align} V(X)&= \int_0^\infty \frac{x^{\frac{k}{2}+1} e^{-\frac{x}{2}}}{2^\frac{k}{2} \Gamma\left(\frac{k}{2}\right)} dx - k^2 \\ &= \left[ -\frac{x^{\frac{k}{2}+1} e^{-\frac{x}{2}}}{2^{\frac{k}{2}-1} \Gamma\left(\frac{k}{2}\right)} \right]_0^\infty + \frac{\frac{k}{2}+1}{2^{\frac{k}{2}-1} \Gamma\left(\frac{k}{2}\right)}\int_0^\infty x^\frac{k}{2} e^{-\frac{x}{2}} dx - k^2 \\ &= (k+2)E(X)-k^2 \\ &= (k+2)k-k^2 \\ &= 2k \end{align}</math> である。 == t分布 == * 確率密度関数 <math>n</math>を4以上の自然数とする。実数<math>x</math>に対して、 :<math>f(x)=\frac{1}{\sqrt{n-1}}\frac{\Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{n-1}{2}\right)}\left(1+\frac{x^2}{n-1}\right)^{-\frac{n}{2}}</math> と定める。ただし、<math>\Gamma</math>は[[#補遺:ガンマ関数とベータ関数|ガンマ関数]]である。このとき、<math>x=\sqrt{n-1}\tan\theta</math>と置換すると<math>dx=\frac{\sqrt{n-1}}{\cos^2\theta}d\theta</math>なので、 :<math>\begin{align} \int_{-\infty}^\infty \frac{1}{\sqrt{n-1}}\frac{\Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{n-1}{2}\right)}\left(1+\frac{x^2}{n-1}\right)^{-\frac{n}{2}} dx &= \int_{-\frac{\pi}{2}}^\frac{\pi}{2} \frac{1}{\sqrt{n-1}}\frac{\Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{n-1}{2}\right)} (1+\tan^2\theta)^{-\frac{n}{2}} \frac{\sqrt{n-1}}{\cos^2\theta}d\theta \\ &= \frac{\Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{n-1}{2}\right)} \int_{-\frac{\pi}{2}}^\frac{\pi}{2} \cos^{n-2}\theta d\theta \\ &= \frac{\Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{n-1}{2}\right)} 2 \int_0^\frac{\pi}{2} \cos^{n-2}\theta d\theta \\ &= \frac{\Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{n-1}{2}\right)} \frac{\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{n-1}{2}\right)}{\Gamma\left(\frac{n}{2}\right)} \\ &=1 \end{align}</math> である。ただし、途中[[#補遺:ガンマ関数とベータ関数|補遺]]で導いた式 :<math>\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}=2 \int_0^\frac{\pi}{2} \sin^{2a-1}\theta \cos^{2b-1}\theta d\theta</math> で<math>a=\frac{1}{2},b=\frac{n-1}{2}</math>とした式を用いた。この計算より、この<math>f(x)</math>は確率密度関数である。この確率密度関数によって定まる確率分布を、'''t分布'''という。 * 期待値 期待値E(X)は、 :<math>\begin{align} E(X)&= \int_{-\infty}^\infty \frac{1}{\sqrt{n-1}}\frac{\Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{n-1}{2}\right)}x\left(1+\frac{x^2}{n-1}\right)^{-\frac{n}{2}} dx \\ &= \left[ \frac{\sqrt{n-1}}{2-n}\frac{\Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{n-1}{2}\right)}\left(1+\frac{x^2}{n-1}\right)^{1-\frac{n}{2}} \right]_{-\infty}^\infty \\ &=0 \end{align}</math> である。 * 分散 分散V(X)は、 :<math>\begin{align} V(X)&= \int_{-\infty}^\infty \frac{1}{\sqrt{n-1}}\frac{\Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{n-1}{2}\right)}x^2\left(1+\frac{x^2}{n-1}\right)^{-\frac{n}{2}} dx \\ &= \frac{2}{\sqrt{n-1}}\frac{\Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{n-1}{2}\right)} \int_0^\infty x^2\left(1+\frac{x^2}{n-1}\right)^{-\frac{n}{2}} dx \end{align}</math> である。ここで、<math>1+\frac{x^2}{n-1}=u^{-1}</math>とおくと、<math>x=\sqrt{\frac{(n-1)(1-u)}{u}}</math>であり、<math>\frac{2x}{n-1} dx = -u^{-2} du</math>より<math>dx=-\frac{\sqrt{n-1}}{2} u^{-\frac{3}{2}}(1-u)^{-\frac{1}{2}} du</math>である。また、<math>u|_{x=0}=1,\lim_{x \to \infty} u=0</math>である。よって、 :<math>\begin{align} V(X)&= \frac{\Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{n-1}{2}\right)} \int_0^1 \frac{(n-1)(1-u)}{u} u^{\frac{n}{2}} u^{-\frac{3}{2}}(1-u)^{-\frac{1}{2}} du \\ &= \frac{(n-1)\Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{n-1}{2}\right)} \int_0^1 u^{\frac{n-5}{2}}(1-u)^{\frac{1}{2}} du \\ &= \frac{(n-1)\Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{n-1}{2}\right)} \Beta\left(\frac{n-3}{2},\frac{3}{2}\right) \\ &= (n-1) \frac{\Gamma\left(\frac{3}{2}\right)}{\Gamma\left(\frac{1}{2}\right)}\frac{\Gamma\left(\frac{n-3}{2}\right)}{\Gamma\left(\frac{n-1}{2}\right)} \\ &= (n-1) \frac{1}{2} \frac{2}{n-3} \\ &= \frac{n-1}{n-3} \\ \end{align}</math> である。ただし、途中[[#補遺:ガンマ関数とベータ関数|補遺]]で導いた式 :<math> \Beta(a,b)=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}</math> で<math>a=\frac{n-3}{2},b=\frac{3}{2}</math>とした式を用いた。 == F分布 == * 確率密度関数 <math>d_1,d_2</math>を正整数の定数とし、特に<math>d_2</math>は4より大きいとする。正の数<math>x</math>に対し、 :<math>f(x)=\frac{1}{x \Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)}\left(\frac{d_1x}{d_1x+d_2}\right)^\frac{d_1}{2} \left(1-\frac{d_1x}{d_1x+d_2}\right)^\frac{d_2}{2}</math> と定める。ただし、<math>\Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)</math>は[[#補遺:ガンマ関数とベータ関数|ベータ関数]]である。 このとき、<math>t=\frac{d_1x}{d_1x+d_2}</math>と置くと、<math>t|_{x=0}=0,\lim_{x \to \infty}t=1</math>であり、<math>dt=\frac{d_1d_2}{(d_1x+d_2)^2}dx= \frac{t(1-t)}{x} dx</math>であることに注意すると、 :<math>\begin{align} & \int_0^\infty \frac{1}{x \Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)}\left(\frac{d_1x}{d_1x+d_2}\right)^\frac{d_1}{2} \left(1-\frac{d_1x}{d_1x+d_2}\right)^\frac{d_2}{2} dx \\ &= \frac{1}{\Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)} \int_0^1 t^{\frac{d_1}{2}-1}(1-t)^{\frac{d_2}{2}-1} dt \\ &= \frac{\Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)}{\Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)} \\ &= 1 \end{align}</math> なので、この<math>f(x)</math>は確率密度関数である。この確率密度関数によって定まる確率分布を、'''F分布'''という。 * 期待値 期待値E(X)は、 :<math>E(X)= \int_0^\infty \frac{1}{\Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)}\left(\frac{d_1x}{d_1x+d_2}\right)^\frac{d_1}{2} \left(1-\frac{d_1x}{d_1x+d_2}\right)^\frac{d_2}{2} dx </math> である。ここで、先ほどの置換をすると :<math>x=\frac{d_2t}{d_1(1-t)}</math> であることに注意すると、 :<math>\begin{align} E(X)&= \frac{d_2}{d_1\Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)} \int_0^1 t^\frac{d_1}{2} (1-t)^{\frac{d_2}{2}-2} dt \\ &= -\frac{d_2}{d_1\left(\frac{d_2}{2}-1\right)\Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)} \left[ t^\frac{d_1}{2} (1-t)^{\frac{d_2}{2}-1} \right]_0^1 + \frac{d_2}{(d_2-2)\Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)} \int_0^1 t^{\frac{d_1}{2}-1} (1-t)^{\frac{d_2}{2}-1} dt \\ &= \frac{d_2 \Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)}{(d_2-2)\Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)} \\ &= \frac{d_2}{d_2-2} \end{align}</math> である。 * 分散 分散V(X)は、 :<math>V(X)= \int_0^\infty \frac{x}{\Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)}\left(\frac{d_1x}{d_1x+d_2}\right)^\frac{d_1}{2} \left(1-\frac{d_1x}{d_1x+d_2}\right)^\frac{d_2}{2} dx - \left( \frac{d_2}{d_2-2} \right)^2</math> である。同様に、先ほどの置換をすると :<math>\begin{align} V(X)&= \frac{d_2^2}{d_1^2\Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)} \int_0^1 t^{\frac{d_1}{2}+1} (1-t)^{\frac{d_2}{2}-3} dt - \left( \frac{d_2}{d_2-2} \right)^2 \\ &= -\frac{d_2^2}{d_1^2\left(\frac{d_2}{2}-2\right)\Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)}\left[ t^{\frac{d_1}{2}+1} (1-t)^{\frac{d_2}{2}-2} \right]_0^1 + \frac{d_2^2 \left(\frac{d_1}{2}+1\right)}{d_1^2\left(\frac{d_2}{2}-2\right)\Beta\left(\frac{d_1}{2},\frac{d_2}{2}\right)} \int_0^1 t^\frac{d_1}{2} (1-t)^{\frac{d_2}{2}-2}dt - \left( \frac{d_2}{d_2-2} \right)^2 \\ &= \frac{d_2(d_1+2)}{d_1(d_2-4)}\frac{d_2}{d_2-2} - \left( \frac{d_2}{d_2-2} \right)^2 \\ &= \frac{d_2^2}{d_2-2} \left( \frac{d_1+2}{d_1(d_2-4)}-\frac{1}{d_2-2} \right) \\ &= \frac{2 d_2^2(d_1+d_2-2)}{d_1(d_2-2)^2(d_2-4)} \end{align}</math> である。 == パレート分布 == * 確率密度関数 <math>a,b</math>を<math>a>2,b>0</math>の定数とする。<math>x \ge b</math>を満たす実数<math>x</math>に対し、 :<math>f(x)=\frac{ab^a}{x^{a+1}}</math> と定めると、 :<math>\int_b^\infty \frac{ab^a}{x^{a+1}} dx = \left[-\frac{b^a}{x^a} \right]_b^\infty = 1</math> なので、この<math>f(x)</math>は確率密度関数である。この確率密度関数によって定まる確率分布を、'''パレート分布'''という。 * 期待値 期待値E(X)は、 :<math>\begin{align} E(X)&= \int_b^\infty \frac{ab^a}{x^a} dx \\ &= \left[ -\frac{ab^a}{(a-1)x^{a-1}} \right]_b^\infty \\ &= \frac{ab}{a-1} \end{align}</math> である。 * 分散 分散V(X)は、 :<math>\begin{align} V(X)&= \int_b^\infty \frac{ab^a}{x^{a-1}} dx - \left( \frac{ab}{a-1} \right)^2 \\ &= \left[-\frac{ab^a}{(a-2)x^{a-2}} \right]_b^\infty - \frac{a^2b^2}{(a-1)^2} \\ &= \frac{ab^2}{a-2} - \frac{a^2b^2}{(a-1)^2} \\ &= \frac{ab^2}{(a-2)(a-1)^2} \end{align}</math> である。 == 補遺:ガンマ関数とベータ関数 == * ガンマ関数 正の数<math>k</math>に対して、積分 :<math>\Gamma(k)=\int_0^\infty x^{k-1} e^{-x} dx</math> を'''ガンマ関数'''という。 この積分は広義積分であるから、収束性を確認しておこう。<math>I_0=\int_0^1 x^{k-1} e^{-x} dx,\ I_1=\int_1^\infty x^{k-1} e^{-x} dx</math>のそれぞれが収束することを示せばよい。<math>I_0</math>については、<math>0 < x \le 1</math>において<math>e^{-x} < 1</math>より<math>x^{k-1} e^{-x}<x^{k-1}</math>であり、<math>\int_0^1 x^{k-1} dx = \frac{1}{k}</math>であるから、<math>I_0</math>は収束する。<math>I_1</math>については、<math>\lim_{x \to \infty}x^{k-1} e^{-\frac{x}{2}}=0</math>であることに注意すると、ある正の数<math>M</math>が存在して<math>1 \le x</math>において<math>x^{k-1} e^{-\frac{x}{2}}<M</math>であるから、<math>x^{k-1} e^{-x}<Me^{-\frac{x}{2}}</math>であり、<math>\int_1^\infty Me^{-\frac{x}{2}} dx = \frac{2M}{\sqrt{e}}</math>であるから、<math>I_1</math>は収束する。 ガンマ関数について、 :<math>\begin{align} \Gamma(k+1)&= \int_0^\infty x^k e^{-x} dx \\ &= \left[ - x^k e^{-x} \right]_0^\infty +k \int_0^\infty x^{k-1} e^{-x} dx \\ &= k\Gamma(k) \end{align}</math> が成り立つ。このことと、 :<math>\Gamma(1) = \int_0^\infty e^{-x} dx = \left[ -e^{-x} \right]_0^\infty =1</math> であることを合わせると、自然数<math>n</math>に対しては :<math>\Gamma(n) = (n-1)!</math> であることがわかる。 * ベータ関数 正の数<math>a,b</math>に対して、積分 :<math>\Beta(a,b)=\int_0^1 x^{a-1} (1-x)^{b-1} dx</math> を'''ベータ関数'''という。 この積分は一見すると通常の積分であるが、<math>0<a<1</math>または<math>0<b<1</math>のときは端点での値が発散するので広義積分である。収束性を確認しておこう。<math>I_0=\int_0^\frac{1}{2} x^{a-1} (1-x)^{b-1} dx,\ I_1=\int_\frac{1}{2}^1 x^{a-1} (1-x)^{b-1} dx</math>のそれぞれが収束することを示せばよい。<math>I_0</math>については、<math>0 < x \le \frac{1}{2}</math>において<math>(1-x)^{b-1} < 2</math>より<math>x^{a-1} (1-x)^{b-1} < 2x^{a-1}</math>であり、<math>\int_0^\frac{1}{2} 2x^{a-1} dx = \frac{1}{2^{a-1} a}</math>であるから、<math>I_0</math>は収束する。<math>I_1</math>については、<math>\frac{1}{2} \le x < 1</math>において<math>x^{a-1} < 2</math>より<math>x^{a-1} (1-x)^{b-1} < 2(1-x)^{b-1}</math>であり、<math>\int_\frac{1}{2}^1 2(1-x)^{b-1} dx = \frac{1}{2^{b-1} b}</math>であるから、<math>I_1</math>は収束する。 * ガンマ関数とベータ関数の関係 ガンマ関数とベータ関数の間には、 :<math> \Beta(a,b)=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}</math> という関係式が成り立つ。 :(証明) :両辺ともに ::<math>2 \int_0^\frac{\pi}{2} \sin^{2a-1}\theta \cos^{2b-1}\theta d\theta</math> :という積分と等しくなることを示す。 :ベータ関数について、 ::<math>\Beta(a,b)=\int_0^1 x^{a-1} (1-x)^{b-1} dx</math> :において<math>x=\sin^2\theta</math>とすると<math>dx=2\sin\theta\cos\theta d\theta</math>であるから、 ::<math>\Beta(a,b)=\int_0^\frac{\pi}{2} \sin^{2a-2}\theta (1-\sin^2\theta)^{b-1} 2\sin\theta\cos\theta d\theta=2 \int_0^\frac{\pi}{2} \sin^{2a-1}\theta \cos^{2b-1}\theta d\theta</math> :である。 :ガンマ関数について、 ::<math>\Gamma(a)\Gamma(b) = \int_0^\infty y^{a-1} e^{-y} dy \int_0^\infty x^{b-1} e^{-x} dx = \int_0^\infty \int_0^\infty x^{b-1} y^{a-1} e^{-x-y} dxdy</math> :において、<math>x=(r\cos\theta)^2,y=(r\sin\theta)^2</math>と変数変換すると、<math>dxdy=\begin{vmatrix}2r\cos^2\theta & -2r^2\sin\theta\cos\theta \\ 2r\sin^2\theta & 2r^2\sin\theta\cos\theta \end{vmatrix}drd\theta= 4r^3\sin\theta\cos\theta drd\theta</math>であるから、 ::<math>\Gamma(a)\Gamma(b) =4 \int_0^\infty r^{2a+2b-1} e^{-r^2} dr \int_0^\frac{\pi}{2} \sin^{2a-1}\theta \cos^{2b-1}\theta d\theta</math> :である。ここでさらに<math>r^2=t</math>とすると、<math>2rdr=dt</math>であるから、 ::<math>2\int_0^\infty r^{2a+2b-1} e^{-r^2} dr=\int_0^\infty t^{a+b-1}e^{-t} dt=\Gamma(a+b)</math> :であることがわかるので、以上より ::<math>\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}=2 \int_0^\frac{\pi}{2} \sin^{2a-1}\theta \cos^{2b-1}\theta d\theta</math> :である。// ここで、得られた関係式に<math>a=2,b=2</math>を代入してみよう。すると、左辺、右辺はそれぞれ :<math>\Beta(2,2)=\int_0^1 x (1-x) dx</math> :<math>\frac{\Gamma(2)\Gamma(2)}{\Gamma(4)}=\frac{1!1!}{3!}=\frac{1}{6}</math> であり、これは大学受験数学でおなじみの1/6公式そのものである。他にも、 :<math>a=2,b=3</math>とすると<math>\int_0^1 x (1-x)^2 dx = \frac{1!2!}{4!}=\frac{1}{12}</math> :<math>a=3,b=3</math>とすると<math>\int_0^1 x^2 (1-x)^2 dx = \frac{2!2!}{5!}=\frac{1}{30}</math> なども、大学受験対策の公式として暗記した人もいるかもしれない。本節で示した関係式は、これらの公式を一般化したものといえるものである。 [[カテゴリ:確率分布]]
統計学基礎/確率分布/連続変数
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報