統計学基礎/確率分布/離散変数のソースを表示
←
統計学基礎/確率分布/離散変数
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
== 二項分布 == * 確率質量関数 1 回の試行で得られる結果が、α、β の2種類あるとする。 ここで1回の試行で α が得られる確率を θ とする。 n 回試行した時に α が k 回出る確率を f(k) とすると、 :<math> f(k) = {n\choose k} \theta^k(1-\theta)^{n-k} </math> と表すことができる。この分布を'''二項分布'''という。ただし、 :<math>{n\choose k} = {}_n C_k =\frac{n!}{k!(n-k)!}</math> は n 個から k 個を選ぶ組合せの数(二項係数)である。二項分布という名前は、この二項係数にちなんでいる。<br /> また n, θ (および1-θ)は定数である。このようなパラメータのことを母数という。θを母比率という。n,θが与えられれば,この分布は確定するので、この分布を B(n,θ) と表す。 この<math>f(k)</math>は、二項定理により :<math>\sum_{k=0}^n {n\choose k}\theta^k(1-\theta)^{n-k} = (\theta+(1-\theta))^n = 1</math> を満たすので、確かに確率質量関数となっている。 * 期待値 期待値 E(X)は、 :<math>\begin{align} E(X)&= \sum_{k=0}^n k {n\choose k} \theta^k(1-\theta)^{n-k} \\ &= \sum_{k=1}^n k \frac{n!}{k!(n-k)!} \theta^k(1-\theta)^{n-k} \\ &= \sum_{k=1}^n n \frac{(n-1)!}{(k-1)!(n-k)!} \theta^k(1-\theta)^{n-k} \\ &= n\theta \sum_{k=1}^n {n-1 \choose k-1} \theta^{k-1}(1-\theta)^{n-k} \\ &= n\theta (\theta+(1-\theta))^{n-1} \\ &= n\theta \end{align}</math> である。 * 分散 分散 V(X)は :<math>\begin{align} V(X)&= \sum_{k=0}^n k^2 {n\choose k} \theta^k(1-\theta)^{n-k} -(n\theta)^2 \\ &= \sum_{k=1}^n (k(k-1)+k) {n\choose k} \theta^k(1-\theta)^{n-k} -(n\theta)^2 \\ &= \sum_{k=2}^n k(k-1) {n\choose k} \theta^k(1-\theta)^{n-k} +n\theta -(n\theta)^2 \\ &= \sum_{k=2}^n k(k-1) \frac{n!}{k!(n-k)!} \theta^k(1-\theta)^{n-k} +n\theta -(n\theta)^2 \\ &= \sum_{k=2}^n n(n-1) \frac{(n-2)!}{(k-2)!(n-k)!} \theta^k(1-\theta)^{n-k} +n\theta -(n\theta)^2 \\ &= n(n-1)\theta^2\sum_{k=2}^n {n-2 \choose k-2} \theta^{k-2}(1-\theta)^{n-k} +n\theta -(n\theta)^2 \\ &= n(n-1)\theta^2(\theta+(1-\theta))^{n-2} +n\theta-(n\theta)^2 \\ &= n\theta(1-\theta) \end{align}</math> である。 == 負の二項分布 == * 確率質量関数 <math>r</math>を自然数の定数とし、<math>p</math>を<math>0<p<1</math>を満たす実数の定数とする。0以上の整数<math>k</math>に対し、 :<math>f(k)={k+r-1 \choose k}(1-p)^r p^k</math> と定める。ただし、<math>{k+r-1 \choose k}</math>は二項係数である。この<math>f(k)</math>が確率質量関数であることは、以下のように確かめられる。 級数 :<math>\sum_{k=0}^\infty x^k = \frac{1}{1-x}</math> の両辺を<math>r-1</math>階微分すると、 :<math>\sum_{k=0}^\infty \frac{(k+r-1)!}{k!} x^k =\frac{(r-1)!}{(1-x)^r}</math> であるから、両辺に<math>x=p</math>を代入して<math>\frac{(1-p)^r}{(r-1)!}</math>をかけると、 :<math>\sum_{k=0}^\infty {k+r-1 \choose k}(1-p)^r p^k=1</math> を得る。 以上により、この<math>f(k)</math>が確率質量関数であることが確かめられた。この確率質量関数によって定まる確率分布を、'''負の二項分布'''という。 * 期待値 期待値 E(X)は、 :<math>\begin{align} E(X) &= \sum_{k=0}^\infty k {k+r-1 \choose k}(1-p)^r p^k \\ &= \sum_{k=1}^\infty k {k+r-1 \choose k}(1-p)^r p^k \\ &= \sum_{k=1}^\infty (k+r-1) {k+r-2 \choose k-1} (1-p)^r p^k \\ &= \sum_{k=0}^\infty (k+r) {k+r-1 \choose k} (1-p)^r p^{k+1} \\ &= p\left( \sum_{k=0}^\infty k {k+r-1 \choose k}(1-p)^r p^k + r\sum_{k=0}^\infty{k+r-1 \choose k}(1-p)^r p^k\right) \\ &= p(E(X)+r) \\ \end{align}</math> であるから、これを整理すると、 :<math>E(X)=\frac{pr}{1-p}</math> を得る。 * 分散 分散 V(X)は、 :<math>\begin{align} V(X) &= \sum_{k=0}^\infty k^2 {k+r-1 \choose k}(1-p)^r p^k - \left(\frac{pr}{1-p}\right)^2\\ &= \sum_{k=0}^\infty (k(k-1)+k){k+r-1 \choose k}(1-p)^r p^k - \frac{p^2r^2}{(1-p)^2} \\ &= \sum_{k=2}^\infty k(k-1) {k+r-1 \choose k}(1-p)^r p^k + \sum_{k=0}^\infty k {k+r-1 \choose k}(1-p)^r p^k - \frac{p^2r^2}{(1-p)^2} \\ &= \sum_{k=2}^\infty (k+r-1)(k+r-2) {k+r-3 \choose k-2}(1-p)^r p^k + \frac{pr}{1-p} - \frac{p^2r^2}{(1-p)^2} \\ &= \sum_{k=0}^\infty (k+r+1)(k+r) {k+r-1 \choose k}(1-p)^r p^{k+2} + \frac{pr}{1-p} - \frac{p^2r^2}{(1-p)^2} \\ &= p^2\left( \sum_{k=0}^\infty k^2 {k+r-1 \choose k}(1-p)^r p^k + (2r+1) \sum_{k=0}^\infty k {k+r-1 \choose k}(1-p)^r p^k+r(r+1) \sum_{k=0}^\infty {k+r-1 \choose k}(1-p)^r p^k\right) + \frac{pr}{1-p} - \frac{p^2r^2}{(1-p)^2} \\ &=p^2\left(V(X)+\frac{p^2r^2}{(1-p)^2}+\frac{(2r+1)pr}{1-p}+r(r+1)\right) + \frac{pr}{1-p} - \frac{p^2r^2}{(1-p)^2} \\ &=p^2 V(X)-\frac{(1-p^2)p^2r^2}{(1-p)^2}+\frac{pr(2p^2r+p^2+1)}{1-p}+p^2r(r+1) \\ &=p^2 V(X)-\frac{(1+p)p^2r^2}{1-p}+\frac{pr(2p^2r+p^2+1)}{1-p}+\frac{(1-p)p^2r(r+1)}{1-p} \\ &=p^2 V(X)+\frac{pr(1+p)}{1-p} \\ \end{align}</math> であるから、これを整理すると、 :<math>V(X) = \frac{pr(1+p)}{(1-p)(1-p^2)} = \frac{pr}{(1-p)^2}</math> を得る。 == ポアソン分布 == * 確率質量関数 <math>\lambda</math>を正の定数とする。0以上の整数<math>k</math>に対し、 :<math>f(k)=\frac{\lambda^k e^{-\lambda}}{k!}</math> と定める。このとき、 :<math>\sum_{k=0}^\infty \frac{\lambda^k e^{-\lambda}}{k!}=e^{-\lambda} \sum_{k=0}^\infty \frac{\lambda^k}{k!} = e^{-\lambda}e^{\lambda} =1</math> を満たすので、この<math>f(k)</math>は確率質量関数である。この確率質量関数によって定まる確率分布を、'''ポアソン分布'''という。 * 期待値 期待値 E(X)は、 :<math>\begin{align} E(X) &= \sum_{k=0}^\infty k\frac{\lambda^k e^{-\lambda}}{k!} \\ &= \lambda e^{-\lambda} \sum_{k=1}^\infty \frac{\lambda^{k-1}}{(k-1)!} \\ &= \lambda e^{-\lambda} \sum_{k=0}^\infty \frac{\lambda^k}{k!} \\ &= \lambda e^{-\lambda} e^{\lambda} \\ &= \lambda \end{align}</math> である。 * 分散 分散 V(X)は、 :<math>\begin{align} V(X) &= \sum_{k=0}^\infty k^2 \frac{\lambda^k e^{-\lambda}}{k!} - \lambda^2 \\ &= \sum_{k=0}^\infty (k(k-1)+k) \frac{\lambda^k e^{-\lambda}}{k!} - \lambda^2 \\ &= \sum_{k=2}^\infty k(k-1) \frac{\lambda^k e^{-\lambda}}{k!} +\lambda -\lambda^2 \\ &= \lambda^2 e^{-\lambda} \sum_{k=2}^\infty \frac{\lambda^{k-2}}{(k-2)!} +\lambda -\lambda^2 \\ &= \lambda^2 e^{-\lambda} \sum_{k=0}^\infty \frac{\lambda^k}{k!} +\lambda -\lambda^2 \\ &= \lambda^2 e^{-\lambda} e^\lambda +\lambda-\lambda^2 \\ &= \lambda \end{align}</math> である。 == 超幾何分布 == * 確率質量関数 <math>N,K,n</math>は自然数の定数で、<math>n \le K \le N-n</math>を満たすとする。<math>0 \le k \le n</math>を満たす自然数の定数<math>k</math>に対し、 :<math>f(k)=\frac{{K \choose k}{N-K \choose n-k}}{{N \choose n}}</math> と定める。ただし、<math>{N \choose n}</math>などは二項係数である。この<math>f(k)</math>が確率質量関数であることは、以下のように確かめられる。 <math>x</math>についての恒等式 :<math>(1+x)^K(1+x)^{N-K}=(1+x)^N</math> の両辺を展開したときの<math>x^n</math>の項の係数を考えると、右辺の係数は二項定理により<math>{N \choose n}</math>である。一方左辺の係数は、 :<math>\sum_{k=0}^n {K \choose k}{N-K \choose n-k}</math> である。よって、 :<math>\sum_{k=0}^n {K \choose k}{N-K \choose n-k}={N \choose n}</math> :<math>\sum_{k=0}^n \frac{{K \choose k}{N-K \choose n-k}}{{N \choose n}}=1</math> である。 以上により、この<math>f(k)</math>が確率質量関数であることが確かめられた。この確率質量関数によって定まる確率分布を、'''超幾何分布'''という。 * 期待値 期待値 E(X)は、 :<math>\begin{align} E(X)&= \sum_{k=0}^n k \frac{{K \choose k}{N-K \choose n-k}}{{N \choose n}} \\ &= \sum_{k=1}^n k \frac{{K \choose k}{N-K \choose n-k}}{{N \choose n}} \\ &= \sum_{k=1}^n K \frac{{K-1 \choose k-1}{N-K \choose n-k}}{{N \choose n}} \\ &= \sum_{k=0}^{n-1} K \frac{{K-1 \choose k}{N-K \choose n-k-1}}{{N \choose n}} \\ &= \frac{nK}{N} \sum_{k=0}^{n-1} \frac{{K-1 \choose k}{N-K \choose n-k-1}}{{N-1 \choose n-1}} \\ &= \frac{nK}{N} \sum_{k=0}^{n'} \frac{{K' \choose k}{N'-K' \choose n'-k}}{{N' \choose n'}} \\ &= \frac{nK}{N} \end{align}</math> である。ただし、6行目では<math>n'=n-1,\ K'=K-1,\ N'=N-1</math>とした。 * 分散 分散 V(X)は :<math>\begin{align} V(X)&= \sum_{k=0}^n k^2 \frac{{K \choose k}{N-K \choose n-k}}{{N \choose n}} - \left(\frac{nK}{N}\right)^2 \\ &= \sum_{k=0}^n k(k-1) \frac{{K \choose k}{N-K \choose n-k}}{{N \choose n}} + \frac{nK}{N} - \frac{n^2K^2}{N^2} \\ &= \sum_{k=2}^n k(k-1) \frac{{K \choose k}{N-K \choose n-k}}{{N \choose n}} + \frac{nK(N-nK)}{N^2} \\ &= \sum_{k=2}^n K(K-1) \frac{{K-2 \choose k-2}{N-K \choose n-k}}{{N \choose n}} + \frac{nK(N-nK)}{N^2} \\ &= \sum_{k=0}^{n-2} K(K-1) \frac{{K-2 \choose k}{N-K \choose n-k-2}}{{N \choose n}} + \frac{nK(N-nK)}{N^2} \\ &= \frac{n(n-1)K(K-1)}{N(N-1)} \sum_{k=0}^{n-2} \frac{{K-2 \choose k}{N-K \choose n-k-2}}{{N-2 \choose n-2}} + \frac{nK(N-nK)}{N^2} \\ &= \frac{n(n-1)K(K-1)}{N(N-1)} \sum_{k=0}^{n''} \frac{{K'' \choose k}{N''-K'' \choose n''-k}}{{N'' \choose n''}} + \frac{nK(N-nK)}{N^2} \\ &= \frac{n(n-1)K(K-1)}{N(N-1)} + \frac{nK(N-nK)}{N^2} \\ &= \frac{nK}{N^2(N-1)} (N(n-1)(K-1)+(N-nK)(N-1)) \\ &= \frac{nK}{N^2(N-1)} (N^2-(n+K)N+nK)\\ &= \frac{nK(N-K)(N-n)}{N^2(N-1)} \end{align}</math> である。ただし、7行目では<math>n''=n-2,\ K''=K-2,\ N''=N-2</math>とした。 [[カテゴリ:確率分布]]
統計学基礎/確率分布/離散変数
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報