主成分分析のソースを表示
←
主成分分析
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
{{wikipedia}} == 主成分分析の発想 == n個のp次元ベクトル<math>\mathbf{x_i}=(x_1, x_2,\cdots,x_p)^T \ (i=1,2,\cdots,n)</math>があるとする。 主成分分析の目的は、できるだけ元データの構造を保った上で、より次元の小さな次元に圧縮することである。 具体的には、例えば、 :<math>x=(x_1, x_2,\cdots,x_p)^T\ (i=1,2,\cdots,n)</math><br> を1次元の値で表すことを考えてみよう。 そのための方法として、p次元単位ベクトル<math>\mathbf{e}</math>を用意して、内積を取ることで、単位ベクトル方向の方向成分によって、n個のベクトルを識別するという方法がある。 主成分分析は、基本的にこの発想をもちいており、では、単位ベクトルとしてどの方向を利用するのが良いのかを統計的に決定するというものである。 上の例では1次元に圧縮したが、2次元に圧縮したい場合は、単位ベクトルを2つ用意して、2つの単位ベクトルを規定としたときの成分<math>(z_1,z_2)</math>でn個のベクトルを識別する。 m次元に圧縮したい場合は、単位ベクトルをm個用意すれば良い。 == 主成分分析における"主成分"の考え方 == では、p次元ベクトルの単位ベクトルはどのように選ぶのが良いだろうか?<br> n個のベクトルの単位ベクトルの方向成分をとった時、成分ができるだけバラける方向に単位ベクトルを取ると、成分の値によって、<math>x_i</math>を区別しやすい。 したがって、単位ベクトルは分散が大きい方向に取るのが良い。単位ベクトルをaとすると、<math>\mathbf{a}</math>の満たすべき条件は :<math>z=\mathbf{a}^T x</math> <math> var(z)=\frac{1}{n}\sum_{i=1}^n{(z_i-\bar{z})} </math>を最大化する<math>\mathbf{a}</math><br> である。 これは射影変換後の変数zの分散が最大になるように単位ベクトルを決めるていることを意味する。<br> また、上の条件を満たす<math>\mathbf{a}</math>によって得られる変数<math>z</math>は、標本<math>x</math>の特徴をよく表していることから、「説明変数」とよばれる。 [[カテゴリ:統計学]]
このページで使用されているテンプレート:
テンプレート:Wikipedia
(
ソースを閲覧
)
主成分分析
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報