多変量解析入門(サイエンス社):9章 主成分分析

理論的部分をまとめたものを下に残しました。

 

qiita.com

 

線形和で新たに生成した変数の分散を最大化することを目的として線形和の係数を求める手法です。

分散を最大化=情報量を最大化=最も有意義な変数の生成

こんなイメージです。

 

9.1:x1,x3のみ使うのを見落としてきつかった

9.2:固有値の計算はexcelの関数にないのでPython使用

9.3,9.4,9.5

因子負荷率を行列で考えるのは手こずりました(m列取り出し)。

第一式のx->uの変換は相関係数の計算方法から、結局分散で正規化するからどっちでもいいでしょという考えから来てます。

(n-1)途中でかけてますけど、間違っている気がします。