因子分析
入力データ内の複数の数値列を指定した列数に変換し、元のデータよりも少ない列数で、元のデータの情報を保持したままデータを圧縮することができます。
また、圧縮後の列情報を解釈するための図(バイプロット)を確認することもできます。
入出力定義
定義 | 内容 | 補足 |
---|---|---|
入力 | データ | |
左出力 | データ | 処理対象列を主成分に変換した結果を出力 |
中出力 | データ | 各成分の固有ベクトルを出力 |
右出力 | データ | 各成分の寄与率を出力 |
ボニートくん | バイプロット |
サンプル
因子分析を用いて列数の圧縮を行い、自動車のサイズからメーカーの特徴を比較する
各ベクトルの方向と長さは、その特徴がデータの分散にどの程度影響を与えるかを表しています。
例えば、「車重平均」の右上へ向かうベクトルは、この軸に沿って重い車種が配置されることを意味します。
同様に、「車体の長さ平均」と「車体の幅_平均」の左上へ向かうベクトルは、大型の車体を持つ車種がこの方向に配置されることを示しています。
以下は具体的な解釈です:
- 右上に位置するメーカー: これらのメーカーは平均的に重い車を製造しています。
- 左上に位置するメーカー: これらのメーカーは平均的に長く幅の広い車を製造しています。
- 左に位置するメーカー(ベクトルが小さいため影響は少ないですが): これらのメーカーは比較的高さのある車を製造しています。
- 左下に位置するメーカー: これらのメーカーは平均的に長いホイールベースを持つ車を製造しています。
この分析から、ジャガーやメルセデス・ベンツは右上に位置しているため、重い車種を製造していると推測されます。
一方、ホンダやトヨタは中央付近に位置しており、これらの平均的な特徴が全ての車重、車体の長さ、幅、高さ、ホイールベースの特徴において比較的中立であることを示しています。
車体の高さの影響が小さいことから、他の 4 つの特徴がこれらのメーカーの車種を区別する上でより重要であることがわかります。