Skip to content

数値列間の相関係数を求める

この機能は、データの複数の列間の関係を可視化するためのペアプロット(散布図行列)を作成します。
ペアプロットは、各列のペアごとに散布図を表示し、列間の相関を把握するのに役立ちます。
この機能では、数値型データのみを対象に相関係数を計算し、必要に応じてグラフに描画する機能があります。
オプションで、特定の列を色分けして表示することもでき、データのグループ間での関係も明確にすることができます。


入出力定義

定義内容
入力データ
出力データ
ボニートくんペアプロット

サンプル

数値列間の相関を確認する

ボニートくんでペアプロットを確認

ペアプロットでは、データ内の異なる列を軸とする散布図が格子状に配置されています。
図の対角線には各列の密度プロットが表示され、それぞれの列の分布を示しています。
ペアプロットの解釈は以下の通りです。

  • 対角線上の密度プロット: 各列の分布を示しており、アヤメの種類ごとに色分けされています。
  • 散布図: 2 つの列の関係をプロットしており、点の分布により相関関係の有無やその強さを示しています。点が右上に向かって集まる傾向がある場合は正の相関、左上に向かう傾向がある場合は負の相関を示します。
  • 色と記号:異なるアヤメの種類が異なる色と記号で示されており、種類間での特徴の違いを視覚的に比較することができます。

この図から得られる情報は以下の通りです。

  • セトサは他の 2 種と比べて花びらの長さと幅が明らかに異なる(小さい)ことが分かります。
  • バーシクルとバージニカは、がくの長さと幅ではあまり区別がつきませんが、花びらの長さと幅では区別が可能です。
  • 花びらの長さと幅には非常に強い正の相関があり、これらの特徴はアヤメの種類を分類するのに特に有用そうです。

全体的に、このペアプロットは、アヤメの種類を分類するための特徴選択や機械学習モデルのトレーニングに役立つ洞察を提供しています。