目次

要因分析

ヒント
データプレビューで要因分析結果を確認できます
ヒント

入力データには

  • 結果を表す1列
  • 要因を表す1列以上

が必要です。

注意
データに欠損値が入っている場合、エラーなります。

概要

  • 機械学習を用いて、データ同士の関係を定量的に分析します。
  • 結果に対して、要因がどれくらい影響していたのか、を簡単設定で観察することができます。

入出力

入力

  • データ

出力

  • データ(結果列に対する要因列の影響力ランキング)
  • 分析結果

サンプル

タイタニック号の生存要因を分析する

社員の退職要因を分析する

ヒント
2サンプルともデータプレビュー内の「要因分析結果」タブで生存要因を確認してください。

仕様補足

  1. ランダムフォレストで予測モデルを作成
  2. 1で作成したモデルに対して予測値を算出(データは学習データと同じ)
  3. 各要因のshap値の絶対値の平均を変数影響度とする
  4. 各要因の結果値に対する影響度をグラフ化する(下記の6パターン)
    • 結果が2値で要因が文字列型 →  予測値に対する要因が持つ要素の割合を棒グラフに
    • 結果が2値で要因が数値型 → 要因を等頻度で5つのカテゴリに変換して、予測値に対する各カテゴリの割合を棒グラフに
    • 結果が3値以上の文字列型で要因も文字列型 → 予測値に対する要因が持つ要素の割合を棒グラフに
    • 結果が3値以上の文字列型で要因が数値型 → 特徴量を等頻度で5つのカテゴリに変換して、予測値に対する各カテゴリの割合を棒グラフに
    • 結果が数値型で要因が文字列型 → 予測値の分布を要因が持つ要素ごとに箱ひげ図に
    • 結果が数値型で要因も数値型 → 予測値と要因の関係を散布図に
この記事は役に立ちましたか?
はい いいえ
この記事は役に立ちましたか?
はい いいえ