【旧機能】要因分析
ヒント
データプレビューで要因分析結果を確認できます
ヒント
入力データには
- 結果を表す1列
- 要因を表す1列以上
が必要です。
注意
データに欠損値が入っている場合、エラーなります。
概要
- 機械学習を用いて、データ同士の関係を定量的に分析します。
- 結果に対して、要因がどれくらい影響していたのか、を簡単設定で観察することができます。
入出力
入力
- データ
出力
- データ(結果列に対する要因列の影響力ランキング)
- 分析結果
サンプル
ヒント
2サンプルともデータプレビュー内の「要因分析結果」タブで生存要因を確認してください。
仕様補足
- ランダムフォレストで予測モデルを作成
- 1で作成したモデルに対して予測値を算出(データは学習データと同じ)
- 各要因のshap値の絶対値の平均を変数影響度とする
- 各要因の結果値に対する影響度をグラフ化する(下記の6パターン)
- 結果が2値で要因が文字列型 → 予測値に対する要因が持つ要素の割合を棒グラフに
- 結果が2値で要因が数値型 → 要因を等頻度で5つのカテゴリに変換して、予測値に対する各カテゴリの割合を棒グラフに
- 結果が3値以上の文字列型で要因も文字列型 → 予測値に対する要因が持つ要素の割合を棒グラフに
- 結果が3値以上の文字列型で要因が数値型 → 特徴量を等頻度で5つのカテゴリに変換して、予測値に対する各カテゴリの割合を棒グラフに
- 結果が数値型で要因が文字列型 → 予測値の分布を要因が持つ要素ごとに箱ひげ図に
- 結果が数値型で要因も数値型 → 予測値と要因の関係を散布図に