目次

機械が重視したデータ(ボニートくん)

概要

モデル構築にあたり、重要な列およびその要素が把握できます。

モデル内部の把握はもちろん、要因分析の視点でも活用できる機能です。

※オートML、マニュアルML、アンサンブルML、の実行結果として確認できます。

影響度比較

モデル構築にあたり、どの列を重視されたかが把握できます。

上にある列ほど、重要であることを意味します。

なおオートMLの場合、新規生成された列が交じる場合があります。(列1+列2、といった演算により生まれた新規列)

列ごとに詳細を観察

下部のフィルタボックスで列名を指定することで、その列内のどの要素が重視されたかが確認できます。

文字列の場合はカテゴリごとに、数値列の場合は数値範囲ごとに、どこに影響したかを表現します。

文字列の例

下記の「性別」列を題材にします。カテゴリ分類モードでモデルを構築しています。

  • “1”への分類根拠:”female”
  • “0”への分類根拠:”male”

と読み取ることができ、

  • 「性別」列の値が”female”であれば”1″に
  • “male”であれば”0″に分類されやすい

と解釈できます。

数値列の例

下記の「年齢」列を題材にします。カテゴリ分類モードでモデルを構築しています。

まず、範囲分解のグラフを見ると

  • 年齢が低いほど青、つまり”1″への分類傾向が強い
  • 年齢が高いほど赤、つまり”0″への分類傾向が強い

と読み取れます。また、数値範囲詳細に着目すると

  • 14歳以下は最も”1″へ分類されやすい範囲
  • 33~39際は最も”0″へ分類されやすい範囲

と解釈することができます。

この記事は役に立ちましたか?
はい いいえ
この記事は役に立ちましたか?
はい いいえ