目次

精度改善の余地(ボニートくん)

概要

別のボニートくん「機械が重視したデータ」と見た目は似ていますが、中身は全く違います。

予測と実測を比較し、どの列が原因で予測が外れてしまっているのかを確認できます。

※オートML、マニュアルML、アンサンブルML、予測精度を評価、の実行結果として確認できます。

原因比較

どの列のせいで精度が下がっているのか、を把握できます。

上にある列ほど、重要であることを意味します。

列ごとに詳細を観察

下部のフィルタボックスで列名を指定することで、その列内のどの要素が足を引っ張っているかがわかります。

文字列の場合はカテゴリごとに、数値列の場合は数値範囲ごとに、精度プラスorマイナスに影響したかを表現します。

文字列型の例

下記の「性別」列を題材にします。

列の値が”female”の場合、予測が外れている(精度を下げている要因)と解釈できます。

また、混合行列で詳細を確認すると

  • “0”と予測したが実際は”1″だった
  • つまり予測が外れている

データ数が36%と非常に多いことがわかります。

列の値が”female”の場合、”1″と予測する根拠となるデータが不足していると言え、説明変数の構成を検討する材料となります。

数値型の例

下記の「年齢」列を題材にします。

列の範囲”16歳~21歳”が最も予測が外れている(精度を下げている要因)と解釈できます。

また、混合行列で詳細を確認すると

  • “0”と予測したが実際は”1″だった
  • つまり予測が外れている

データ数が34%と非常に多いことがわかります。

列の値が”16歳~21歳”の場合、”1″と予測する根拠となるデータが不足していると言え、説明変数の構成を検討する材料となります。

この記事は役に立ちましたか?
はい いいえ
この記事は役に立ちましたか?
はい いいえ