予測精度を評価
概要
- 予測結果列と正解データ列を指定し、差分を検証、精度評価を行います。
- 「モデルで予測値算出」ノードにつなげて活用すると効果を発揮します。
入出力
入力
- データ(予測結果列1列、正解データ列1列)
出力
- データ(精度指標ごとの評価)
サンプル
仕様補足
カテゴリ変数の予測の場合
- 適合率[precision]:ポジティブに分類されたアイテムのうち、実際にポジティブであったアイテムの割合
- 再現率[recall]:本来ポジティブに分類すべきアイテムを、正しくポジティブに分類できたアイテムの割合
- F1-スコア:Precisionと検出率Recallをバランス良く持ち合わせているかを示す指標。0 〜 1 の間の数値で出力され、0 の場合最も悪い評価、1 の場合最も良い評価となる
連続値の予測の場合
- 平均絶対誤差:|実測値 – 予測値|を各データで算出し、平均したもの。(単純にどのくらい予測値と実測値がずれるかの指標として)
- 平均二乗誤差:|実測値 – 予測値|^2を各データで算出し、平均したもの。(二乗しているため、平均絶対誤差より外れ値の影響を受けやすく、平均絶対誤差との乖離が大きい場合、注意する必要がある)
- 平均相対誤差:|(実測値 – 予測値)/実測値|を各データで算出し、平均したもの。(実測値に対して予測値が何%くらいずれるのか、と読み替えることができる)