目次

不均衡データに対するサンプリング

概要

  • 機械学習において、目的変数列の要素が均衡でない、例えば、1と0のデータ数が大きく違う場合、などに有効です。
  • もし、目的変数A列内で、1のデータ数が10,000、0のデータ数が1,000の場合
    • アンダーサンプリング:1のデータ数をサンプリングし、0に合わせます。
    • オーバーサンプリング:0のデータ数をサンプリングし、1に合わせます。

入出力

入力

  • データ

出力

  • データ

サンプル

アンダーサンプリングする

オーバーサンプリングする

仕様補足

準備中

この記事は役に立ちましたか?
はい いいえ
この記事は役に立ちましたか?
はい いいえ