目次

オートML

概要

  • 目的変数と説明変数を設定するだけで、高い精度を誇る機械学習モデルを構築できる機能です。
  • 前処理手法、学習アルゴリズム・パラメータを探索し、最も精度が高くなる組み合わせを自動で選択します。
  • 構築したモデルの精度や機械が重視したデータ、精度を落としてしまっている原因などをボニートくんで自動可視化します。

入出力

入力

  • データ(目的変数1列と説明変数1列以上)

出力

  • 学習済みモデル
  • 構築モデル情報(精度の概要など)
  • モデル補足情報(機械が重視したデータなど)

ボニートくん

サンプル

タイタニック号乗員客の生存/死亡を予測するモデルを構築

仕様補足

実施する前処理

自動的に下記の前処理を実施します。

  • 欠損値処理(欠損値があれば)
  • 数値列の変換(boxcox変換など)
  • 文字列の変換(one-hot encodingなど)
  • 数値の外れ値処理
  • 特徴量生成(列同士の四則演算による新規列生成)
  • 特徴量選択

学習に用いるアルゴリズム

  • ランダムフォレスト
  • XGBoost
  • LightGBM
  • CatBoost
  • SVM
  • 上記の2つ以上をブレンディングしたアンサンブルモデル(速度重視モードを除く)

探索

上記内容の総当りの組み合わせ分モデルを構築するわけではなく、ベイズ最適化の考えに基づき、よりよい精度が出る組み合わせを探索する仕組みが搭載されています。

これにより圧倒的に実行時間を短縮でき、なおかつ高い精度を期待できます。

なお、この探索回数の上限は処理モードでコントロールできます。

最大化する指標

どのモデル精度を最大化するかを選択可能。

カテゴリ分類の場合は、

  • 正解率[Accuracy]
  • F値[F1]
  • 再現率[Recall]
  • 適合率[Precision]

数値予測の場合は、

  • 平均絶対相対誤差[MAPE]
  • 平均絶対誤差[MAE]
  • 二乗平均平方根誤差[RMSE]

から選択可能。

出力データ「構築モデル情報(精度の概要など)」の詳細

データ内の

  • 精度評価
  • 過学習リスク

については「精度検証結果」をご参考下さい。

この記事は役に立ちましたか?
はい いいえ
この記事は役に立ちましたか?
はい いいえ