Skip to content

マニュアルML

データ内の目的変数列と説明変数列を指定して機械学習モデルを構築できます。
マニュアルMLはオートMLとは異なり、ユーザーがデータ前処理と学習アルゴリズムの設定を自由に行える機能です。
各項目は複数設定可能であり、その場合、最も精度の高い組み合わせを自動探索します。
モデルの構築だけでなく、回帰分析、決定木分析、要因分析にも利用できます。
また、オートML同様、構築したモデルの重視点などの解釈に関する情報も提供します。


入出力定義

定義内容補足
入力データ
左出力機械学習モデル
中出力データモデルの精度指標を出力
右出力データ説明変数の重要度などを出力
ボニートくん精度検証結果
ボニートくん機械が重視したデータ
ボニートくん学習プロセス
ボニートくん精度改善の余地
ボニートくんモデル詳細情報

サンプル

退職予測モデルの構築

ボニートくんで「精度検証結果」を確認

ボニートくんで「機械が重視したデータ」を確認

ボニートくんで「学習プロセス」を確認

ボニートくんで「精度改善の余地」を確認

ボニートくんで「モデル詳細情報」を確認


処理内容補足

実施する前処理

精度が最大化するように自動的に処理を選択します。

  • 欠損値処理
  • 数値列の変換 (Box-Cox 変換など)
  • 文字列の変換 (ワンホットエンコーディングなど)
  • 数値の外れ値処理
  • 特徴量選択

学習に用いるアルゴリズム

精度が最大化するように自動的に処理を選択します。

  • ランダムフォレスト
  • XGBoost
  • LightGBM
  • CatBoost
  • SVM
  • 回帰分析
  • 一般線形モデル
  • ロジスティック回帰
  • 線形混合モデル
  • 決定木

探索

ベイズ最適化に基づき、最適な精度を持つ組み合わせを探索します。 これにより高い精度を短時間で実現できます。探索回数の上限は処理モードで制御できます。


処理設定補足

処理モード

速度重視

実行時間を優先し、精度が劣る場合があります。

パラメータ
学習に使うデータの行数比率30%
特徴量選択の上限探索回数3
学習アルゴリズムの上限探索回数3
アンサンブルモデルを構築する

精度重視

時間がかかっても精度を追求するモード。探索回数が増えるため、過学習リスクが上がることがあります。

パラメータ
学習に使うデータの行数比率70%
特徴量選択の上限探索回数10
学習アルゴリズムの上限探索回数10
アンサンブルモデルを構築しない

カスタム

パラメータ
学習に使うデータの行数比率任意設定可能
特徴量選択の上限探索回数任意設定可能
学習アルゴリズムの上限探索回数任意設定可能
アンサンブルモデルを構築しない

最大化する指標(オプション)

どの精度を最大化するモデルを構築するかを選択可能です。

カテゴリ分類の場合

  • 正解率[Accuracy]
  • F 値[F1]
  • 再現率[Recall]
  • 適合率[Precision]

数値予測の場合

  • 平均絶対相対誤差[MAPE]
  • 平均絶対誤差[MAE]
  • 二乗平均平方根誤差[RMSE]

出力内容補足

モデルの精度指標(中出力)

モデルの精度を確認するための以下の項目を出力します。

項目説明
採用モデル学習に採用されたアルゴリズムを表示
精度指標値選択した指標の値を表示
精度評価精度指標値に基づく評価を表示
過学習リスク(10 段階)モデルの過学習リスクを 10 段階で表示

モデル補足情報(右出力)

採用モデルによって異なります。

回帰モデルの場合

  • 線形回帰
  • 一般化線形モデル
  • ロジスティック回帰

の場合、説明変数ごとの相関係数など回帰モデルの解釈情報を出力します。

回帰モデル以外の場合

モデル構築時の説明変数ごとの重要度を出力します。重要度が高いほどモデルが重視した変数です。