オートML

データ内の目的変数列や説明変数列を指定して、機械学習モデルを構築できます。
オート ML は機械学習におけるデータ前処理、学習アルゴリズムの選択、パラメータチューニングを自動で行います。
また、構築したモデルが何を重視したかなどの解釈を行うための情報も提供します。

入出力定義

1. 退職予測モデルを構築この例では、従業員の退職を予測するモデルを構築し、従業員の退職予測を行っています。

精度が最大になるように、自動的に処理を選択します。

精度が最大になるように、自動的に処理を選択します。

全ての組み合わせについてモデルを構築するのではなく、ベイズ最適化を使用して最適な組み合わせを探索します。
このため、実行時間を大幅に短縮しつつ高い精度を期待できます。
探索回数の上限は処理モードで制御できます。

処理モードの選択により、精度の追求と実行時間のバランスを調整できます。
下記にパラメータと値の一覧を示します。

実行時間を優先するモードです。
精度重視モードよりも精度が劣る場合があります。

時間をかけても精度を向上させたい場合に適したモードです。ただし、探索回数が増えるため、過学習のリスクが高まることがあります。

各パラメータを自由に設定できるモードです。

カテゴリ分類の場合、以下から最大化する精度を選択できます。

数値予測の場合は、以下から選択できます。

モデルの精度を簡単に確認できるように、以下の情報をノードの真ん中のポートから出力します。

モデルの構築に使用された各説明変数の重要度を示します。
数値が大きいほど、機械が重視した説明変数であることを意味します。
ノードの右ポートから出力します。

実行時間の参考情報を以下に示します。(レギュラープラン相当の環境での検証)

予測モード	説明変数の数	行数	実行時間
カテゴリ分類	8	約 2,000 行	30 秒
数値予測	10	約 5,000 行	50 秒
カテゴリ分類	20	約 41,000 行	5 分 30 秒
カテゴリ分類	30	約 120,000 行	5 分 10 秒
数値予測	25	約 840,000 行	31 分 40 秒

予測モード	説明変数の数	行数	実行時間
カテゴリ分類	8	約 2,000 行	6 分 50 秒
数値予測	10	約 5,000 行	6 分 30 秒
カテゴリ分類	20	約 41,000 行	8 分 30 秒
カテゴリ分類	30	約 120,000 行	33 分 40 秒
数値予測	25	約 840,000 行	メモリエラー