Skip to content

欠損値処理

この機能は、データ内の欠損値を処理するために使われます。欠損値の処理方法としては、以下の 4 つの方法があります。

  1. 除外 - 欠損値が含まれる行や列を除外します。行や列を除外する条件は、少なくとも一つの欠損値がある場合、または全ての値が欠損している場合を指定できます。特定の列に対してのみ除外を行うことも可能です。
  2. 抽出 - 欠損値が含まれる行を抽出します。これも、少なくとも一つの欠損値がある場合や全ての値が欠損している場合に抽出を行うことができ、特定の列に限定して抽出することもできます。
  3. 代入 - 欠損値を何らかの値で補完します。平均値、中央値、最頻値、またはユーザーが指定した特定の値での補完が可能です。直前または直後の値で順次補完することもできます。
  4. 判定 - 欠損値の有無を判定し、新たな列にフラグとして追加します。行内で少なくとも一つの欠損値があるか、全ての値が欠損しているかに基づいてフラグが立てられます。

これらの処理は、特定の列に限定して適用することができ、より柔軟な欠損値処理が可能となります。


入出力定義

定義内容
入力データ
出力データ

サンプル

欠損値を補完する

欠損値を前後の値で順次補完する

欠損値を抽出する

欠損値を判定する

欠損値を削除する