Skip to content

このカテゴリでわかること

データ処理機能について

このカテゴリでは、nehan の分析プロジェクトで使用できる様々なデータ処理ノードの機能と使い方について学ぶことができます。
これらのノードを組み合わせることで、コーディングなしで高度なデータ変換や分析を実現できます。


主な内容

  • データ入力:
    • データの読み込み方法
    • ファイルアップロード機能
  • 列方向のデータ操作:
    • 列の選択、リネーム、順序変更
    • データフレームの挿入
    • 列のデータ型変換
    • 単純選択と高度な選択
  • 行方向のデータ操作:
    • 行のフィルタリング
    • 重複処理
    • 外れ値処理
    • 行の並べ替え
    • 上位 N 件の抽出
  • データ結合・分割:
    • 水平・垂直連結
    • データのマージ(各種 JOIN)
    • データの分割
  • データ変形:
    • ピボットテーブル
    • 行列変換(melt)
    • 転置
    • グループ集計
  • 文字列操作:
    • 文字列の連結、抽出、分割
    • テキストクレンジング
    • JSON 解析
    • ゼロパディング
  • 数値列操作:
    • 計算列の追加
    • 数値列の区間分け
    • 桁数の調整
    • インデックス追加
  • 日付列操作:
    • 日付の抽出
    • 日付の加減算
    • 日付の差分計算
    • 日付の丸め
  • 便利な前処理機能:
    • 欠損値処理
    • 補間処理
    • 累積和
    • シフト操作
    • 比率計算
  • 機械学習向け前処理:
    • 正規化
    • ラベルエンコーディング
    • 特徴量選択
    • サンプリング
  • 時系列分析:
    • ARIMA、SARIMA
    • AR モデル
    • Prophet による予測
    • 状態空間モデル
  • 自然言語処理:
    • テキストのクレンジング
    • トークン化
    • 特徴量抽出
    • トピックモデリング(LDA)
    • fastText による予測
  • その他分析手法:
    • アソシエーション分析
    • コミュニティクラスタリング
    • カーネル密度推定
  • AI 名寄せ機能:
    • 文字列類似性によるグルーピング
    • 行レベルの名寄せ

nehan のデータ処理機能を使いこなすことで、データクレンジングから高度な分析まで、幅広いデータ処理タスクをコーディングなしで実行できるようになります。
各ノードは直感的な UI で設定でき、処理結果をリアルタイムでプレビューできるため、効率的なデータ処理が可能です。