データソースの更新
データソースの更新方法を説明します。
更新とは、御社内で保有するデータとデータソース内に保存されたデータを同期することを指します。
データソースページ内での更新
作成済みのデータソースページで読み込んで保存もしくはSQL を実行して保存をクリックすることで、データソースを更新できます。
分析プロジェクトページからの更新
分析プロジェクト内のデータの読み込みノードの設定でデータソースを更新して読み込むを ON にしてノードを実行することで、データソースを更新し、かつ読み込みノードの実行を同時に行えます。
SQL ビルダーからの更新
データソースが SQL ビルダーで作成された場合、SQL ビルダー内のデータソース化するノードを再実行することでデータソースを更新することができます。
スケジューリング機能を使用した更新
更新するデータソースを実行対象としてスケジュールに設定し、実行することでデータソースを更新できます。
差分更新
データソースページ内の差分読み込みのスイッチをonにすることで、差分更新が有効になります。
データソースの更新時に、読み込み済みファイル以外の追加された新規ファイルのみを読み込むことができ、データソースの更新時間を短縮できます。
現状どのファイルが読み込み済みか、は「読み込み済みファイル」アイコンをクリックすることで確認できます。
具体例
S3 に以下のファイルが格納されているとします。
/data/ ├── sales_202401.csv ├── sales_202402.csv └── sales_202403.csv初回読み込み時: 3ファイルすべてが読み込まれ、データソースに保存されます。
翌月、新しいファイルが追加された場合:
/data/ ├── sales_202401.csv ← 読み込み済み ├── sales_202402.csv ← 読み込み済み ├── sales_202403.csv ← 読み込み済み └── sales_202404.csv ← 新規ファイル差分更新を有効にしてデータソースを更新すると、sales_202404.csv のみが読み込まれ、既存データに追加されます。
注意: sales_202403.csv の内容が変更されていても、差分更新では再読み込みされません。変更を反映するには、差分更新を無効にして全件更新を行う必要があります。