AmazonS3を活用して、スナップショットデータを蓄積していくやり方
やりたいこと
例えば、その日時点の顧客のランク(例:優良ランク、新規ランク)を毎日記録し、ランクごとの人数数の推移を観察したい、といったシーンがあります。
これを実現する際、データ量によっては、日毎に顧客のランク状態を記録したほうが効率がよいです。
これをよく、スナップショットのデータを蓄積する、と言います。
これを実現するには、外部のデータストレージが必要です。(nehan内にデータを蓄積する機能はありませんので)
下記、AmazonS3を用いた例を紹介します。
ステップ
step1:スナップショットのデータを作る
読んで名のごとく、記録したいデータを作成します。
エクスポートノードでAmazonS3を選択し、エクスポートを実行すればよいのですが、この時ファイル名に日付などの記録時間情報を入れておきましょう。
step2:エクスポートしたファイルを一括で取り込みデータソースを作成する
このとき、読み込みオプションの「ファイル名をデータソースの列名に挿入する」を利用すれば、どの行がどのファイルのものかがわかりやすくなります。
step3:分析する
あとは、step2で作ったデータを分析プロジェクトで分析すればOKです。
スケジュール更新の際の注意
上記のステップをスケジュール機能で定期更新する場合、現状
- エクスポートを行うプロジェクト側でスケジュールセット
- 分析するプロジェクト側でスケジュールセット
と2回設定が必要になります。例えば、前者を10時に行って、後者を11時に行う、といった形。
これは、スケジュール機能の仕組み上避けられず、今後の改善で簡潔に設定できるように改善される予定です。