Google Cloud Storage
nehan 上のデータを Google Cloud Storage(GCS)にファイルとしてエクスポートすることができます。
ダイアログ内設定項目
接続情報
接続情報を選択します。
送信先
バケット名
GCS のバケット名を入力してください。
例えば GCS 上にgs://nehan/node_log/2022-01-01.csv
をエクスポートしたい場合、nehan
がバケット名に該当します。
ファイル名
ファイル名は、バケット名以降の情報を必要とします。
例えば S3 上にgs://nehan/node_log/2022-01-01.csv
をエクスポートしたい場合、node_log/2022-01-01
がファイル名に該当します。
なお、ファイルが存在しない場合は、新規にファイルが作成されます。
既にファイルが存在する場合は、エクスポート対象データで上書きします。
ファイルタイプ
- csv(デフォルト)
- parquet
のいずれかを選択できます。
例えば GCS 上にgs://nehan/node_log/2022-01-01.csv
をエクスポートしたい場合、「csv」を選択します。
parquet はデータの圧縮率が高く、読み込み速度が速いため、大量のデータを扱う際に有効です。
圧縮タイプ
ファイルタイプが「parquet」の場合、圧縮形式を下記から指定することができます。
圧縮を行うことで、ファイルサイズを小さくすることができ、読み込み速度を向上させることができます。
- Snappy(デフォルト)
- gzip
- なし
クオーティングを選択
ファイルタイプが「csv」の場合、クオーティングを選択可能です。
下記のデータを例に、ダウンロードした際のファイル内の違いを紹介します。
ID | 性別年齢 | 都道府県 |
---|---|---|
1 | 男,20 代 | 東京 |