ファイル読み込みの仕様補足
ファイル系データソース(CSV / Excel)の読み込みにおける仕様上の注意点をまとめます。
データソース読み込み限定の特殊な型変換
以下の型変換は、データソース画面でのファイル読み込み時のみ適用されます。分析プロジェクト内では利用できません。
Excel のシリアル日付値 → 日付型
Excel のカスタム日付フォーマット(和暦など)が設定されたセルは、整数(シリアル日付値) として読み込まれます。 型変更で date 型 を指定することで、正しい日付に変換できます。
セルの値: 45306(Excel上の表示: 令和6年4月8日)→ 整数として読み込まれる→ 手動で date 型を指定 → 2024-04-08 に変換末尾にスペースを含む数値 → 数値型
末尾にスペースを含む数値(例: "1234 ")は 文字列 として認識されます。
型変更で 数値型 を指定することで、数値に変換できます。
CSV 専用の仕様
true / false の扱い
true / false は 文字列 として読み込まれます。数値型への直接変換はできません。
大文字・小文字の保持
True / False など、元データの大文字・小文字は そのまま保持 されます。
ヘッダー列数を超えるデータ
データ行の列数がヘッダーの列数を超えている場合、超過分は切り捨て られます。
A,B,C1,2,34,5,6,7,8 ← 7,8は切り捨て9,10,11クオートの閉じ忘れ
クオート(")が閉じられていないデータはエラーになります。
A,Ba,"unclosed ← エラー(閉じクオートがない)b,""unclosed ← エラー(閉じクオートがない)c,"closed" ← 問題なしExcel 専用の仕様
TRUE / FALSE の扱い
Excel の TRUE / FALSE は “True” / “False” という文字列 として読み込まれます。 数値(1 / 0)としては読み込まれません。
エラーセルの扱い
#DIV/0!、#VALUE!、#NAME! などのエラーセルは 欠損値に変換 されます。
エラーセルを含む列は全体が文字列として読み込まれるため、小数点以下の精度が9桁に制限 される場合があります。
データ開始前の空白列
データが出てくるまでの先頭の空白列は 自動的に削除 されます。
時間フォーマットの列
時間のみのフォーマット(例: 00:00:01)が設定された列は、1899-12-31 を日付部分として付与した 日付時間形式 で返却されます。
Excelのセル表示: 00:00:01 → 読み込み結果: 1899-12-31 00:00:01Excelのセル表示: 12:30:45 → 読み込み結果: 1899-12-31 12:30:45