データの結合
データの結合は、最も事故が起きやすい処理です。
事故が起きると、間違ったデータを社内に展開することに繋がり、最悪ビジネスの判断を左右しかねません。
nehanはそういった事故を防ぐために、組み合わせ爆発する結合はエラーを返すようにしています。
下記にて結合方法の例をご参考ください。
例1:共通部分を残す
例2:左側のデータを残す(left join)
例3:左に存在しない右のデータを残す(right anti join)
例4:組合せ爆発の例
ユーザーidをキー列として結合した場合、1対1もしくはn対1で結合できず、全パターンの掛け合わせを計算します。
id1に着目した場合、左は3行右が2行あり、3×2=6行が誕生。そして結合後、この6行のデータを処理するのは非常に面倒です。
なお、これが1万行×1万行だったら一気に100万行が発生し、分析が困難になるでしょう。