目次

データの結合

データの結合は、最も事故が起きやすい処理です。

事故が起きると、間違ったデータを社内に展開することに繋がり、最悪ビジネスの判断を左右しかねません。

nehanはそういった事故を防ぐために、組み合わせ爆発する結合はエラーを返すようにしています。

下記にて結合方法の例をご参考ください。

例1:共通部分を残す(inner join)


例2:左側のデータを残す(left join)


例3:左に存在しない右のデータを残す(right anti join)


例4:組合せ爆発の例

ユーザーidをキー列として結合した場合、1対1もしくはn対1で結合できず、全パターンの掛け合わせを計算します。

id1に着目した場合、左は3行右が2行あり、3×2=6行が誕生。そして結合後、この6行のデータを処理するのは非常に面倒です。

なお、これが1万行×1万行だったら一気に100万行が発生し、分析が困難になるでしょう。

この記事は役に立ちましたか?
はい いいえ
この記事は役に立ちましたか?
はい いいえ