データサイエンス100本ノックをAlteryxで。87日目(問題)

問題編 100本ノック

このページは問題編です

設問

P-087: 顧客データ(customer.csv)では、異なる店舗での申込みなどにより同一顧客が複数登録されている。名前(customer_name)と郵便番号(postal_cd)が同じ顧客は同一顧客とみなして1顧客1レコードとなるように名寄せした名寄顧客データを作成し、顧客データの件数、名寄顧客データの件数、重複数を算出せよ。ただし、同一顧客に対しては売上金額合計が最も高いものを残し、売上金額合計が同一もしくは売上実績がない顧客については顧客ID(customer_id)の番号が小さいものを残すこととする。

スタートファイルダウンロード

ヒント

複雑な条件で名寄せを行う問題です。条件が複雑なため、ユニークツールを置いて解決!というわけにはいきません。24問目で行ったようなソートツールとサンプリングツールをうまく使いましょう。

解答編へ

コメント

タイトルとURLをコピーしました