データサイエンス100本ノックをAlteryxで。53日目(問題)

問題編 100本ノック

このページは問題編です

設問

P-053: 顧客データ(customer.csv)の郵便番号(postal_cd)に対し、東京(先頭3桁が100〜209のもの)を1、それ以外のものを0に二値化せよ。さらにレシート明細データ(receipt.csv)と結合し、全期間において売上実績のある顧客数を、作成した二値ごとにカウントせよ。

※郵便番号(postal_cd)2値化したフィールドはpostal_flgという名称とすること

スタートファイルダウンロード

ヒント

52問目に続き、2値化する問題です。郵便番号(postal_cd)の先頭3桁の値の範囲に対して2値化します。基本的にIF文を使いますが、今回は数値として比較することができます。

2値化後は、レシート明細データ(receipt.csv)と結合する必要があります。売上実績のある顧客というのは、レシート明細データと結合できたレコードとなります。最終的には顧客数をカウントするわけですが、データは重複しているので重複を除いてカウントしてください。

解答編へ

コメント

タイトルとURLをコピーしました