このページは問題編です
設問
P-053: 顧客データ(customer.csv)の郵便番号(postal_cd)に対し、東京(先頭3桁が100〜209のもの)を1、それ以外のものを0に二値化せよ。さらにレシート明細データ(receipt.csv)と結合し、全期間において売上実績のある顧客数を、作成した二値ごとにカウントせよ。
※郵便番号(postal_cd)2値化したフィールドはpostal_flgという名称とすること
スタートファイルダウンロード
ヒント
52問目に続き、2値化する問題です。郵便番号(postal_cd)の先頭3桁の値の範囲に対して2値化します。基本的にIF文を使いますが、今回は数値として比較することができます。
2値化後は、レシート明細データ(receipt.csv)と結合する必要があります。売上実績のある顧客というのは、レシート明細データと結合できたレコードとなります。最終的には顧客数をカウントするわけですが、データは重複しているので重複を除いてカウントしてください。
コメント