データサイエンス100本ノックをAlteryxで。69日目(問題)

問題編 100本ノック

このページは問題編です

設問

P-069: レシート明細データ(receipt.csv)と商品データ(product.csv)を結合し、顧客毎に全商品の売上金額合計と、カテゴリ大区分コード(category_major_cd)が”07″(瓶詰缶詰)の売上金額合計を計算の上、両者の比率を求めよ。抽出対象はカテゴリ大区分コード”07″(瓶詰缶詰)の売上実績がある顧客のみとし、結果を10件表示せよ。

※最終結果はcustomer_idの昇順で並び替えること
※売上金額合計はsum_all、07のみの売上金額合計はsum_07とし、比率はsales_rateとすること

スタートファイルダウンロード

ヒント

今回は複合的な問題ですので、地道にワークフローを構築しましょう。

顧客ごとに全商品の合計とカテゴリ大区分コードが07の商品の合計の比率を取る問題です。全商品の合計と07の商品の合計はそれぞれ集計ツールで合計を出した後に、結合し比率を計算すればオッケーです。

解答編へ

コメント

タイトルとURLをコピーしました