データサイエンス100本ノックをAlteryxで。39日目(問題)

問題編 100本ノック

このページは問題編です

設問

P-039: レシート明細データ(receipt.csv)から、売上日数の多い顧客の上位20件を抽出したデータと、売上金額合計の多い顧客の上位20件を抽出したデータをそれぞれ作成し、さらにその2つを完全外部結合せよ。ただし、非会員(顧客IDが”Z”から始まるもの)は除外すること。

※出力データの並びは、売上日数の降順かつ、売上金額の降順、顧客IDの昇順でソートすること
※同一数の場合はcustomer_idの小さな方を採用する

スタートファイルダウンロード

ヒント

今回は一つのデータを使いますが、まずは集計まで行い、集計結果に対して二通りの処理を行います。すなわち、売上日数の多い順、売上金額合計の多い順、と別々にソートツールを使いソートを行い、二つのデータストリームにします。

この後、結合ツールで二つのデータストリームを結合するようにしてください。

出力レコードに順序については、売上日数の降順を行い、さらに売上金額の降順のソートを行ってください(一つのツールで二つのソートを行います)。

解答編へ

コメント

タイトルとURLをコピーしました