データサイエンス100本ノックをAlteryxで。33日目(解答)

100本ノック

このページは解答編です。

↓ネ

↓タ

↓バ

↓レ

↓防

↓止

答えと解説

設問はこちらでした。

P-033: レシート明細データ(receipt.csv)に対し、店舗コード(store_cd)ごとに売上金額(amount)の平均を計算し、330以上のものを抽出せよ。

※結果はstore_cdの昇順に並べ替えること

解答ワークフローは以下のようになります。

今回は、集計ツールとフィルターツールを使った基礎的な問題です。

各店舗コード(store_cd)ごとに売上金額(amount)の平均を計算するという問題ですが、このような場合は、グループ化を使っていきます。

まず、平均を計算するということなので、データ型を変える必要があります。いつものようにセレクトツールで型を変えていきましょう。ついでに不要な項目を削除します。

次に集計ツールを使ってstore_cdでグループ化し、amountの平均を取ります。設定は以下の通りです。

store_cdを選択し、追加ボタンからグループ化を選択します。次に、amountを選択し、追加ボタンから平均を選択します。

これで、各店舗コード(store_cd)ごとに売上金額(amount)の平均が得られます。あとは、売上金額の平均のうち330以上のレコードのみをフィルターツールで抽出します。

設定は以下の通り、基本フィルターで「Avg_amount」フィールドを選択し、演算子は「>=」、値は「330」を設定します。

あとは、store_cdの昇順に並び替えれば完了です。

まとめ

今回は素直な問題です。集計を行い、特定の値以上のレコードを抽出するという基本的な問題でした。

解答ワークフローダウンロード

コメント

タイトルとURLをコピーしました