データサイエンス100本ノックをAlteryxで。78日目(問題)

問題編 100本ノック

このページは問題編です

設問

P-078: レシート明細データ(receipt.csv)の売上金額(amount)を顧客単位に合計し、合計した売上金額の外れ値を抽出せよ。ただし、顧客IDが”Z”から始まるのものは非会員を表すため、除外して計算すること。なお、ここでは外れ値を第1四分位と第3四分位の差であるIQRを用いて、「第1四分位数-1.5×IQR」を下回るもの、または「第3四分位数+1.5×IQR」を超えるものとする。結果は10件表示せよ。

※結果はcustomer_idの昇順でソートすること

スタートファイルダウンロード

ヒント

32問目で行ったパーセンタイル(第一四分位(25%)、第三四分位(75%))を取得し、これを使って外れ値を抽出する問題です。問題文の通り進めれば問題ないかと思います。パーセンタイル値を得るときは、集計ツールで自分で手入力する必要があります。

解答編へ

コメント

タイトルとURLをコピーしました