このページは問題編です
設問
P-078: レシート明細データ(receipt.csv)の売上金額(amount)を顧客単位に合計し、合計した売上金額の外れ値を抽出せよ。ただし、顧客IDが”Z”から始まるのものは非会員を表すため、除外して計算すること。なお、ここでは外れ値を第1四分位と第3四分位の差であるIQRを用いて、「第1四分位数-1.5×IQR」を下回るもの、または「第3四分位数+1.5×IQR」を超えるものとする。結果は10件表示せよ。
※結果はcustomer_idの昇順でソートすること
スタートファイルダウンロード
ヒント
32問目で行ったパーセンタイル(第一四分位(25%)、第三四分位(75%))を取得し、これを使って外れ値を抽出する問題です。問題文の通り進めれば問題ないかと思います。パーセンタイル値を得るときは、集計ツールで自分で手入力する必要があります。
コメント