このページは問題編です
設問
P-077: レシート明細データ(receipt.csv)の売上金額を顧客単位に合計し、合計した売上金額の外れ値を抽出せよ。なお、外れ値は売上金額合計を対数化したうえで平均と標準偏差を計算し、その平均から3σを超えて離れたものとする(自然対数と常用対数のどちらでも可)。結果は10件表示せよ。
※標準偏差は、ワークフローを簡略化するためn-1で割る標準偏差を使用すること
※スケール化(標準化)すること(フィールド名はscaleとする)
スタートファイルダウンロード
ヒント
59問目で行った標準化、61,62問目で行った対数化を組み合わせる問題です。
なお、σは標準偏差のことです。標準化することでσは1となります。つまり3σは、標準化していると3となります。
コメント