データサイエンス100本ノックをAlteryxで。83日目(問題)

問題編 100本ノック

このページは問題編です

設問

P-083: 商品データ(product.csv)の単価(unit_price)と原価(unit_cost)の欠損値について、各商品のカテゴリ小区分コード(category_small_cd)ごとに算出した中央値で補完した新たな商品データを作成せよ。なお、中央値については1円未満を丸めること(四捨五入または偶数への丸めで良い)。補完実施後、各項目について欠損が生じていないことも確認すること。

※結果はproduct_cdの昇順で並び替えること

スタートファイルダウンロード

※2022/10/22 結果をproduct_cdで並び替えるように変更しました

ヒント

80問目の欠損値のデータを補完する問題です。今回は中央値で補完するという問題ですが、各カテゴリ小区分コード(category_small_cd)ごとに中央値を計算する必要があります。このような場合にインピュテーションツールを使うと非常に冗長になってしまうので、82問目の別解を少し変更することで対応が可能です。どうしてもインピュテーションツールが使いたい場合はマクロ(バッチマクロ)でも対応可能です。

解答編へ

コメント

タイトルとURLをコピーしました