データサイエンス100本ノックをAlteryxで。89日目(問題)

問題編 100本ノック

このページは問題編です

設問

P-089: 売上実績がある顧客を、予測モデル構築のため学習用データとテスト用データに分割したい。それぞれ8:2の割合でランダムにデータを分割せよ。

※全体のレコード数を「TotalCount」、学習データのレコード数を「Count」とし、学習データの割合を出力すること(フィールド名は「学習データ割合」とする)

スタートファイルダウンロード

ヒント

問題には長々と書かれていませんが、customer.csvにreceipt.csvの売上データを付与しましょう。これにより、売上実績がある顧客を特定できます。

また、機械学習のモデル構築準備の際に必要とされる学習用データとテスト用データに分ける場合、サンプル作成ツールが使えます。

解答編へ

コメント

タイトルとURLをコピーしました