このページは問題編です
それでは、実際に「データサイエンス100本ノック」をAlteryxでやっていきたいと思います。興味のある方はいっしょに進めていただければと思います。
今回、初日となりますので本シリーズの記載ルールも含めて解説していきたいと思います。
問題文は「設問」のところでご紹介します。ベースはPython用の問題文ですが、Alteryxの場合はデータを読み込むところから始まりますので、インプットはすでに読み込み済みのPythonと異なり、どのCSVファイルを使うかを指定します。なお、別途YXZP形式でも配布しますので、それを利用する場合はデータの入力についてあまり考慮する必要はありません。
「ヒント」については、軽いヒントを記載します。使用するツール名をそのまま書いてしまうと、ほぼ解答になってしまうケースも多いので軽めのヒントにしたいと思います。なお、開始用のstartファイルをYXZP形式で配布しますので、こちらにはもう少し具体的なヒントも入れるようにします。
最後に「答えと解説」のところで詳細な解説をしたいと思います。もちろん解答例のワークフローも添付します。
設問
P-001: レシート明細データ(receipt.csv)から全項目の先頭10件を表示し、どのようなデータを保有しているか目視で確認せよ。
スタートファイルダウンロード
ヒント
レコードを絞る場合はいくつかのツールが利用できます。余裕のある方は複数の方法で試してみてください。
コメント