データサイエンス100本ノックをAlteryxですべて完了したので、ちょっとした統計を取ってみたいと思います。
そもそもAlteryxのワークフローである「yxmd形式」のファイルは、中身はXMLファイルです。そのため、簡単(?)に解析することができます。
今回、solutionファイルからどのようなツールが使われているか、抽出してカウントを取りました。ちなみに、コメント、エクスプローラーボックス、ツールコンテナは省いて集計をしています。また、solutionファイル内では複数回答している問題もありますが、全て集計対象としています。
結果としては以下の通りとなります。
実際のワークフローとしては閲覧、データ入力、セレクト、サンプリング、テキスト入力はここまで多くないと思われます(問題の出し方上の都合上、どうしてもこれらのツールは実際よりも増加傾向になります)が、重要なツールであることに間違いありません。
ここに出てきているツールは基本的なツールが多く、実際にAlteryxを使っていてもよく使うツールばかりかと思います。さすがに1回しか使っていないようなツールは特定の分析を行う方が使うようなツールが多いように思います。その中でも、列分割、フィールドサマリーあたりは一般的な分析で使うツールかと思います。
私の経験も踏まえて、重要度という項目を追加してみました。
N0 | ツール | Count | 重要度 | コメント |
---|---|---|---|---|
1 | 閲覧 | 304 | ★★★ | 必須 |
2 | セレクト | 191 | ★★★ | 必須 |
3 | サンプリング | 130 | ★★★ | 必須 |
4 | データ入力 | 122 | ★★★ | 必須 |
5 | テキスト入力 | 116 | ★★★ | 必須 |
6 | フィルター | 86 | ★★★ | 必須 |
7 | フォーミュラ | 81 | ★★★ | 必須 |
8 | ソート | 76 | ★★★ | 必須 |
9 | 集計 | 68 | ★★★ | 必須 |
10 | 結合 | 44 | ★★★ | 必須 |
11 | 日時 | 22 | ★★★ | フォーミュラでも代替可能 |
12 | レコードカウント | 15 | ★★★ | 必須 |
13 | レコードID | 13 | ★★★ | 必須 |
14 | フィールド付加 | 12 | ★★★ | 必須 |
15 | 複数行フォーミュラ | 10 | ★★★ | 必須 |
16 | ユニーク | 9 | ★★★ | 集計でも代替可能 |
17 | 正規表現 | 8 | ★★★ | 必須 |
18 | 転置 | 7 | ★★★ | 必須 |
19 | 複数フィールドフォーミュラ | 7 | ★★★ | 必須 |
20 | ユニオン | 7 | ★★★ | 必須 |
21 | 動的リネーム | 5 | ★★ | 知っていると便利 |
22 | 基本データプロファイル | 5 | ★★ | 知っていると便利 |
23 | データ出力 | 4 | ★★★ | 必須 |
24 | クロスタブ | 4 | ★★★ | 必須 |
25 | 検索置換 | 4 | ★★★ | 結合でも代替可能な場合が多い |
26 | オートフィールド | 3 | ★★ | 知っていると便利 |
27 | データクレンジング | 3 | ★★ | 知っていると便利 |
28 | 複数結合 | 3 | ★★★ | 結合ツールでも代替可能 |
29 | レコード選択 | 3 | ★★★ | 必須 |
30 | ポイント作成 | 2 | ★ | 空間分析で使用 |
31 | インピュテーション | 2 | ★ | 予測分析で使用 |
32 | タイル | 2 | ★★ | 知っていると便利 |
33 | オーバーサンプルフィールド | 1 | ★ | 予測分析で使用 |
34 | サンプル作成 | 1 | ★ | 予測分析で使用 |
35 | フィールドサマリー | 1 | ★★ | 知っていると便利 |
36 | ランダム%サンプリング | 1 | ★ | 予測分析で使用 |
37 | 列分割 | 1 | ★★★ | 必須 |
38 | 距離 | 1 | ★ | 空間分析で使用 |
今回、使用回数が少ないのに重要なツールが2つあり、列分割は実際はもっとよく使うと思います。いずれにしても、コメントに「必須」と書いている★3つのツールは使い方を覚えておくとワークフローの作成がはかどると思います。
おまけの統計結果
上記統計結果をExcelとPDF形式で公開したいと思います。興味のある方は御覧ください。
TableauでViz化
Tableau PublicでViz化してみました。
コメント