Alteryxでe-Statの境界データ(基本単位区)を一括ダウンロードする

Alteryx

本ブログはシリーズものです(が、単体でも使えると思います)。最初の記事であるe-Statの境界データについての説明のページはこちら。次の記事であるe-Statの境界データ(町丁・字等)一括ダウンロードについてはこちらですが、先にそちらの記事を読んでおくことを推奨します。

小地域(基本単位区)のデータを一括でダウンロードする

Alteryxでダウンロードツールを使ったデータのダウンロードの方法は、以前の記事を参照ください。

今回のステップとしては、以下のとおりです。

  1. 基本単位区の各地区を特定する5桁の数字の取得
  2. ダウンロード用URLを作成
  3. ファイル保存用パスを作成
  4. ダウンロード
  5. 利用するために解凍する

1.基本単位区の各地区を特定する5桁の数字の取得

町丁・字等をダウンロードする場合、県ごとにダウンロードでき、県番号は1~47と決まっていたためダウンロードURLを特定できるのは非常に簡単でした。

しかし、基本単位区については、5桁の数字となっており、どの番号でどの地区がダウンロードできるか、というのは対応する表がなければわかりません。

このシリーズの最初の記事で触れましたが、基本単位区の地区一覧はこちら(国勢調査の「都道府県・市区町村別の主な結果」)にあるExcelファイルで確認することができます。

このファイルの「都道府県・市区町村名」を見ると「01101_札幌市中央区」といった形で5桁の番号を入手することができます。

それでは、これをAlteryxで読み込んでみましょう。

欲しい部分は9行目にヘッダ、10行目からがデータとなっています。そのため、「データインポートの開始行」を9に設定します。

次に、「01101_札幌市中央区」となっているデータから左側の5文字を取得しましょう。明らかに区切り記号がわかっているので、列分割ツールを使います(もちろん、正規表現ツールなどでも可能です)。

設定としてはベーシックな設定です。分割する列は「都道府県・市区町村名」で、区切り文字は「_」、列に分割して、列数は「2」です。

ここまでのワークフローは以下のとおりです。

2.ダウンロード用URLを作成

次に、このデータをURLに含めていきたいと思います。

例えば、北海道札幌市中央区のダウンロードURLは以下のとおりです(世界測地系緯度経度・Shapefile)。

https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=B002005212020&code=01101&coordSys=1&format=shape&downloadType=5&datum=2000

地区によって異なるのは、code=のあとの5文字です。これをフォーミュラツールで表現すると、

"https://www.e-stat.go.jp/gis/statmap-search/data?dlserveyId=B002005212020&code="+[都道府県・市区町村名1]+"&coordSys=1&format=shape&downloadType=5&datum=2000"

となります。

3.ファイル保存用パスを作成

取得したファイルの保存用ファイル名を作成する必要があります。地区名で保存するのがわかりやすいため、以下のようにフォーミュラツールに設定します。保存先もワークフローをおいてあるフォルダの直下に「Basic」というフォルダを作成し(自分で作成する必要があります)、そこに保存するようにしたいと思います。

ここまでのワークフローは以下のとおりです。

4.ダウンロード

それでは、ダウンロードツールでダウンロードしていきましょう。具体的な設定方法は前回の記事を参照ください。ここでは、設定のみ記載します。

ちなみに、接続タブの最大接続はデフォルトでは2ですが、高速化のために4にしています。これもあまり大きくするとサーバーに負荷がかかるので気をつけて運用してください。

ちなみに私の環境ではすべてをダウンロードするのに30分くらいはかかりました。

5.利用するために解凍する

ダウンロードしたファイルは、解凍しなければ使うことができません。こちらは別記事にしていますので、そちらを参照願います。

一点気をつける点として、基本単位区の地区一覧には「00000_全国」など配布されていないデータもあります。このようなファイルは、ファイルサイズが22バイトと非常に小さなサイズになっているので、利用の際は除外する必要があります。ディレクトリツールでファイル一覧を読み込んだ際に、「Size」フィールドで22バイトのものは抜くようにしてください。

次回は、APIから境界データに紐づける情報をダウンロードしてみたいと思います(小地域に対応していますが、町丁・字等のレベルでの取得となります)。

サンプルワークフローダウンロード

コメント

タイトルとURLをコピーしました