AlteryxのARIMA共変量予測を行う

Alteryx

Alteryx Predictive Master資格取得を目指すシリーズです。

ARIMAモデルには共変量を使った予測が可能です。この共変量というのは線形回帰などで言うところの予測変数と同じようなものです。

ARIMA自体は過去のターゲット変数から予測を行いますが、それ以外の予測変数の影響も受ける可能性があり、これを考慮することができます。

ARIMA共変量予測を行う場合の注意事項をまず記載します。

  • 共変量は予測したい未来の区間のデータも必要です
  • 予測区間は、入力した共変量の区間と同じになります
  • 時系列比較ツール(時系列予測のモデル比較ツール)は利用できません

それでは実際に学習と予測を行っていきましょう。

ワークフロー

ワークフローは以下のようになります。

インプットデータ

まず、インプットデータです。実はYearとかMonthとか入っているのですが、この時系列予測ではあまり関係なくて、単純に上からの並びに対してレコード間の時間的な間隔が一定になっており、その間隔はARIMA/ETSツールで指定すれば良いだけです。

先頭から10行のみ表示

Bookingsがターゲット変数で、Snowfall(inches)が共変量です。つまり、スキー場の予約をするのに雪の深さを予測変数として使うイメージです。

ARIMAツールの設定

次に、ARIMAツールの設定を見ていきましょう。

ポイントは、「モデル推定に共変量を使用しますか?」にチェックが入り、共変量として「Snowfall(inches)」にチェックが入っていることです。

その他は、レコード間の時間的間隔は月なので、ターゲット・フィールドの頻度は「毎月」とします。

その他のオプションは以下のとおりです。

「シリーズ開始期間」を設定しておくと後々楽です。今回は、2002年の1月のデータなので、「シリーズが始まる年」は2002、「シリーズ開始の週、月、または四半期」は1としています(1月のデータのため)。

ARIMAツールのレポート

レポートは、関数呼び出しと係数が異なります。

関数呼び出しは、通常のARIMAと異なり、xregオプションが指定されています。

また、係数にSnowfall..inches.という項目ができています。

時系列共変量予測(TS Covariate Forecast)ツール

それでは予測していきましょう。共変量を用いた予測は通常の時系列予測ツールは使えず、時系列共変量予測ツールを使います。

大きな違いとして、共変量用の入力があることです。並べて比較してみましょう。

時系列予測は入力が一つですが、時系列共変量予測は入力が2つあります。R入力がモデル入力で、L入力が共変量を入力します。

※そして、なぜかアウトプットの並びが異なります・・・。

設定はほとんどやることなく、予測フィールドの名称と信頼区間の値のみです。

時系列予測では、予測区間を数値で入力していましたが、共変量予測はL入力に入力されたレコード数分の区間を予測するようになっています。

なお、今回L入力には以下のような入力を入れてみます。学習データの続きとなる年の降雪量が入っています。

これによる結果は、以下のとおりです。

O出力には、上のテーブルデータと同じものが出力されています。

サンプルワークフローダウンロード

Designerにもサンプルワークフローがあるのですが、データの入力の仕方が誤解を生みやすいような形だったので、サンプルワークフローをもとに作成し直しています(使っているデータは同じです)。

コメント

タイトルとURLをコピーしました