Rを用いた訪日観光客の時系列分析

インバウンドの訪日外国人動向を利用して、時系列分析をしてみました。

JTB総合研究所のサイトにインバウンドの訪日外国人動向ということで、1996年1月から2018年3月までの月別の訪日外国人数のデータがあったので、これを利用しての分析です。

観測データはそのままだと、たまたま季節変動によるプラスによる影響で上がっているように見えるだけで、実際のトレンドは下がっていたりします。この問題を解決するために、観測データを「トレンド＋季節変動＋残差」に分けるモデルがあります。

今回はインバウンドの訪日外国人の数を「トレンド＋季節変動＋残差」に分割してみて、本当に訪日外国人が増えているのか、そして季節による変動はあるのかをチェックしてみます。

インプットデータの加工
Rで分析
考察
1. トレンド
2. 季節変動
まとめ
参考

インプットデータの加工

データはエクセル形式なので、解析に必要な人数だけのデータにしたcsvにします。

csvでは日時は入れずに、数だけ抜き取っています。分析するときに年月をセットするのでこれで問題ありません。

Rで分析

Rを利用して時系列分析しました。

ファイルの読み込み¶

df = read.table(file = "~/Desktop/analysis/R/time/input/inbound.csv", header = T)

モデルの作成¶

# ts : 時系列オブジェクトを生成する
# start = c(1996,1) : 最初の観測値の時間。1996年1月がスタート
# frequency = 12 : 時間単位毎の観測値数。今回は月ごとのデータなので、12回で1年となる
xt = ts(as.numeric(df$number), start = c(1996,1), frequency = 12)

プロット¶

plot(xt)

# stl : 時系列データを、トレンド、周期変動、残差に分解する関数
xt.stl<-stl(xt, s.window="periodic")
plot(xt.stl)

# 季節調整した部分を分離したい場合は、トレンドと残差を足す
plot(xt.stl$time.series[,2]+xt.stl$time.series[,3])

ファイルで出力¶

# csvファイルで出力
write.csv(xt.stl$time.series[,1], file = 'seasonal.csv', row.names = F)
write.csv(xt.stl$time.series[,2], file = 'trend.csv', row.names = F)
write.csv(xt.stl$time.series[,3], file = 'remainder.csv', row.names = F)