時系列データから規則性を知る
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
次の&aname(t05){表 5}; は、茨城県の高等学校卒業者に占める進学者数の推移である。前節の「対応しているデータ」の場合と似ているが、このような時間に対して何らかの変量を取るデータを時系列データという。それでは、このようなデータについて、時間的変動パターンの規則性を知るためにはどのようにすればよいか。
CENTER:表 5 進学者数の推移&aname(t05);
#br
|CENTER:|CENTER:|c
|年度 | 進学者数|h
|CENTER:|CENTER:|c
|~2008 |13,593|
|~2009 |13,684|
|~2010 |13,273|
|~2011 |13,090|
|~2012 |12,894|
|~2013 |12,380|
|~2014 |12,679|
|~2015 |12,867|
|~2016 |12,764|
|~2017 |12,940|
|~2018 |12,701|
|~2019 |12,645|
#br
*考え方と適用手法 [#h928b185]
時系列データの変動パターンを視覚的にとらえて把握するためには、いわゆる折れ線グラフを適用する。さらに、傾向変動をとらえるために目測法、移動平均法、指数平滑化法、最小二乗法(回帰分析)などが適用できる。ただし、変動パターンは直線的とは限らないので、以下のどの方法が適切か、データのどの期間に適用できるのか等、個々のデータの特性に応じてよく吟味する必要がある。
*目測法 [#u784d7be]
観測者の主観により、折れ線グラフの傾向に最適と思われる直線を目分量で引く。当然のことながら、観測者により異なった直線が得られる。
*移動平均法 [#eb52bbd6]
一定期間の平均を、期間の位置をずらしながら求めた移動平均値により、傾向線(移動平均線)を求める方法を移動平均法と呼ぶ。平均をとる一定期間の間隔を調節することで、短期、中期、長期の傾向を把握することができる。移動平均線は実際の動きを平滑化し、少し遅れて追随する。
*指数平滑化法 [#ibca0b4d]
時点 $t$ における観測データを $x(t)$ としたときに、1つ先の時点 $t+1$ の予測値 $\hat{x}(t,1)$ を次の式で求める方法である。
$$
\hat{x}(t,1)=\alpha\cdot x(t)+(1-\alpha )\cdot\hat{x}(t-1,1)
$$
$\alpha$ は $0<\alpha <1$ の定数で、予測にあたり、前回の実測値と予測値をどのような配分で利用するかを決める定数である。例えば、$\alpha=0.8$ であれば、観測値の 8 割りと予測値の 2 割りを足して予測値とすることを意味している。ただし、初回の予測値はその前回の実測値を充てて開始する。
*最小二乗法(回帰分析) [#b231be1d]
近似直線を求める方法であり、既述の回帰分析と全く同じ方法である。ただし、時間軸のスケールについては、必要に応じて工夫することが多い。直線的傾向の強いデータに適用する必要がある。
&aname(f07);
#ref(tsd.png,center)
CENTER:図 7 進学者数の推移
RIGHT:[[[授業計画に戻る>データサイエンスII#c1bb5116]]]
終了行:
次の&aname(t05){表 5}; は、茨城県の高等学校卒業者に占める進学者数の推移である。前節の「対応しているデータ」の場合と似ているが、このような時間に対して何らかの変量を取るデータを時系列データという。それでは、このようなデータについて、時間的変動パターンの規則性を知るためにはどのようにすればよいか。
CENTER:表 5 進学者数の推移&aname(t05);
#br
|CENTER:|CENTER:|c
|年度 | 進学者数|h
|CENTER:|CENTER:|c
|~2008 |13,593|
|~2009 |13,684|
|~2010 |13,273|
|~2011 |13,090|
|~2012 |12,894|
|~2013 |12,380|
|~2014 |12,679|
|~2015 |12,867|
|~2016 |12,764|
|~2017 |12,940|
|~2018 |12,701|
|~2019 |12,645|
#br
*考え方と適用手法 [#h928b185]
時系列データの変動パターンを視覚的にとらえて把握するためには、いわゆる折れ線グラフを適用する。さらに、傾向変動をとらえるために目測法、移動平均法、指数平滑化法、最小二乗法(回帰分析)などが適用できる。ただし、変動パターンは直線的とは限らないので、以下のどの方法が適切か、データのどの期間に適用できるのか等、個々のデータの特性に応じてよく吟味する必要がある。
*目測法 [#u784d7be]
観測者の主観により、折れ線グラフの傾向に最適と思われる直線を目分量で引く。当然のことながら、観測者により異なった直線が得られる。
*移動平均法 [#eb52bbd6]
一定期間の平均を、期間の位置をずらしながら求めた移動平均値により、傾向線(移動平均線)を求める方法を移動平均法と呼ぶ。平均をとる一定期間の間隔を調節することで、短期、中期、長期の傾向を把握することができる。移動平均線は実際の動きを平滑化し、少し遅れて追随する。
*指数平滑化法 [#ibca0b4d]
時点 $t$ における観測データを $x(t)$ としたときに、1つ先の時点 $t+1$ の予測値 $\hat{x}(t,1)$ を次の式で求める方法である。
$$
\hat{x}(t,1)=\alpha\cdot x(t)+(1-\alpha )\cdot\hat{x}(t-1,1)
$$
$\alpha$ は $0<\alpha <1$ の定数で、予測にあたり、前回の実測値と予測値をどのような配分で利用するかを決める定数である。例えば、$\alpha=0.8$ であれば、観測値の 8 割りと予測値の 2 割りを足して予測値とすることを意味している。ただし、初回の予測値はその前回の実測値を充てて開始する。
*最小二乗法(回帰分析) [#b231be1d]
近似直線を求める方法であり、既述の回帰分析と全く同じ方法である。ただし、時間軸のスケールについては、必要に応じて工夫することが多い。直線的傾向の強いデータに適用する必要がある。
&aname(f07);
#ref(tsd.png,center)
CENTER:図 7 進学者数の推移
RIGHT:[[[授業計画に戻る>データサイエンスII#c1bb5116]]]
ページ名: