상세 컨텐츠

본문 제목

[시계열 스터디] Time Series Regression

심화 스터디/시계열

by min51 2022. 9. 14. 00:35

본문

작성자: 15기 최민경

본 포스팅은 https://www.youtube.com/watch?v=pxG4ZlHJ570&list=PLpIPLT0Pf7IqSuMx237SHRdLd5ZA4AQwd&index=6를 를 바탕으로 작성되었습니다.


Q1. 시계열 데이터 구성요소 4가지는?

A. 추세, 계절, 순환, 불규칙

 

 💡 시계열 회귀분석(TIme Series Regression)

yt: t시점에서의 값

TRt: t시점에서의 트렌드

et: error term, 트렌드 부분으로 설명하기 어려운 부분 (설명할 수 없는 부분)

 

Q2. error term의 조건(특징)은?

A. iid(independent identically distributed) mean=0, variance=시그마제곱

 

 

💡 Trends

  1. No Trend : 증가/감소 패턴이 없는 경우

 

  • 점추정(평균값으로)

  • 100(1-a)% prediction interval 구간추정

  • Trend가 있는 경우: Kth order polynomial (ex. linear trend, quadratic trend)
  • “TIME” is the ONLY explanatory variable

 

이때 계수들을 추정하는데 사용되는 게 Least-squared estimation(최소제곱법) : Loss function을 최소화하는 베타값들 찾기

 

  • linear trend

위 최소제곱법을 만족하기 위해선 loss function을 미분한 값이 0이 되어야 한다.

 

3. 예시

→ No trends - 평균으로 예측하거나 구간추정 Prediction Interval
→ linear : 선형회귀

 

→ t, t^2을 만들어서 다중선형회귀분석으로!

 

Q3. 일반적인 회귀분석이랑 비슷해 보이는데, 그렇다면 일반적인 회귀분석과 시계열 분석의 다른 점은?

를 위배할 가능성이 높다! → autocorrelation

따라서 일반적인 최소제곱법을 통한 파라미터 추정은 문제가 있을 수 있다!

 

 

 💡 Autocorrelation

  • correlation : 두 변수 사이의 관계를 -1 ~ 1값으로 표현하는 측도
  • Auto : self 자기 자신
  • Autocorrelation: 자기 자신과 한 시점 shift된 자기 자신의 correlation

 

  • 만약 autocorrelation이 있다면 위에서 사용한 회귀분석이 아닌 다른 방법을 활용해야 하고, 없다면 위 회귀분석 방법을 사용해도 된다.

 

  1. Positive Autocorrelation : positive error terms이 나오면 그 다음에도 따라서 positive error term이 나오고, negative error terms이 나오면 그 다음에도 negative error term이 나온다.

2. Negative Autocorrelation : positive error terms이 나오면 그 다음엔 따라서 negative error term이 나오고, negative error terms이 나오면 그 다음에 positive error term이 나온다.

3. Random Autocorrelation : autocorrelation 패턴이 없다

그렇다면 autocorrelation을 어떻게 판단할까?

 

1) residual plot을 통해 판단할 수 있다.

 

 

Q4.

→ 해석이 주관적일 수 있다.

 

2) Durbin-Watson Test : 한 시점 미룬(first-order) positive autocorrelation을 확인할 수 있다

 

위처럼 귀무가설을 세운 후,

 

threshold보다 작으면 autocorrelation이 있다! → 자기 자신과 이전 값이랑 너무 비슷한 거니까 positive autocorrelation있는거다.

 

 

Q5. 아래 두 개의 차이점은?

residual / error term

 

3) Durbin-Watson Test for Negative Autocorrelation

 

이때에는 negative autocorrelation이기 때문에 negative autocorrelation이 심할수록 검정통계량이 커진다.

 

 

Q6. Durbin-Watson Test의 한계점은?

first-order autocorrelation만 확인 가능하다는 단점

 

 

💡 Seasonal Variations

 

1. Constant Seasonal Variation

    : variation의 폭이 일정

2. Increasing Seasonal Variation

    : 시간이 지날수록 variation의 폭이 증가함 → 모델로 핸들링하기 어려워서 constant로 바꿔줄 필요가 있다.

 

 

  • Data transformation

1) 제곱근 변환 (square root transformation)

2) 로그 변환 (log transformation) : 더 자주 사용

 

관련글 더보기

댓글 영역