작성자: 15기 최민경
본 포스팅은 https://www.youtube.com/watch?v=pxG4ZlHJ570&list=PLpIPLT0Pf7IqSuMx237SHRdLd5ZA4AQwd&index=6를 를 바탕으로 작성되었습니다.
Q1. 시계열 데이터 구성요소 4가지는?
A. 추세, 계절, 순환, 불규칙
💡 시계열 회귀분석(TIme Series Regression)
yt: t시점에서의 값
TRt: t시점에서의 트렌드
et: error term, 트렌드 부분으로 설명하기 어려운 부분 (설명할 수 없는 부분)
Q2. error term의 조건(특징)은?
A. iid(independent identically distributed) mean=0, variance=시그마제곱
💡 Trends
이때 계수들을 추정하는데 사용되는 게 Least-squared estimation(최소제곱법) : Loss function을 최소화하는 베타값들 찾기
위 최소제곱법을 만족하기 위해선 loss function을 미분한 값이 0이 되어야 한다.
3. 예시
Q3. 일반적인 회귀분석이랑 비슷해 보이는데, 그렇다면 일반적인 회귀분석과 시계열 분석의 다른 점은?
를 위배할 가능성이 높다! → autocorrelation
따라서 일반적인 최소제곱법을 통한 파라미터 추정은 문제가 있을 수 있다!
💡 Autocorrelation
2. Negative Autocorrelation : positive error terms이 나오면 그 다음엔 따라서 negative error term이 나오고, negative error terms이 나오면 그 다음에 positive error term이 나온다.
3. Random Autocorrelation : autocorrelation 패턴이 없다
그렇다면 autocorrelation을 어떻게 판단할까?
1) residual plot을 통해 판단할 수 있다.
Q4.
→ 해석이 주관적일 수 있다.
2) Durbin-Watson Test : 한 시점 미룬(first-order) positive autocorrelation을 확인할 수 있다
위처럼 귀무가설을 세운 후,
threshold보다 작으면 autocorrelation이 있다! → 자기 자신과 이전 값이랑 너무 비슷한 거니까 positive autocorrelation있는거다.
Q5. 아래 두 개의 차이점은?
residual / error term
3) Durbin-Watson Test for Negative Autocorrelation
이때에는 negative autocorrelation이기 때문에 negative autocorrelation이 심할수록 검정통계량이 커진다.
Q6. Durbin-Watson Test의 한계점은?
first-order autocorrelation만 확인 가능하다는 단점
💡 Seasonal Variations
1. Constant Seasonal Variation
: variation의 폭이 일정
2. Increasing Seasonal Variation
: 시간이 지날수록 variation의 폭이 증가함 → 모델로 핸들링하기 어려워서 constant로 바꿔줄 필요가 있다.
1) 제곱근 변환 (square root transformation)
2) 로그 변환 (log transformation) : 더 자주 사용
[시계열 스터디] ARIMA Model part2 (1) | 2022.09.25 |
---|---|
[시계열 스터디] ARIMA Model Part 1 (1) | 2022.09.25 |
[시계열 스터디] Exponential Smoothing (0) | 2022.09.25 |
[시계열 데이터] Seasonal Variation (0) | 2022.09.23 |
[시계열 스터디] 시계열 데이터의 특성 (1) | 2022.09.13 |
댓글 영역