상세 컨텐츠

본문 제목

[시계열 스터디] ARIMA Model Part 1

심화 스터디/시계열

by Ty1en01 2022. 9. 25. 15:32

본문

지난 주차 리뷰

  • Time series Regression 3
  • 지수평활법 (Exponential Smoothing)

 

1. 정상/비정상 프로세스

정상 프로세스

시간이 흘러도 평균과 분산이 일정한 시계열 데이터

 

정상성 확인

  • ACF: Autocorrelation Function

x축을 타겟 변수와의 시차(lag), y축을 correlation으로 놓은 plot

  • PACF: Partial Autocorrelation Function

ACF에서 시차 사이에 낀 다른 시차의 영향력을 제거한 함수

 

 

Quiz: 그렇다면 비정상 프로세스는? 아래 그림들이 비정상 프로세스인 이유는 각각 무엇인가?

 

 

비정상 프로세스

평균, 분산이 일정하지 않은 데이터

Autocorrelation plot으로 확인!

 

Case 1)

 

Case 2)

 

2. AR, MA, ARMA, ARIMA

AR - Autoregressive Model

Quiz: 여기서 Auto의 의미는?

 

타겟변수(dependent)의 lag를 독립변수(independent)로 활용하는 모델!

Quiz: 일반 다중 회귀분석과의 차이?

 

 

 

 

  • 독립 가정이 깨짐, 설명 변수들이 일반적으로 독립이 아님...!
  • 따라서 최소제곱법 사용이 곤란함

 

MA - Moving Average

타겟변수(dependent)의 현재, 과거 에러를 독립변수(independent)로 활용하는 모델!

연속적인 error term으로 타겟변수와의 관계 모델링

 

past error가 white noise 분포를 따른다?

-> 해당 모델에서 타겟변수 평균과 분포가 t의 관점에서 일정하다(Stationary)

이에 대한 설명: https://datalabbit.tistory.com/121

 

ARMA - Autoregressive and Moving Average

 

ARIMA -  Autoregressive Integrated Moving Average

ARMA 모델을 피팅하기 전에 정상성(Stationary) 가정을 만족하기 위해서 Differencing을 해줌!

이후 모델을 피팅하면 Intergrated된 것으로 이해

 

3. 차분(Differencing)

차분의 개념

Quiz: 이 강의 슬라이드에는 사실 오류가 있다...! 무엇일까?

(Hint: 1차 미분, 2차 미분 ... d차 미분이 뭐더라?)

 

 

!차분 차수 바로잡기

n차 차분을 다시 차분한 것을 n+1차 차분이라고 함...!

 

Order of Differencing

  • Stationary하면 필요 없음!
  • 간단하면 1차에서, 대부분의 경우에 2차에서 해결됨
  • 3차 이상의 차분이 필요하면 ARIMA 모델에 안 맞을 가능성 높음

Quiz: A, B, C 중에서 각각 데이터 원본, 1차 차분, 2차 차분은 무엇일까?

 

 

 

관련글 더보기

댓글 영역