상세 컨텐츠

본문 제목

[시계열] ARIMA 모델 - Part 4

심화 스터디/시계열

by 죠_ 2022. 11. 3. 19:53

본문

작성자 : 김지호

 

본 포스팅은 Youtube 김성범 교수님의 ARIMA 모델 - Part4 강의영상을 참고하였습니다.

 

 

- Moving Average Model 

- Auto Regressive Model

- ARMA Model 

 

 

 

Q1. 세 모델 모두! 데이터가 정상성(Stationary)  를 만족하는 경우에만 적용한다.

 

 

Q2.  정상성(Stationary) 을 만족하는 데이터의 특징 2가지 

평균 일정. 분산 일정. 임의의 공분산이 시점 t에 의존하지 않고, 시간의 차이인 h에만 의존함

 

 

Q3. 다음 데이터는 정상성(Stationary) 를 가진다고 볼 수 있을까? 

평균이 일정하지 않아서 X

,  분산이 일정하지 않아서

 

Q4.  시계열 데이터가 정상성(Stationary) 을 가지는지 확인할 수 있는 방법 

  • 1. 그래프 확인 
  • 2. 자기 상관 함수 (ACF; Auto Correlation Function)을 이용

 

 

Q5. 삼성전자의 주가데이터를 차분하기 전과 후의 ACF 그림입니다 둘 중 어떤 그래프가 차분 후를 나타내고 있을까요? ㅎ_ㅎ

 

lag 1 이후에 확 떨어지는 걸 보아하니 ........ stationary해진거 같다ㅎㅎ

 

Q6.  정상성을 만족하도록 자료를 변환하는 방법 2가지

  • 차분 (Differencing)
  • 로그 변환

 


Moving Average Model

를 (White Noise)로 모델링. 과거의 white noise들이 변수가 된다.

 

Hyperparameter : q

ACF 값이 급격하게 떨어지는 lag(차수)로 설정하면 된다

parameter : θ 

 

Q6.  이 데이터에 대해 MA모델을 적용시키려고 할 때, MA 모델의 차수는 몇으로 정하면 될까

1. 1 lag 이후로 ACF 급격히 떨어지기 때문에

 

MA(1)

- Auto Correlation Function

 

실제 데이터가 비슷한 경향을 보이면 MA(1) 이라 부르기로

 

MA(2)

- Auto Correlation Function 

MA(3)

MA(4) ....


Auto Regressive Model

를 예측할 때 의 lag된 변수들(자신의 과거 데이터)을 사용하는 회귀모델

  • 정상성 만족하고
  • 현재 데이터과 과거 데이터와 독립이 아닌 경우 사용할 수 있다

Hyperparameter : p

어떻게 정하면 좋을까 : PACF에서 값이 확 떨어지는 지점! 

parameter : θ 

 

Q. multiple regression 과의 차이점 

  • 자기자신을 갖고 모델링을 하기 때문에 독립성이 없다.
  • (계수)를 추정할 때 일반적으로 사용했던 최소제곱법은 사용할 수 없다.

 

AR(1)

- Auto Covariance Function -> Auto Correlation Function 


관련글 더보기

댓글 영역