빅데이터 분석/Python

[시계열 분석] 부분자기상관함수(PACF)

Colin Kim 2022. 7. 20. 22:50
반응형

 

statsmodels.graphics.tsaplots의 plot_pacf를 이용한 시계열데이터의 특성을 파악할수 있는 중요한 지표이다.

statsmodels.graphics.tsaplots. plot_pacf ( 
    x , 
    ax = None , 
    lags = None , 
    alpha = 0.05 , 
    method = 'ywm' , 
    use_vlines = True , 
    title = 'Partial Autocorrelation' , 
    zero = True , 
    vlines_kwargs = None , 
    ** kwargs )
  • x : 시계열데이터
  • ax : 주어진 경우 이 서브플롯은 새 그림을 만드는 대신 플롯하는 데 사용됩니다.
  • lags : 가로 축에 사용되는 int 또는 지연 값의 배열입니다. lags가 int일 때 np.arange(lags)를 사용합니다. 제공하지 않으면 lags=np.arange(len(corr))사용됩니다.
  • alpha : 숫자가 주어지면 주어진 수준에 대한 신뢰 구간이 반환됩니다. 예를 들어 alpha=.05인 경우 표준 편차가 1/sqrt(len(x))에 따라 계산되는 95% 신뢰 구간이 반환됩니다.
  • method : 사용할 계산 방법을 지정합니다.
    • "ywm" 또는 "ywmle": 조정 없는 율-워커. 기본.
    • "yw" 또는 "ywadjusted" : acovf에 대한 분모의 샘플 크기 조정이 있는 Yule-Walker. 기본.
    • "ols" : 시차와 상수에 대한 시계열 회귀.
    • "ols-inefficient": 모든 pacf 계수를 추정하기 위해 단일 공통 샘플을 사용하여 지연에 대한 시계열 회귀.
    • "ols-adjusted" : 편향 조정이 있는 시차에 대한 시계열 회귀.
    • "ld" 또는 "ldadjusted" : 편향 수정을 사용한 Levinson-Durbin 재귀.
    • "ldb" 또는 "ldbiased" : 편향 수정이 없는 Levinson-Durbin 재귀.
  • use_vlines : True이면 수직선과 마커가 그려집니다. False이면 마커만 그려집니다. 기본 마커는 'o'입니다. markerkwarg 로 재정의할 수 있습니다 .
  • title : 플롯에 배치할 제목입니다. 기본값은 'Partial Autocorrelation'입니다.
  • zero : 0 지연 자기상관을 포함할지 여부를 나타내는 플래그입니다. 기본값은 True입니다.
  • vlines_kwargs : vlines에 전달되는 키워드 인수의 선택적 사전입니다.
  • ** kwargs : plotMatplotlib 및 axhline함수 에 직접 전달되는 선택적 키워드 인수입니다 .

 

원본데이터

plot_pacf(data)

원본데이터의 부분자기상관함수 시각화

차분한 데이터

plot_pacf(data.diff(periods=1).iloc[1:])

차분한 데이터의 자기상관함수 시각화

  • 정상성 데이터의 경우 빠르게 0에 수렴한다.
  • 첫번째 막대는 자기자신의 상관관계 이므로 항상 1이다.

시계열 데이터의 특성을 파악하기 위해 부분자기상관함수(PACF)를 이용해 시각화할수 있다.

 

반응형