빅데이터 분석/Python
[시계열 분석] 부분자기상관함수(PACF)
Colin Kim
2022. 7. 20. 22:50
반응형
statsmodels.graphics.tsaplots의 plot_pacf를 이용한 시계열데이터의 특성을 파악할수 있는 중요한 지표이다.
statsmodels.graphics.tsaplots. plot_pacf (
x ,
ax = None ,
lags = None ,
alpha = 0.05 ,
method = 'ywm' ,
use_vlines = True ,
title = 'Partial Autocorrelation' ,
zero = True ,
vlines_kwargs = None ,
** kwargs )
- x : 시계열데이터
- ax : 주어진 경우 이 서브플롯은 새 그림을 만드는 대신 플롯하는 데 사용됩니다.
- lags : 가로 축에 사용되는 int 또는 지연 값의 배열입니다. lags가 int일 때 np.arange(lags)를 사용합니다. 제공하지 않으면 lags=np.arange(len(corr))사용됩니다.
- alpha : 숫자가 주어지면 주어진 수준에 대한 신뢰 구간이 반환됩니다. 예를 들어 alpha=.05인 경우 표준 편차가 1/sqrt(len(x))에 따라 계산되는 95% 신뢰 구간이 반환됩니다.
- method : 사용할 계산 방법을 지정합니다.
- "ywm" 또는 "ywmle": 조정 없는 율-워커. 기본.
- "yw" 또는 "ywadjusted" : acovf에 대한 분모의 샘플 크기 조정이 있는 Yule-Walker. 기본.
- "ols" : 시차와 상수에 대한 시계열 회귀.
- "ols-inefficient": 모든 pacf 계수를 추정하기 위해 단일 공통 샘플을 사용하여 지연에 대한 시계열 회귀.
- "ols-adjusted" : 편향 조정이 있는 시차에 대한 시계열 회귀.
- "ld" 또는 "ldadjusted" : 편향 수정을 사용한 Levinson-Durbin 재귀.
- "ldb" 또는 "ldbiased" : 편향 수정이 없는 Levinson-Durbin 재귀.
- use_vlines : True이면 수직선과 마커가 그려집니다. False이면 마커만 그려집니다. 기본 마커는 'o'입니다. markerkwarg 로 재정의할 수 있습니다 .
- title : 플롯에 배치할 제목입니다. 기본값은 'Partial Autocorrelation'입니다.
- zero : 0 지연 자기상관을 포함할지 여부를 나타내는 플래그입니다. 기본값은 True입니다.
- vlines_kwargs : vlines에 전달되는 키워드 인수의 선택적 사전입니다.
- ** kwargs : plotMatplotlib 및 axhline함수 에 직접 전달되는 선택적 키워드 인수입니다 .
원본데이터
plot_pacf(data)
차분한 데이터
plot_pacf(data.diff(periods=1).iloc[1:])
- 정상성 데이터의 경우 빠르게 0에 수렴한다.
- 첫번째 막대는 자기자신의 상관관계 이므로 항상 1이다.
시계열 데이터의 특성을 파악하기 위해 부분자기상관함수(PACF)를 이용해 시각화할수 있다.
반응형