반응형
statsmodels.graphics.tsaplots의 plot_acf를 이용한 시계열데이터의 특성을 파악할수 있는 중요한 지표이다.
statsmodels.graphics.tsaplots. plot_acf (
x ,
ax = None ,
lags = None ,
alpha = 0.05 ,
use_vlines = True ,
fixed = False ,
fft = False ,
missing = 'none' ,
title = 'Autocorrelation' ,
zero = True ,
auto_ylims = False ,
bartlett_confint =True ,
vlines_kwargs = 없음 ,
** kwargs )
- x : 시계열데이터
- ax : 주어진 경우 이 서브플롯은 새 그림을 만드는 대신 플롯하는 데 사용됩니다.
- lags : 가로 축에 사용되는 int 또는 지연 값의 배열입니다. lags가 int일 때 np.arange(lags)를 사용합니다. 제공하지 않으면 lags=np.arange(len(corr))사용됩니다.
- alpha : 숫자가 주어지면 주어진 수준에 대한 신뢰 구간이 반환됩니다. 예를 들어 alpha=0.5인 경우 Bartlett 공식에 따라 표준 편차가 계산되는 95% 신뢰 구간이 반환됩니다. None이면 신뢰 구간이 표시되지 않습니다.
- use_vlines : True이면 수직선과 마커가 그려집니다. False이면 마커만 그려집니다. 기본 마커는 'o'입니다. markerkwarg 로 재정의할 수 있습니다 .
- adjusted : True이면 자기공분산의 분모는 nk이고, 그렇지 않으면 n입니다.
- fft : True이면 FFT를 통해 ACF를 계산합니다.
- missing : NaN을 처리하는 방법을 지정하는 ['none', 'raise', 'conservative', 'drop'] 문자열입니다.
- title : 플롯에 배치할 제목입니다. 기본값은 'Autocorrelation'입니다.
- zero : 0 지연 자기상관을 포함할지 여부를 나타내는 플래그입니다. 기본값은 True입니다.
- auto_ylims : True인 경우 y축 제한을 ACF 값으로 자동 조정합니다.
- bartlett_confint : ACF 값에 대한 신뢰 구간은 일반적으로 r_k 주변의 2 표준 오류에 배치됩니다. 표준 오차에 사용되는 공식은 상황에 따라 다릅니다. ARIMA 루틴의 일부로 잔차의 무작위성을 테스트하기 위해 자기상관이 사용되는 경우 잔차가 백색 잡음이라고 가정하여 표준 오차가 결정됩니다. 지연에 대한 대략적인 공식은 각 r_k = 1/sqrt(N)의 표준 오차입니다. 1/sqrt(N) 결과에 대한 자세한 내용은 [1]의 섹션 9.4를 참조하세요. 더 기본적인 논의는 [2]의 섹션 5.3.2를 참조하십시오. 원시 데이터의 ACF의 경우, 올바른 모델이 MA(k-1)인 것처럼 시차 k에서의 표준 오차가 발견됩니다. 이것은 특정 시차를 지나는 모든 자기상관이 한계 내에 있는 경우 모델이 마지막 유의한 자기상관에 의해 정의된 MA가 될 수 있다는 가능한 해석을 허용합니다. 이 경우, 데이터에 대해 이동 평균 모델을 가정하고 Bartlett 공식을 사용하여 신뢰 구간에 대한 표준 오차를 생성해야 합니다.
- vlines_kwargs : vlines에 전달되는 키워드 인수의 선택적 사전입니다.
- ** kwargs : plotMatplotlib 및 axhline함수 에 직접 전달되는 선택적 키워드 인수입니다
원본데이터
plot_acf(data)
- 정상성 데이터가 아닐경우 위와 같은 느리게 감소한다.
차분한 데이터
plot_acf(data.diff(periods=1).iloc[1:])
- 정상성 데이터의 경우 빠르게 0에 수렴한다.
- 첫번째 막대는 자기자신의 상관관계 이므로 항상 1이다.
시계열 데이터의 특성을 파악하기 위해 자기상관함수(ACF)를 이용해 시각화할수 있다.
반응형
'빅데이터 분석 > Python' 카테고리의 다른 글
[시계열 분석] 부분자기상관함수(PACF) (0) | 2022.07.20 |
---|---|
[ADF test] 정상성 테스트 (0) | 2022.07.20 |
[seasonal_decompose] 시계열 데이터 분해 (0) | 2022.07.20 |
[chunksize]대용량 데이터 읽어오기 (0) | 2022.07.20 |