빅데이터 분석
[시계열 분석] 부분자기상관함수(PACF)
statsmodels.graphics.tsaplots의 plot_pacf를 이용한 시계열데이터의 특성을 파악할수 있는 중요한 지표이다. statsmodels.graphics.tsaplots. plot_pacf ( x , ax = None , lags = None , alpha = 0.05 , method = 'ywm' , use_vlines = True , title = 'Partial Autocorrelation' , zero = True , vlines_kwargs = None , ** kwargs ) x : 시계열데이터 ax : 주어진 경우 이 서브플롯은 새 그림을 만드는 대신 플롯하는 데 사용됩니다. lags : 가로 축에 사용되는 int 또는 지연 값의 배열입니다. lags가 int일 때 np...
[시계열분석] 자기 상관 함수(ACF)
statsmodels.graphics.tsaplots의 plot_acf를 이용한 시계열데이터의 특성을 파악할수 있는 중요한 지표이다. statsmodels.graphics.tsaplots. plot_acf ( x , ax = None , lags = None , alpha = 0.05 , use_vlines = True , fixed = False , fft = False , missing = 'none' , title = 'Autocorrelation' , zero = True , auto_ylims = False , bartlett_confint =True , vlines_kwargs = 없음 , ** kwargs ) x : 시계열데이터 ax : 주어진 경우 이 서브플롯은 새 그림을 만드는 대신 플롯..
[ADF test] 정상성 테스트
statsmodels.tsa.stattools의 adfuller를 이용해서 데이터의 정상성을 가지는지 파악할수 있다. statsmodels.tsa.stattools.adfuller( x, maxlag=None, regression='c', autolag='AIC', store=False, regresults=False) x : 데이터 maxlag : 테스트에 포함된 최대 지연, 기본값 12*(nobs/100)^{1/4}는 None regression : 회귀에 포함할 상수 및 추세 순서입니다. "c": 상수만(기본값). "ct": 상수 및 추세. "ctt": 일정하고 선형 및 이차 추세입니다. "n": 상수 없음, 추세 없음. autolag : 0, 1, …, maxlag 값 중 lag 길이를 자동으로 ..
![[seasonal_decompose] 시계열 데이터 분해](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbDaZra%2FbtrHPKUUEUw%2Fq2akOeXCtSS9wz8xRlISLk%2Fimg.png)
[seasonal_decompose] 시계열 데이터 분해
statsmodels.tsa.seasonal의 seasonal_decompose를 이용해서 추세, 계절성, 잔차를 파악할수 있다. statsmodels.tsa.seasonal. season_decompose ( x , model = 'additive' , filt = None , period = None , two_sided = True , extrapolate_trend = 0 ) x : 시계열 데이터 model : additive, multiplicative 두가지 계절성분 유형 filt : 계절 성분을 필터링하기 위한 필터 계수 period : 기간. 시계열 데이터가 pandas 객체가 아니거나 x의 인덱스에 빈도가 없는 경우 사용 two_sided : 필터링에 사용되는 이동 평균 방법으로 True..