본 연구에서는 대파의 가락시장 도매가격을 이용하여 기존 시계열 모형인 ARIMA 모형, 홀트-윈터스 평활법과 대표적인 기계학습 방법인 랜덤 포레스트(Random forest) 분석 기법의 가격 예측력을 비교하였다. 세 모형의 예측력을 분석한 결과는 다음과 같다. 가장 예측력이 높게 나타난 모형은 3년(36개월)을 주기로 설정한 ARIMA 모형이었다. 또한 ARIMA 모형과 홀트-윈터스 평활법은 일별 데이터보다 월별 데이터를 이용한 예측 결과의 정확도가 더 높아 훈련 데이터에 대한 과적합(overfitting)이 오히려 예측력을 낮추는 현상을 보였다. 반면, 랜덤 포레스트는 월별 데이터 보다 일별 데이터를 사용한 모형의 예측력이 더 높았다. 이는 학습량이 많을수록 높은 예측력을 보여주는 기계학습의 특징을 보여주었다. 그러나 기계학습 방법을 활용한 가격 예측에는 가격에 영향을 주는 설명변수를 찾고, 양질의 훈련 데이터 축적이 필요하다는 것을 알 수 있었다. 향후 연구에서는 다양한 설명변수와 기계학습 및 딥러닝 기법을 적용한다면 농축산물 가격 예측력을 높이는데 도움이 될 것으로 판단된다.
The purpose of this study is to compare the price forecasting of green onion through ARIMA, Holt-Winters, and Random forest. After analyzing three forecasting models, ARIMA, consisting three year period (36months), shows the highest forecasting result. Also, ARIMA and Holt-Winters using daily data shows higher forecasting result rather than monthly data, because over-fitted from the daily data decrease the forecasting result. On the other hand, Random forest using daily data show higher forecasting results than monthly data, meaning that the more it learned from the data, the higher forecasting result it has. Therefore, it could be desirable to find certain variables affecting the forecasting of machine learning, and accumulate reasonable test data. The result gives some implications that adapting the reasonable variable to machine learning and Deep learning will be able to show higher forecasting results for other agriculture product price.