본 연구의 주요 목적은 회귀기반의 다양한 머신러닝 알고리즘을 개발하고 다양한 농업 분야에서 사용되는 트랙터의 연료 소비량을 예측하는 것이다. 비포장 도로주행 농업 기계중에서도 사용 비중이 가장 높은 트랙터를 선정하였다. 실제 농가에 방문하여 현업 전문가 조언을 바탕으로 연구하여 설문지를 작성하였으며, 설문 대상은 경남 사천시에 있는 농가 10곳, 진주시에 있는 농가 62곳 등, 총 72곳의 농가이다. 농작업으로는 벼농사, 보리농사, 밭농사 등이 있으며, 작업내용으로는 쟁기, 로터리, 비료살포, 베토, 모내기작업 등이 있다. 다중 회귀분석을 통해 연료 소비량 예측에 영향을 미치는 변수(마력, 기계사용연수, 경작면적, 작업 시간)를 추출하였고. 머신러닝 회귀 학습기 모형으로 학습하여 예측 모형의 성능을 검증하였다. 연료 소비량을 예측하는 모델의 성능은 결정 계수(R), RMSE (제곱 평균 제곱근 오차), MSE (평균 제곱 오차) 및 MAE (평균 절대 오차)를 포함한 4가지 통계적 품질 매개변수를 사용하여 결정되었다. 연구 결과 4가지 모델(다중회귀, 랜덤포레스트, 아다부스트, K-최근접 이웃) 중 K-최근접 이웃의 성능이 제일 높은 것으로 나타났다. 결론적으로 본 연구의 결과는 실제 농가의 연료 소비량을 예측하여 면세유 유통의 투명성을 확보하고 추후 개발 모델의 의사결정에 활용될 수 있을 것으로 기대된다.
The main objective of this study is to develop various machine learning algorithms based on regression analysis and to predict the fuel consumption rate of tractors used in different agricultural fields. For this purpose, a questionnaire survey was conducted in 72 different agricultural farms in Gyeongsangnam-do, which included 10 in Sacheon-si and 62 in Jinju-si. The tractors were utilized mainly in Rice, Barley, and others crop farming for major agricultural activities such as plowing, rotary tillage, fertilizer application, mowing, and rice transplanting. Four models such as Multiple Linear Regression, Random Forest, Adaboost, and K- Nearest Neighbors have been developed to predict the fuel consumption rate of tractors using horsepower, age of machine use, cultivated area, and working hours as input variables. The performance of those models in predicting fuel consumption rate was determined using four statistical quality parameters, including coefficient of determination, root mean square error, mean square error, and mean absolute error. The results of the study showed that among the four models, K- Nearest Neighbors-based machine-learning model showed best performance. In conclusion, the results of this study can be used to reduce fuel waste/loss by predicting actual fuel consumption in real farms.