논문 상세보기

기계학습을 활용한 마늘 생체중 예측 KCI 등재

Garlic Fresh Weight Prediction using Machine Learning

  • 언어KOR
  • URLhttps://db.koreascholar.com/Article/Detail/439450
구독 기관 인증 시 무료 이용이 가능합니다. 4,000원
생물환경조절학회지 (Journal of Bio-Environment Control)
한국생물환경조절학회 (The Korean Society For Bio-Environment Control)
초록

본 연구는 표현 형질 생육 데이터인 엽장, 엽 수와 기상 데이 터인 생육도일을 활용하여 여러 기계 학습을 통해 마늘의 생 체중을 예측하는 모델을 개발하고자 하였다. 검증 데이터에 서 random forest 모델의 결정계수가 0.924, 평균제곱근오차 (g)는 13.583 그리고 평균절대오차는 8.885로 가장 우수하였 다. 평가 데이터에서는 Catboost 모델이 결정계수가 0.928, 평균제곱근오차(g)는 13.486 그리고 평균절대오차는 9.181 로 가장 우수하였다. 그러나 Catboost, Random forest 그리고 LightGBM 모델을 0.5, 0.3 그리고 0.2 가중치를 두어 학습한 Weighted ensemble 모델이 마늘 생체중 예측의 검증 및 평가 에 있어서 검증 데이터의 결정계수가 0.922, 평균제곱근오차 (g)가 13.752 그리고 평균절대오차는 8.877이었으며 평가 데 이터에서는 결정계수가 0.923, 평균제곱근오차(g)가 13.992 그리고 평균절대오차가 9.437로 두 번째로 우수한 결과를 나 타내었다. 이러한 결과들을 종합적으로 미루어 보았을 때, Weighted ensemble 모델이 모델의 안정성 측면에서 최적의 모델이라고 판단하였다. 따라서 농가들이 표현 형질과 기상 데이터만으로도 기계학습 기법을 통하여 마늘의 생체중 예측 을 통해 작형 모니터링이 가능할 것으로 보이며 추가적으로 다년도 데이터 취득과 검증을 통하여 성능을 고도화가 가능할 것으로 판단된다.

This study aimed to develop a model for predicting garlic fresh weight using various machine learning techniques based on growth data, including leaf length, leaf count, and growing degree days as meteorological data. In the validation dataset, the Random forest model exhibited the highest performance with R2 of 0.924, RMSE (g) of 13.583, and MAE of 8.885. In the test dataset, the Catboost model outperformed others with R2 of 0.928, RMSE (g) of 13.486, and MAE of 9.181. However, a Weighted ensemble model trained with weights of 0.5, 0.3, and 0.2 for Catboost, Random forest, and LightGBM models, respectively, demonstrated the second-best performance in both the validation and test datasets, with R2 of 0.922 and 0.923, RMSE (g) of 13.752 and 13.992, and MAE of 8.877 and 9.437, respectively. Based on these findings, the Weighted ensemble model was deemed the optimal choice. Thus, it is suggested that farmers can employ machine learning techniques to predict garlic fresh weight using only phenotypic and meteorological data, facilitating field monitoring. However, further data acquisition and validation over multiple years are essential to refine the model’s performance.

목차
Abstract
서 론
재료 및 방법
    1. 공시작물 및 재배환경측정
    2. 마늘의 생육 및 생리 특성 조사
    3. 통계 분석 및 기계학습 모델
결과 및 고찰
    1. 재배환경에 따른 마늘의 생육 분석
    2. 기계학습을 활용한 마늘 생체중 모델 비교
적 요
사 사
Literature Cited
저자
  • 강민서(국립원예특작과학원 채소기초기반과 석사후연구원) | Min-Seo Kang (Master Degree Researcher, Division of Vegetable, National Institute of Horticultural and Herbal Science, RDA, Wanju 55365, Korea)
  • 윤효인(국립원예특작과학원 채소기초기반과 농업연구사) | Hyo-In Yoon (Research Officer, Division of Vegetable, National Institute of Horticultural and Herbal Science, RDA, Wanju 55365, Korea)
  • 이혜진(국립원예특작과학원 채소기초기반과 농업연구사) | Hye-Jin Lee (Research Officer, Division of Vegetable, National Institute of Horticultural and Herbal Science, RDA, Wanju 55365, Korea)
  • 김진희(국립원예특작과학원 채소기초기반과 농업연구사) | Jin-Hee Kim (Research Officer, Division of Vegetable, National Institute of Horticultural and Herbal Science, RDA, Wanju 55365, Korea)
  • 위승환(국립원예특작과학원 채소기초기반과 농업연구사) | Seung-Hwan Wi (Research Officer, Division of Vegetable, National Institute of Horticultural and Herbal Science, RDA, Wanju 55365, Korea) Corresponding author
  • 김태복(국립원예특작과학원 채소기초기반과 농업연구사) | Tae-Bok Kim (Research Officer, Division of Vegetable, National Institute of Horticultural and Herbal Science, RDA, Wanju 55365, Korea)
  • 서태철(국립원예특작과학원 채소기초기반과 농업연구관) | Tae-Chul Seo (Senior Research Officer, Division of Vegetable, National Institute of Horticultural and Herbal Science, RDA, Wanju 55365, Korea)