본 연구는 머신러닝 기법을 토대로 15개 환경 변수를 활용하여 소나무재선충병의 위험지역 분포를 예측하였다. 연구는 최대 엔트로피 모델을 머신러닝 기법으로 활용하였고, 연구 지역은 경주이며 연구 기간은 2018∼2020년이다. 모델의 평가에는 AUC(area under the curve)를 이용하였다. 연구 지역에서 소나무재선충병의 감염목 핵심 분포 지역은 2018년 대비 2019년과 2020년에 각각 2.5배와 4.7배 확대되었다. 소나무재선충병의 감염목 분포 추정 모델의 AUC는 모든 해에 최소 0.86 이상이었다. 모델에서 가장 중요한 변수는 직전 해의 감염목 근접도 이었다. 지형과 도로와의 인접성, 목조건물 인접성, 5월 평균 기온도 중요한 변수이었다. 인간 활동과 매개충의 생장 환경이 소나무재선충병의 공간적 분포에 중요한 역할을 한다는 것을 의미한다. 나아가 연구의 결과는 감염목 분포 정보의 지속적인 구축과 공유가 소나무재선충병 예방을 위한 정책과 연구에 중요하다는 것을 시사한다.
This study predicted the distribution of risk areas for pine wilt disease (PWD) based on machine learning by using 15 environmental variables. The maximum entropy model was employed for the study and AUC (area under the curve) was used to evaluate the model. The study area is Gyeongju, and the study period is 2018-2020. In the study area, the core distribution area of trees infected with PWD expanded 2.5 times and 4.7 times in 2019 and 2020 compared to 2018, respectively. The AUC of the spatial estimation for PWD was at least 0.86 in each year. The most important variable in the model was the proximity of infected trees in the previous year. The topography, proximity to roads and wooden buildings, and the average temperature in May were also important variables. It means that human activities and the environment of its vectors play an important role in the spatial distribution of PWD. Furthermore, the results of the study suggest that the establishment and sharing of the distribution data for infected trees are important for policies and research for the prevention of PWD.