2019년 12월, 상주-영천 고속도로 상행선에서 도로 노면 결빙에 의한 연쇄추돌사고로 48명의 사상자가 발생하였다. 이에, 국토교통부 는 2020년 1월 결빙 취약구간 선정기준을 마련하여 결빙 취약구간 403개소를 지정하고, 결빙 취약구간을 대상으로 2022년까지 1,699억 원의 예산을 투입하여 결빙사고 예방사업을 계획하였다(BAI, 2021). 하지만, 결빙 취약구간 선정기준에 대해 적정성 검토가 이루어지 지 않아 그 신뢰성과 실효성이 충분히 검증되지 않았다. 본 연구에서는 국가교통정보센터의 노드·링크(Node·Link) 체계를 기반으로 전국 고속국도 및 일반국도의 특성정보(시설, 선형구조, 기상, 교통 등)를 GIS(Geographic Information System) 데이터로 구축하였다. 최근 5년 결빙사고 발생이력이 있는 도로구간(Link)을 확인하고 Random Forest 알고리즘을 통해 도로 특성정보의 결빙사고에 대한 변수 중요도(Feature Importance)를 분석했다. 이를 통해 결빙사고와 각 인자의 상관성을 파악하여 ‘결빙 취약구간 평가 세부 배점표’의 항목별 배점을 수정, 보완함으로써 평가표의 신뢰성을 제고한다.
In this study, the machine learning which has been widely used in prediction algorithms recently was used. the research point was the CD(chudong) point which was a representative point of Daecheong Lake. Chlorophyll-a(Chl-a) concentration was used as a target variable for algae prediction. to predict the Chl-a concentration, a data set of water quality and quantity factors was consisted. we performed algorithms about random forest and gradient boosting with Python. to perform the algorithms, at first the correlation analysis between Chl-a and water quality and quantity data was studied. we extracted ten factors of high importance for water quality and quantity data. as a result of the algorithm performance index, the gradient boosting showed that RMSE was 2.72 mg/m³ and MSE was 7.40 mg/m³ and R² was 0.66. as a result of the residual analysis, the analysis result of gradient boosting was excellent. as a result of the algorithm execution, the gradient boosting algorithm was excellent. the gradient boosting algorithm was also excellent with 2.44 mg/m³ of RMSE in the machine learning hyperparameter adjustment result.