2019년 12월, 상주-영천 고속도로 상행선에서 도로 노면 결빙에 의한 연쇄추돌사고로 48명의 사상자가 발생하였다. 이에, 국토교통부 는 2020년 1월 결빙 취약구간 선정기준을 마련하여 결빙 취약구간 403개소를 지정하고, 결빙 취약구간을 대상으로 2022년까지 1,699억 원의 예산을 투입하여 결빙사고 예방사업을 계획하였다(BAI, 2021). 하지만, 결빙 취약구간 선정기준에 대해 적정성 검토가 이루어지 지 않아 그 신뢰성과 실효성이 충분히 검증되지 않았다. 본 연구에서는 국가교통정보센터의 노드·링크(Node·Link) 체계를 기반으로 전국 고속국도 및 일반국도의 특성정보(시설, 선형구조, 기상, 교통 등)를 GIS(Geographic Information System) 데이터로 구축하였다. 최근 5년 결빙사고 발생이력이 있는 도로구간(Link)을 확인하고 Random Forest 알고리즘을 통해 도로 특성정보의 결빙사고에 대한 변수 중요도(Feature Importance)를 분석했다. 이를 통해 결빙사고와 각 인자의 상관성을 파악하여 ‘결빙 취약구간 평가 세부 배점표’의 항목별 배점을 수정, 보완함으로써 평가표의 신뢰성을 제고한다.
This study intends to present a traffic node-based and link-based accident prediction models using XGBoost which is very excellent in performance among machine learning models, and to develop those models with sustainability and scalability. Also, we intend to present those models which predict the number of annual traffic accidents based on road types, weather conditions, and traffic information using XGBoost. To this end, data sets were constructed by collecting and preprocessing traffic accident information, road information, weather information, and traffic information. The SHAP method was used to identify the variables affecting the number of traffic accidents. The five main variables of the traffic node-based accident prediction model were snow cover, precipitation, the number of entering lanes and connected links, and slow speed. Otherwise, those of the traffic link-based accident prediction model were snow cover, precipitation, the number of lanes, road length, and slow speed. As the evaluation results of those models, the RMSE values of those models were each 0.2035 and 0.2107. In this study, only data from Sejong City were used to our models, but ours can be applied to all regions where traffic nodes and links are constructed. Therefore, our prediction models can be extended to a wider range.