2019년 12월, 상주-영천 고속도로 상행선에서 도로 노면 결빙에 의한 연쇄추돌사고로 48명의 사상자가 발생하였다. 이에, 국토교통부 는 2020년 1월 결빙 취약구간 선정기준을 마련하여 결빙 취약구간 403개소를 지정하고, 결빙 취약구간을 대상으로 2022년까지 1,699억 원의 예산을 투입하여 결빙사고 예방사업을 계획하였다(BAI, 2021). 하지만, 결빙 취약구간 선정기준에 대해 적정성 검토가 이루어지 지 않아 그 신뢰성과 실효성이 충분히 검증되지 않았다. 본 연구에서는 국가교통정보센터의 노드·링크(Node·Link) 체계를 기반으로 전국 고속국도 및 일반국도의 특성정보(시설, 선형구조, 기상, 교통 등)를 GIS(Geographic Information System) 데이터로 구축하였다. 최근 5년 결빙사고 발생이력이 있는 도로구간(Link)을 확인하고 Random Forest 알고리즘을 통해 도로 특성정보의 결빙사고에 대한 변수 중요도(Feature Importance)를 분석했다. 이를 통해 결빙사고와 각 인자의 상관성을 파악하여 ‘결빙 취약구간 평가 세부 배점표’의 항목별 배점을 수정, 보완함으로써 평가표의 신뢰성을 제고한다.
이 연구의 목적은 머신러닝 분석방법을 활용하여 대학생의 소속 학과 만족도에 영향을 미치는 주요 요 인을 분석하여 대학생의 진로지도와 중도탈락 예방 관련 정책 및 제도 수립을 위한 기초 연구 자료를 제 공하기 위함이다. 이를 위해 한국교육고용패널 (KEEP )자료의 4년제 대학 진학생 1,298명을 연구대 상으로 머신러닝 분석방법인 로지스틱 회귀분석과 랜덤포레스트 방법을 통하여 분석을 진행하였다. 주요 분석 결과는 다음과 같다. 첫째, 대학 입학년도에는 대학 생활 관련 변수 이외에도 고등학교 재학 시기 및 고등학교 졸업 후 진로 계획과 관련한 설명변수들이 중요도 상위 10개 항목 중 상당수를 차지하였으며, 입학년도와 졸업년도를 제외한 기간에는 전공 학습과 진로활동에 대한 변수들이, 졸업년도에는 취업준비 및 교육훈련 경험 등이 로지스틱 회귀분석과 랜덤포레스트 분석 결과에서 공통적으로 높은 중요도를 기록하였다. 둘째, 두 분석방 법에 따른 학년별 중요도 상위 10개 변수의 일치도는 63.3%로 나타났다. 셋째, 로지스틱 회귀분석과 달리 랜덤포레스트 분석에서는 설문의 응답자가 다수의 척도를 사용하여 응답한 설명변수들이 중요도 상위 10 개 설명변수에 포함된 경우가 상대적으로 많았다. 이 연구는 교육패널 자료를 단일 분석방법이 아닌 두 가지 머신러닝 방법을 사용하여 공통 요소를 도출하고, 결과의 비교를 시도했다는 점에 의의가 있다.
PURPOSES : This study analyzed explanatory variables, such as dangerous driving behaviors, in a negative binomial regression model, using the Digital Tachograph data of commercial vehicles, to assess the factors associated with freeway accidents.
METHODS : Fixed parameter and random parameter negative binomial regression models were constructed using freeway accident data of commercial vehicles from January 2007 to July 2018 on the Gyeongbu Expressway from West Ulsan Interchange to Gimcheon Junction.
RESULTS : Six explanatory variables (logarithm of average annual daily traffic, sunny, rainy, and snowy weather conditions, road curvature, and driving behaviors that included sudden stops) were found to impact the occurrence of freeway accidents significantly. Two of these variables (snowy weather conditions and sudden stops among dangerous driving behaviors) were analyzed as random parameters. These variables were shown as probabilistic variables that do not have a fixed impact on traffic accidents
CONCLUSIONS : The variables analyzed as random parameters should be carefully considered when the freeway operating authorities plan an improvement project for highway safety.