PURPOSES : The purpose of this study is to compare applicability, explanation power, and flexibility of traffic accident models between estimating model using the statistical method and the machine learning method.
METHODS: In order to compare and analyze traffic accident models between model estimated using the statistical method and machine learning method, data acquisition was conducted, and traffic accident models were estimated using statistical methods such as negative binomial regression model, and machine learning methods such as a generalized regression neural network (GRNN). Then, the fitness of model as R2, root mean square error (RMSE), mean absolute percentage error (MAPE), accuracy, etc., were determined to compare the traffic accident models.
RESULTS: The results showed that the annual average daily traffic (AADT), speed limits, number of lanes, land usage, exclusive right turn lanes, and front signals were significant for both traffic accident models. The GRNN model of total traffic accidents had been better statistical significant with R2: 0.829, RMSE: 2.495, MAPE: 32.158, and Accuracy: 66.761 compared with the negative binomial regression model with R2: 0.363, RMSE: 9.033, MAPE: 68.987, and Accuracy: 8.807. The GRNN model of injury traffic accidents also showed similar results of model’s statistical significance.
CONCLUSIONS: Traffic accident models estimated with GRNN had better statistical significance compared with models estimated with statistical methods such as negative binomial regression model.
Even though cars have a good effect on modern society, traffic accidents do not. There are traffic laws that define the regulations and aim to reduce accidents from happening; nevertheless, it is hard to determine all accident causes such as road and traffic conditions, and human related factors. If a traffic accident occurs, the traffic law classifies it as ‘Negligence of Safe Driving’ for cases that are not defined by specific regulations. Meanwhile, as Korea is already growing rapidly elderly population with more than 65 years, so are the number of traffic accidents caused by this group. Therefore, we studied predictive and comparative analysis of the number of traffic accidents caused by ‘Negligence of Safe Driving’ by dividing it into two groups : All-ages and Elderly. In this paper, we used empirical monthly data from 2007 to 2015 collected by TAAS (Traffic Accident Analysis System), identified the most suitable ARIMA forecasting model by using the four steps of the Box-Jenkins method : Identification, Estimation, Diagnostics, Forecasting. The results of this study indicate that ARIMA (1, 1, 0)(0, 1, 1)12 is the most suitable forecasting model in the group of All-ages; and ARIMA (0, 1, 1)(0, 1, 1)12 is the most suitable in the group of Elderly. Then, with this fitted model, we forecasted the number of traffic accidents for 2 years of both groups. There is no large fluctuation in the group of All-ages, but the group of Elderly shows a gradual increase trend. Finally, we compared two groups in terms of the forecast, suggested a countermeasure plan to reduce traffic accidents for both groups
창조경제 정부에서 교통안전 선진화를 국정과제로 추진하고 있을 만큼 도로안전은 사회적 주요 관심대 상이다. 그러나 현재 우리나라에서는 도로안전사업 대상 지역의 선정기준이 되는 도로안전 취약 및 위험 구간을 도출하는 방법이 객관적으로 마련되어 있지 않다. 따라서 이러한 국내 상황을 극복하기 위해서는 도로 안전성 여부를 과학적으로 분석할 수 있는 평가기법 개발이 필요하다. 이를 위한 최적의 방안으로는 한국 현지 도로 여건에 맞는 사고예측모형을 개발하는 것이다. 그러나 사고예측모형 개발에 필요한 모형 입력 자료를 생성하기 위해서는 현장조사와 DB 구축 등에 많이 비용이 소요된다.
따라서 본 연구에서는 사고예측모형 개발에 필요한 자료 중 도로 기하구조 요소(곡선반경 등)를 수집하 기 위해 직접 현장조사를 하지 않고 엑셀 형태로 작성된 도로대장을 활용할 수 있는 방안에 대해 연구하 였다. 또한 사고예측모형을 공간정보 기반으로 개발하여 Network Screening과 개선대안 효과분석 등의 작업을 직관적이며 효과적으로 수행하고 사고예측을 정확하게 판단할 수 있는 장점을 확보하기 위하여 모 형입력 자료를 공간정보 DB로 구축하는 방안을 도출하였다.
따라서 본 연구에서는 임의로 설정한 기준점에서부터의 누적거리를 이용하여 시설물 위치와 도로 기하 구조 정보를 표현하는 도로대장을 도로망 수치지도(교통주제도)를 따라 선형 객체의 공간정보로 변환할 수 있는 기능을 개발하였다. 또한 사고발생 자료의 경우 수집된 자료의 지구좌료를 이용하여 점형 객체의 공간정보를 생성하였으며, 교통량조사 자료는 동일한 교통량으로 구분되는 선형 객체의 공간정보를 생성 하였다.
본 연구에서 제시한 모형 입력 자료 생성 방법은 교통주제도의 차로수에 따라 도로중심선을 1차 분할 한 후, 공간정보로 생성된 종단경사, 곡선반경, 중앙분리대 등으로 도로중심선을 2차 분할하였으며, 이를 토대로 GIS 공간분석을 수행하여 접도구역(면형객체), 사고위치(점형객체), 교통량(선형객체), 가로등의 정보를 분할된 동질구간에 매핑하는 방안을 도출하였다.
본 연구를 통하여 교통사고, 교통량 및 도로대장 자료를 모형 입력 자료 형식에 맞게 공간정보 DB 형태 로 구축하고, 이를 통해 GIS의 공간분석을 수행함으로서 정확한 사고건수 추출, 동질성 구간에 대한 체계 적인 분석과 과학적인 분할 등을 매우 신속하고 다양하게 시뮬레이션을 할 수 있음을 확인할 수 있었다.
PURPOSES : This study tries to develop the accident models of 4-legged signalized intersections in Busan Metropolitan city with random parameter in count model to understanding the factors mainly influencing on accident frequencies.
METHODS: To develop the traffic accidents modeling, this study uses RP(random parameter) negative binomial model which enables to take account of heterogeneity in data. By using RP model, each intersection’s specific geometry characteristics were considered.
RESULTS : By comparing the both FP(fixed parameter) and RP modeling, it was confirmed the RP model has a little higher explanation power than the FP model. Out of 17 statistically significant variables, 4 variables including traffic volumes on minor roads, pedestrian crossing on major roads, and distance of pedestrian crossing on major/minor roads are derived as having random parameters. In addition, the marginal effect and elasticity of variables are analyzed to understand the variables’impact on the likelihood of accident occurrences.
CONCLUSIONS :This study shows that the uses of RP is better fitted to the accident data since each observations’specific characteristics could be considered. Thus, the methods which could consider the heterogeneity of data is recommended to analyze the relationship between accidents and affecting factors(for example, traffic safety facilities or geometrics in signalized 4-legged intersections).
PURPOSES : The purposes of this study are to compare the day and night characteristics and to develop the models of traffic accidents. in Rural Signalized Intersections
METHODS : To develop day and night traffic accident models using the Negative Binomial Model, which was constructed for 156 signalized intersections of rural areas, through field investigations and casualty data from the National Police Agency.
RESULTS : Among a total of 17 variances, the daytime traffic accident estimate models identified a total of 9 influence factors of traffic accidents. In the case of nighttime traffic accident models, 11 influence factors of traffic accidents were identified.
CONCLUSIONS: By comparing the two models, it was determined that the number of main roads was an independent factor for daytime accidents. For nighttime accidents, several factors were independently involved, including the number of entrances to sub-roads, whether left turn lanes existed in major roads, the distances of pedestrian crossings to main roads and sub-roads, lighting facilities, and others. It was apparent that if the same situation arises, the probability of an accident occurring at night is higher than during the day because the speed of travel through intersections in rural areas is somewhat higher at night than during the day.
PURPOSES: Using the collected data for crash, traffic volume, and design elements on ramps between 2007 and 2009, this research effort was initiated to develop traffic crash prediction models for expressway ramps. METHODS: Three negative binomial regression models and three zero-inflated negative binomial regression models were developed for individual ramp types, including direct, semi-direct and loop, respectively. For validating the developed models, authors compared the estimated crash frequencies with actual crash frequencies of twelve randomly selected interchanges, the ramps of which have not been used for model developing. RESULTS: The results show that the negative binomial regression models for direct, semi-direct and loop ramps showed 60.3%, 63.8% and 48.7% error rates on average whereas the zero-inflated negative binomial regression models showed 82.1%, 120.4% and 57.3%, respectively. CONCLUSIONS: Conclusively, the negative binomial regression models worked better in traffic crash prediction than the zero-inflated negative binomial regression models for estimating the frequency of traffic accidents on expressway ramps.
PURPOSES: Because expressway ramps are very complex segments where diverse roadway design elements dynamically change within relatively short length, drivers on ramps are required to drive their cars carefully for safety. Especially, ramps on expressways are designed to guarantee driving at high speed so that the risk and severity of traffic accidents on expressway ramps may be higher and more deadly than other facilities on expressways. Safe deceleration maneuvers are required on off-ramps, whereas safe acceleration maneuvers are necessary on onramps. This difference in required maneuvers may contribute to dissimilar patterns and severity of traffic accidents by ramp types. Therefore, this study was aimed at developing prediction models of the severity of traffic accidents on expressway on- and off-ramps separately in order to consider dissimilar patterns and severity of traffic accidents according to types of ramps. METHODS: Four-year-long traffic accident data between 2007 and 2010 were utilized to distinguish contributing design elements in conjunction with AADT and ramp length. The prediction models were built using the negative binomial regression model consisting of the severity of traffic accident as a dependent variable and contributing design elements as in independent variables. RESULTS: The developed regression models were evaluated using the traffic accident data of the ramps which was not used in building the models by comparing actual and estimated severity of traffic accidents. Conclusively, the average prediction error rates of on-ramps and offramps were 30.5% and 30.8% respectively. CONCLUSIONS: The prediction models for the severity of traffic accidents on expressway on- and off-ramps will be useful in enhancing the safety on expressway ramps as well as developing design guidelines for expressway ramps.
본 연구는 신호교차로 교통사고예측모형 구축 과정 중 일반적으로 제한된 변수의 선정 및 모형의 구축에만 주로 초점이 맞추어진 기존 방법론의 문제점을 개선하고, 자료조사 및 수집 과정에서 발생하는 자료의 불확실한 상태를 인정하면서 자료의 불확실성을 최소화하여 이용할 수 있는 방법론을 개발하는데 연구의 주안점을 두었다. 퍼지추론이론과 신경망이론을 이용한 모형을 구축하였고, 마지막으로 구축된 퍼지추론이론 모형 및 신경망이론 모형과 기존 회귀모형인 포아송 회귀모형간의 통계적인 검증과 실제 Data를 이용한 모형의 적정성을 검토하였다. 모형의 통계적인 검증시 기존모형에 비해 퍼지추론모형과 신경망이론모형이 더 설명력이 높은 것으로 나타났고, 검증에서도 퍼지추론이론과 신경망이론이 적절한 것으로 나타났으며 기존모형보다 사고건수를 예측하는 설명력이 높은 것으로 입증되었다. 본 연구에서 개발된 모형은 계획 및 운영단계에서 신호교차로의 안전성을 측정하는데 활용될 수 있으며, 궁극적으로는 신호교차로에서 교통사고를 줄이는데 기여할 수 있을 것으로 판단된다.
본 연구는 도로연장측면에서 본선에 비해 상대적으로 연결로에서 발생하는 사고빈도가 높고, 교통사고가 증가하는 추세인 고속도로 연결로의 교통사고 예측모형의 개발에 초점을 두었다. 연결로 유형별(직결, 준직결, 루프)로 통계적으로 유의한 사고인자를 선정하고, 사고율과의 관계가 비선형 임을 분석하여 변수를 변형(Variables Transformation)하여 All possible 방식으로 예측모형을 개발하고, 통계적 진단 및 검증을 거쳐 유의성을 확인하였으며 이에 기존 개발 모형에 비해 예측력이 더욱 우수한 결과를 보였다. 개발된 사고예측모형은 보다 비용면에서 효율적이고, 안전한 트럼펫형 IC 연결로의 설계와 연결로 교통사고 원인분석에 활용될 수 있을 것으로 기대된다.
일반도로구간에서의 사고발생건수는 2000년부터 2006년까지 감소추세를 보이는 반면 교차로에서의 교통사고건수는 현재까지 꾸준하게 증가하고 있기 때문에 교차로에서의 안전성을 증대시키기 위한 노력이 절실히 필요한 실정이다. 본 연구에서는 신호교차로에서의 도로조건, 교통조건, 교통운영상의 조건 등을 분석하여 교차로의 설계 안전성을 저해시키는 요인들을 찾아내고, 그 요인들과 사고와의 상관관계를 이용하여 지방부 4지 신호교차로의 안전성 판단을 위한 사고 예측모형을 개발하고자한다. 또한 사전에 위험요소를 제거하여 교차로에서의 안전성 평가를 위한 가이드라인을 제시함으로서, 교차로에서의 안전성을 높이는데 그 목적이 있다. 본 연구는 교차로에서의 사고분석을 위하여 비선형 회귀분석을 통해 사고모형을 개발하였고, 이러한 모형들을 이용하여 차대차 사고에 영향을 미치는 주요 설명변수들에 대한 분석을 시도하였다. 모형분석결과, 포아송회귀분석(Poisson Regression)이 모형개발에 가장 적합한 것으로 나타났으며, 사고에 영향을 미치는 변수로는 좌회전 전용차로, 횡단보도, 제한속도, 조명시설, 교차각, ADT 등으로 분석되었다.
본 연구는 도로기하구조 요인과 교통사고간의 관계를 규명하기 위하여 CART분석을 이용하여 전국의 4차로 국도를 대상으로 교통사고예측모형을 개발하고, 다중회귀모형, 확률회귀모형과 CART분석모형을 비교 분석하여 개발한 모형의 적합도를 검증하였다. 연구결과로는 첫째, 변수간의 복합적인 상호관계를 설명할 수 있는 CART분석을 이용하여 국도의 교통사고 예측모형을 개발하고 도로기하구조 요인에 따라 표준교통사고율을 의미하는 교통사고발생도표를 제시하였다. 둘째, CART분석모형에 근거하여 교통사고 발생률에 큰 영향을 미치는 도로기하구조 요인이 구간거리(km), 횡단보도폭(m), 횡단길어깨(m), 교통량 순으로 나타났다. 셋째, CART분석모형의 적합도 검증결과, CART분석모형이 실제교통사고율을 타 모형에 비해 전반적으로 잘 묘사하고 있었으나, 각 모형별로 교통사고율의 크기에 따라 교통사고율이 비교적 낮은 구간에서는 다중회귀모형이, 평균이상의 교통사고율을 나타내는 구간에서는 포아송 회귀모형의 예측력이 높았으며, CART분석모형은 교통사고율의 크기와 상관없이 우수한 예측력을 보였다. 넷째, 도출된 교통사고발생도표는 도로기하구조 조건에 따른 표준교통사고율을 제시해주기 때문에 도로설계 시에 안전한 기하구조 설계요소 선정기준을 제시 할 뿐만 아니라, 교통사고 잦은 지점개선사업추진 시 사업의 우선순위를 판단할 수 있는 기준을 제시하는 등 정책적 활용도가 매우 높을 것으로 판단된다.