포트홀은 도로 안전과 밀접한 관련이 있으며 차량 손상 및 사고를 유발할 수 있어 신속한 발견과 보수가 필요하다. 그러나 기존의 포트홀 유지보수 방법은 인력 부족으로 인해 효율적이지 못하다. 관리를 간소화하기 위해 인공지능을 활용한 포트홀 객체 인식이 시 도되었지만, 데이터 수집의 어려움과 부족한 일반화 성능으로 이러한 접근법에도 한계가 있다. 이를 해결하기 위해, 본 연구에서는 객체 검출 모델 YOLOv8, 객체 분할 모델 SAM2, 그리고 대형 언어 모델 LLM을 결합한 PotholeSAM 프레임워크를 제안한다. 이 프레 임워크는 세 단계로 구성된다; 첫째, YOLOv8을 사용하여 이미지 내 포트홀의 위치를 검출한다; 둘째, SAM2를 활용하여 검출된 포 트홀 영역을 정밀하게 분할한다; 셋째, LLM이 분할된 영역의 밝기 정보를 분석하여 포트홀의 깊이를 추정한다. 제안된 방법은 포트 홀의 위치, 면적, 깊이에 대한 정보를 자동으로 분석하여 도로 관리에 필요한 데이터를 효율적으로 획득할 수 있다. 이를 통해 지방 정 부의 인력 부족을 완화하고 운전자에게 위험한 포트홀을 조기에 발견하여 선제적으로 대응할 수 있다.
포트홀은 아스팔트 도로 위에서 반복적인 하중으로 인해 일부가 떨어져 나가며 발생하는 패임을 의미한다. 포트홀은 습기에 취약해 특히 장마철에 큰 영향을 받으며, 이로 인해 대형교통사고와 높은 개보수 비용이 발생한다. 매년 포트홀 로 인한 피해와 사고는 언론을 통해 지속적으로 보도 되고 있다. 이러한 피해를 최소화하기 위해서는 사고가 발생하기 전 적절한 시기에 포트홀이 보수되어야 한다. 이를 위해서는 정확한 포트홀 면적 탐지가 선행되어야 한다. 포트홀 면적 의 정확한 탐지는 도로포장의 유지관리 및 보수 전략 수립에 매우 중요한 과정이다. 이에 따라 본 연구에서는 2,086의 포트홀 이미지를 기반으로 학습하고 탐지하였다. 비정형 탐지에 최적화된 Mask R-CNN을 활용하여 포트홀의 전체적인 면적을 탐지하였으며, 탐지 정확도를 높이기 위해 SwinT 백본 네트워크를 사용하였다. 그 결과, 90% 이상의 높은 정확 도로 포트홀의 면적을 탐지하였다. 추후 이 연구를 바탕으로 적절한 시기에 개보수 시기를 예측하여 포트홀로 인한 피해 와 사고를 줄이는 데 기여할 것이다.
PURPOSES : This study uses deep learning image classification models and vehicle-mounted cameras to detect types of pavement distress — such as potholes, spalling, punch-outs, and patching damage — which require urgent maintenance.
METHODS : For the automatic detection of pavement distress, the optimal mount location on a vehicle for a regular action camera was first determined. Using the orthogonal projection of obliquely captured surface images, morphological operations, and multi-blob image processing, candidate distressed pavement images were extracted from road surface images of a 16,036 km in-lane distance. Next, the distressed pavement images classified by experts were trained and tested for evaluation by three deep learning convolutional neural network (CNN) models: GoogLeNet, AlexNet, and VGGNet. The CNN models were image classification tools used to identify and extract the combined features of the target images via deep layers. Here, a data augmentation technique was applied to produce big distress data for training. Third, the dimensions of the detected distressed pavement patches were computed to estimate the quantity of repair materials needed.
RESULTS : It was found that installing cameras 1.8 m above the ground on the exterior rear of the vehicle could provide clear pavement surface images with a resolution of 1 cm per pixel. The sensitivity analysis results of the trained GoogLeNet, AlexNet, and VGGNet models were 93 %, 86 %, and 72 %, respectively, compared to 62.7 % for the dimensional computation. Following readjustment of the image categories in the GoogLeNet model, distress detection sensitivity increased to 94.6 %.
CONCLUSIONS : These findings support urgent maintenance by sending the detected distressed pavement images with the dimensions of the distressed patches and GPS coordinates to local maintenance offices in real-time.