본 연구는 중앙해양안전심판원의 해양사고 중 안전사고에 대한 재결서 내 비정형 텍스트 데이터를 분석하여, 데이터 기반의 새로운 원인 분류 체계를 구축하는 것을 목적으로 한다. 이를 위해 거대 언어 모델(Large Language Model, LLM)의 문맥 기반 인과 추론 능 력을 활용하는 단계적 접근 방식을 채택하였다. 분석 데이터로는 중앙해양안전심판원 홈페이지에 등록된 2020년부터 2024년까지의 안전 사고 재결서를 수집하여 활용하였다. 수집된 데이터에서 세부 원인을 추출하고, 벡터 기반의 통계적 군집화 분석을 수행한 결과, 당사자, 지휘·협업, 설비·물적, 조직, 환경 요인의 5가지 분류 체계를 도출하였다. 도출된 체계를 적용하여 원인을 재분류한 결과, 기존 통계에서 ‘운항과실’과 ‘기타’ 등 소수 범주에 약 94% 이상 편중되어 있던 원인들이 책임 소재 및 시스템적 관점에 따라 ‘당사자 요인(40.6%)’과 ‘지 휘·협업 요인(25.3%)’ 및 ‘설비·물적 요인(23.2%)’ 등으로 세분화되었다. 또한, 기존에 식별되지 않았던 의사소통 오류나 작업 환경 특성 등 이 ‘조직 요인’ 및 ‘환경 요인’으로 명확히 구분되었다. 본 연구의 결과는 해양 안전사고의 원인을 책임 소재와 시스템적 차원에서 입체적 으로 규명함으로써, 향후 실효성 있는 안전사고 예방 대책 수립을 위한 기초 자료로 활용될 것으로 기대한다.
This study aimed to establish a data-driven classification system for marine casualty causes by analyzing unstructured text data from the verdicts of the Korea Maritime Safety Tribunal. Accordingly, a phased approach leveraging the context-based causal inference capabilities of large language models (LLMs) was adopted. The analysis utilized the verdicts of safety accidents that occurred between 2020 and 2024. Through detailed cause extraction and vector-based statistical clustering, a five-category classification system was derived: personnel, supervision and teamwork, equipment, organizational, and environmental factors. The reclassification results using the proposed system revealed that causes previously concentrated (over 94%) in a few categories, such as “operating negligence” and “miscellaneous,” were subdivided into “personnel factors (40.6%),” “supervision and teamwork factors (25.3%),” and “equipment factors (23.2%)” based on accountability and systemic perspectives. Furthermore, previously unidentified factors, such as miscommunication and working environments, were distinguished as “organizational” and “environmental” factors. These findings multidimensionally identify accident causes in terms of both accountability and systemic levels, and are expected to serve as vital foundational data for establishing effective, customized prevention measures.