논문 상세보기

LLM 기반의 해양 안전사고 재결서 분석을 통한 원인 분류 체계 구축 KCI 등재

LLM-Based Classification of Marine Casualty Causes via Verdicts

  • 언어KOR
  • URLhttps://db.koreascholar.com/Article/Detail/449097
구독 기관 인증 시 무료 이용이 가능합니다. 4,000원
해양환경안전학회지 (Journal of the Korean Society of Marine Environment and Safety)
해양환경안전학회 (The Korean Society Of Marine Environment & Safety)
초록

본 연구는 중앙해양안전심판원의 해양사고 중 안전사고에 대한 재결서 내 비정형 텍스트 데이터를 분석하여, 데이터 기반의 새로운 원인 분류 체계를 구축하는 것을 목적으로 한다. 이를 위해 거대 언어 모델(Large Language Model, LLM)의 문맥 기반 인과 추론 능 력을 활용하는 단계적 접근 방식을 채택하였다. 분석 데이터로는 중앙해양안전심판원 홈페이지에 등록된 2020년부터 2024년까지의 안전 사고 재결서를 수집하여 활용하였다. 수집된 데이터에서 세부 원인을 추출하고, 벡터 기반의 통계적 군집화 분석을 수행한 결과, 당사자, 지휘·협업, 설비·물적, 조직, 환경 요인의 5가지 분류 체계를 도출하였다. 도출된 체계를 적용하여 원인을 재분류한 결과, 기존 통계에서 ‘운항과실’과 ‘기타’ 등 소수 범주에 약 94% 이상 편중되어 있던 원인들이 책임 소재 및 시스템적 관점에 따라 ‘당사자 요인(40.6%)’과 ‘지 휘·협업 요인(25.3%)’ 및 ‘설비·물적 요인(23.2%)’ 등으로 세분화되었다. 또한, 기존에 식별되지 않았던 의사소통 오류나 작업 환경 특성 등 이 ‘조직 요인’ 및 ‘환경 요인’으로 명확히 구분되었다. 본 연구의 결과는 해양 안전사고의 원인을 책임 소재와 시스템적 차원에서 입체적 으로 규명함으로써, 향후 실효성 있는 안전사고 예방 대책 수립을 위한 기초 자료로 활용될 것으로 기대한다.

This study aimed to establish a data-driven classification system for marine casualty causes by analyzing unstructured text data from the verdicts of the Korea Maritime Safety Tribunal. Accordingly, a phased approach leveraging the context-based causal inference capabilities of large language models (LLMs) was adopted. The analysis utilized the verdicts of safety accidents that occurred between 2020 and 2024. Through detailed cause extraction and vector-based statistical clustering, a five-category classification system was derived: personnel, supervision and teamwork, equipment, organizational, and environmental factors. The reclassification results using the proposed system revealed that causes previously concentrated (over 94%) in a few categories, such as “operating negligence” and “miscellaneous,” were subdivided into “personnel factors (40.6%),” “supervision and teamwork factors (25.3%),” and “equipment factors (23.2%)” based on accountability and systemic perspectives. Furthermore, previously unidentified factors, such as miscommunication and working environments, were distinguished as “organizational” and “environmental” factors. These findings multidimensionally identify accident causes in terms of both accountability and systemic levels, and are expected to serve as vital foundational data for establishing effective, customized prevention measures.

목차
요 약
Abstract
1. 서 론
2. 선행 연구
    2.1 기존 사고 원인 분석 모델
    2.2 텍스트 마이닝을 활용한 사고 분석
    2.3 LLM을 활용한 사고 분석 사례
3. 방법론
    3.1 분석 범위 선정 및 전처리
    3.2 LLM 기반 사고 원인 추론 및 분류
    3.3 분류 결과 기반 통계 비교 분석
4. 연구 결과
    4.1 전처리 결과
    4.2 LLM 기반 사고 원인 추론 및 분류 결과
    4.3 분류 결과 기반 통계 비교 분석
5. 결 론
References
저자
  • 윤익현(국립목포해양대학교 항해정보시스템학부 교수) | Ik-Hyun Youn (Professor, Division of Navigation & Information Systems, Mokpo National Maritime University, Mokpo 58628, Korea) Corresponding author
  • 이소영(국립목포해양대학교 자율운항선박 원격운항시뮬레이션센터 연구원) | Soyeong Lee (Researcher, MASS Remote Operation Simulation Center, Mokpo National Maritime University, Mokpo 58628, Korea)
  • 이창희(국립목포해양대학교 해상운송학부 교수) | Chang-Hee Lee (Professor, Division of Maritime Transportation, Mokpo National Maritime University, Mokpo 58628, Korea)
  • 정대득(국립목포해양대학교 항해학부 교수) | Dae-Deuk Jeong (Professor, Division of Navigation Science, Mokpo National Maritime University, Mokpo 58628, Korea)