Study on Navigation Data Preprocessing Technology for Efficient Route Clustering
세계 해양산업은 자율운항선박 기술의 등장으로 급속도로 발전하고 있으며, 해양 데이터에서 파생된 인공지능 활용에 관한 관 심이 높아지고 있다. 다양한 기술 발전 중에서 선박 항로 군집화는 자율운항선박 상용화를 위한 중요한 기술로 부각되고 있다. 항로 군집 화를 통해 해상에서 선박 항로 패턴을 추출하여 가장 빠르고 안전한 항로를 최적화하고 충돌 방지 시스템의 개발에 기반이 된다. 항로 군 집화 알고리즘의 정확성과 효율성을 보장하기 위해 고품질의 잘 처리된 데이터가 필수적이다. 본 연구에서는 다양한 항로 군집화 방법 중 항로의 실제 형태와 특성을 정확히 반영할 수 있는 선박 항로 유사도 기반 군집화 방식에 주목하였다. 이러한 방식의 효율을 극대화하 기 위해 최적의 데이터 전처리 기술 조합을 구성하고자 한다. 구체적으로, 4가지의 선박 항로 간 유사도 측정법과 3가지의 차원 축소 방 법을 조합하여 연구를 진행하였다. 각 조합에 대해 k-means 군집 분석을 수행하고, 그 결과를 Silhouette Index를 통해 정량적으로 평가하여 최고 성능을 보이는 전처리 기법 조합을 도출하였다. 본 연구는 단순히 최적의 전처리 기법을 찾는 것에 그치지 않고, 광범위한 해양 데 이터에서 의미 있는 정보를 추출하는 과정의 중요성을 강조한다. 이는 4차 산업혁명 시대의 해양 및 해운 산업이 직면한 디지털 전환에 효과적으로 대응하기 위한 기초 연구로서 의의를 갖는다.
The global maritime industry is developing rapidly owing to the emergence of autonomous ship technology, and interest in utilizing artificial intelligence derived from marine data is increasing. Among the diverse technological developments, ship-route clustering is emerging as an important technology for the commercialization of autonomous ships. Through route clustering, ship-route patterns are extracted from the sea to obtain the fastest and safest route and serve as a basis for the development of a collision-prevention system. High-quality, well-processed data are essential in ensuring the accuracy and efficiency of route-clustering algorithms. In this study, among the various route-clustering methods, we focus on the ship-route-similarity-based clustering method, which can accurately reflect the actual shape and characteristics of a route. To maximize the efficiency of this method, we attempt to formulate an optimal combination of data-preprocessing technologies. Specifically, we combine four methods of measuring similarity between ship routes and three dimensionality-reducing methods. We perform k-means cluster analysis for each combination and then quantitatively evaluate the results using the silhouette index to obtain the best-performing preprocessing combination. This study extends beyond merely identifying the optimal preprocessing technique and emphasizes the importance of extracting meaningful information from a wide range of ocean data. Additionally, this study can be used as a reference for effectively responding to the digital transformation of the maritime and shipping industry in the Fourth Industrial Revolution era.