해사 데이터는 항만을 입출항하는 선박 정보, 해상에서 운송되는 화물 정보, 이를 모니터링하고 관리하는 해상교통관제 정보 등 해상에서 생성되는 모든 데이터로 정의할 수 있다. 이러한 해사 데이터는 그 종류만큼이나 다양한 형식으로 송수신되고 있으며, 각각 의 데이터가 서로 밀접하게 연관되어 있는 멀티모달의 특징을 가지고 있기 때문에 데이터의 통합 관리가 어려운 실정이다. 더욱이 해사 데이터를 인공지능 시스템에 활용하기 위해서는 데이터 도메인에 대한 지식이 필요하기 때문에 비전문가의 경우 데이터를 활용하는 데 제약이 많았다. 이에 본 논문에서는 데이터의 연관 관계를 이용하여 멀티 모달 해사 데이터를 효과적으로 관리할 수 있는 데이터 체계를 제안하였다. 제안하는 관리 체계는 멀티 모달 데이터의 전처리 작업 절차와 연관 관계 기반의 그래프 데이터베이스, 비정형 데이터를 위 한 객체 저장 공간을 포함하고 있으며, 이를 통해 수집된 데이터로부터 연관 관계를 자동으로 추출하여 저장할 수 있도록 설계하였다. 또 한, VHF 데이터의 데이터베이스 구축 예시를 통해 제안하는 데이터 관리 체계의 활용 가능성을 검토하였으며, 기존의 데이터 관리 체계 에 비해 데이터의 이해도를 높이고, 활용도를 향상시킬 수 있을 것으로 예상된다.
Maritime data can be defined as all data generated at maritime domain, including information about ships entering and leaving ports, cargo transported, and the VTS information that monitors and manages vessels. This maritime data is sent and received in a variety of formats and is multimodal, with each data type being closely related to the other, making it difficult to integrate and manage. Moreover, utilizing maritime data for AI systems requires knowledge of the data domain, which limits the ability of non-experts to utilize the data. In this paper, we proposed a data architecture that can effectively manage multimodal maritime data by utilizing the correlation of data. The proposed management architecture includes a preprocessing procedure for multimodal data, a graph database based on associations, and an object storage space for unstructured data, which can automatically extract and store associations from the collected data. In addition, we examined the feasibility of the data management system through the example of building a database of VHF data, and confirmed that it can improve the user's understanding of the data and improve data utilization compared to the existing data management system.