KOREASCHOLAR

생물다양성정보의 연계 및 활용을 위한 LOD(Linked Open Data)구축 Development of LOD(Linked Open Data) system for linkage and utilization of Biodiversity Information

이상보, 백인환, 진선덕, 김상용, 김택훈, 안지용, 오원석, 임정희, 백운기
  • LanguageKOR
  • URLhttp://db.koreascholar.com/Article/Detail/311198
한국환경생태학회 학술대회논문집
제24권 2호 (2014.11)
pp.130-131
한국환경생태학회 (Korean Society of Environment & Ecology)
Abstract

정부는 1999년부터 국가적으로 보존 및 이용가치가 높은 학술, 문화, 과학기술, 행정 등에 관한 공공정보를 체계적으 로 수집하고 디지털데이터로 구축하는 국가DB 사업을 추 진해 왔다. 그러나 기구축한 국가DB는 부처 또는 전문영역 별 DB 포맷(format)과 설계표준이 상이하고, 정보제공자 위주의 정보로 가공되어 정부3.0의 공공정보 개방과 창의적 활용에 대응하기 어려웠다. 이에 대안으로 제시된 것이 개 방형 연결데이터인 Linked Open Data(LOD)이다. LOD는 기존의 HTML(HyperText Markup Language)로 제공되었 던 데이터를 RDF(Resource Description Framework)형식 의 의미적 연관 관계있는 온톨로지(Ontology) 정보로 변환 시켜 URI(Uniform Resource Identifier)를 통해 웹상에 공 개하여 누구나 제약 없이 쉽게 사용할 수 있다는 장점이 있다. 또한, 여러 기관에서 생성한 데이터를 상호 관련성이 높은 정보와 연결되어 거대한 지식베이스(knowledge base) 구현에 적합하다. 본 연구는 국립중앙과학관과 국립수목원이 공동으로 구 축한 LOD와 국내외 LOD구축 사례를 소개하고 기존의 DB 공개 방식과 LOD의 차이점을 비교하여 기존 DB를 LOD형 태로 변환했을 때의 장점과 해결해야할 문제점 등을 고찰해 보고자 하였다. LOD는 기존의 문서(Document)중심의 웹에서 데이터 (Data)중심의 웹으로 온톨로지를 통한 Data의 의미적 연결 성을 확보하여 인간과 기계간의 상호소통뿐만 아니라 컴퓨 터 간에도 스스로 추론하여 의미 있는 정보를 추출할 수 있다. 또한 LOD는 URI와 RDF를 사용하여 기존 DB에 비 해 개방성과 유연성이 좋으며, 다른 데이터와 서로 링크하 여 데이터 매시업(Mashup) 및 재사용이 유용하다. LOD구축사업은 국립중앙과학관과 국립수목원에 기 구 축된 생물다양성 정보를 RDF형태로 변환하여 두 기관의 정보를 연결하고 관련정보의 공동검색 그리고 그와 관련된 연관정보를 구축하였다. 또한 다른 기관과의 정보 연결까지 고려한 ‘LOD플랫폼’ 및 ‘LOD생물다양성정보통합시스템’ 을 구축하고 생물다양성정보의 통합 지식베이스의 기틀을 마련하였다. LOD플랫폼은 LOD발행·관리·통계, 데이터브라우징, SPARQL Endpoint, 검색, 다운로드 등의 기능을 구현하였 으며, LOD생물다양성정보통합시스템은 발행된 LOD데이 터의 활용을 위한 예시 사이트로서 구축된 식물, 균류, 척추 동물의 상세설명 및 그와 관련된 연관정보, 검색, 동영상, 음성 서비스 등의 기능을 구현하였다. 대상정보는 기 구축된 국립중앙과학관의 65만개의 데이 터와 국립수목원의 143만개의 데이터 중, 해당 포털에서 인기 검색된 생물종 300종(식물100종, 척추동물100종, 균 류100종)을 선정하여, 생물종 기본 정보 및 각종 연관정보 를 연계할 수 있는 생물다양성정보 DB를 새롭게 구축하였 다. LOD 구축은 대상DB분석 및 구축범위선정, 온톨로지 모 델설계 및 트리플 변환규칙설계, RDF 트리플 변환, 저장 순으로 진행하였고, 연관정보 구축은 정보의 전문성과 정합 성을 위해 분야별 전문가를 선정하여 진행하였다. 또한 LOD활용 측면에서 가장 중요한 인터링킹 구축을 위해 DBpedia, KDATA 등에 있는 관련 LOD 데이터와의 연결 을 통한 매시업 작업을 하였다. 생물다양성 정보의 LOD 구축 효과로는 전문가 중심에서 일반인을 위한 맞춤형 생물다양성 정보를 제공하고, 생물분 야에 대한 다양한 정보를 URI, SPARQL 검색 등으로 손쉽 게 제공함으로서 생물다양성 정보의 접근성 확대와 정보의 활용성을 강화하였다. 또한 스마트폰, 태블릿 PC 등의 스마 트 멀티미디어 교육 환경 조성 및 생물 관련 교육자료 제공등의 효과로 생물다양성 정보의 부가가치 창출이 기대되고 있다. LOD구축의 국내 사례로는 서울시 열린 데이터 광장, 국 립중앙도서관의 국가서지 LOD, 한국사 역사정보 LOD 등 이 있으며, 국외 사례로는 미국의 Data.gov, 영국의 Data.gov.uk, BBC , DBpedia 등이 있다. 하지만, 아직은 LOD로 구축된 국내외 데이터 정보가 빈약하고, 기존의 구 축된 DB를 LOD형태로 변환하는데 비용과 시간이 많이 든다. 또한 LOD변환의 필요성 및 인식이 부족하여, 연관정 보를 임의로 구축하여 연결하는 제한된 형태의 LOD를 구 축하여 제공하는 실정이다. 이에 국가적 차원으로 지속적인 관심과 협조를 통해 기존의 구축된 여러 기관의 데이터를 LOD형태로 변환하여 하나로 통합함으로서 국가지식정보 의 거대 지식베이스 구축에 힘써야 할 것이다.

Keyword
Author
  • 이상보(국립중앙과학관) | Lee Sangbo
  • 백인환(국립중앙과학관) | In Hwan Paik
  • 진선덕(국립중앙과학관) | Seon Deok Jin
  • 김상용(국립수목원) | Sangyong Kim
  • 김택훈(한국정보화진흥원) | Kim Taek Hoon
  • 안지용(㈜우림NR,) | Ji-Yong An
  • 오원석(㈜리스트) | Oh Won Seok
  • 임정희(국립중앙과학관) | Jeongheui Lim
  • 백운기(국립중앙과학관) | Woon-Kee Paek