본 연구에서는 같은 지역에 위치한 온실 3곳의 식별을 위해 통계적인 방법으로 분류를 하고자 주성분 분석(PCA)과 선형 판별 분석(LDA)을 수행하였다. 온실 내의 환경데이터는 같은 지역의 온실 3곳을 대상으로 4월 1일부터 4월 28일 총 4주간 1시간 간격으로 수집된 값을 사용하였다. 데이터를 분석하기 전, 데이터 정규화를 시키는 전처리를 거쳤으며, 전체의 80%인 훈련자료(training data)와 20%인 테스트 자료(test data)로 나누어 분석을 수행하였다. 분석을 수행한 결과, PC1은 57.51%의 설명력으로 PC1 = 0.7118112 × Tem. –0.6830065 × Humi. –0.1637892 × CO2.의 식을 가지며, LD1은 67.06% 의 설명력으로 LD1 = 0.8622565 × Tem. –0.1805741 × Humi. + 1.4018140 × CO2. + 0.03040701의 식을 가지는 것으로 나타났다. 이렇게 미리 분류시켜 놓은 온실의 데이터를 바탕으로 새로운 환경의 데이터를 입력하였을 때 특정 그룹으로의 분류가 가능함으로써 데이터의 성향을 파악할 수 있다. 이러한 데이터는 식별을 용이하게 함으로써 데이터의 활용도를 높여주는 방법이라고 판단된다.
최근 해상교통 환경의 변화가 다양해지고, 해상 교통량이 지속적으로 증가함에 따라 해상교통 분석에 대한 요구가 다양해지고 있다. 이러한 해상교통 분석 작업은 교통 특성에 대한 모델링이 선행되어야 하지만, 기존의 방법은 자동화되어 있지 않아 전처리 작업에 시간이 많이 소요되고, 분석 결과에 작업자의 주관적인 견해가 포함될 수 있는 문제점이 있었다. 이러한 문제점을 해결하고자 본 논문에서는 해상교통 분석을 위한 자동화된 교통 네트워크 생성 방법을 제안하였으며, 활용 가능성을 검토하기 위해 실제 목포항에서 수집된 6개월간의 항적 데이터를 이용한 실험을 수행하였다. 실험 결과, 대상 해역의 교통 특성을 반영한 교통 네트워크를 자동으로 생성할 수 있었으며, 대용량의 항적 데이터에도 적용할 수 있음을 확인하였다. 또한, 생성된 교통 네트워크는 시공간적 특징 분석이 가능하여 다양한 해상교통 분석에 활용될 수 있을 것으로 기대한다.
인체 바이오모니터링(Human biomonitoring, HBM) 데이터는 뇨와 혈액 등 생체지표으로부터 환경유해물질의 측정을 통해 획득되며, 다양한 노출원과 경로로부터 노출되는 유해물질의 인체노출수준 및 건강영향과의 상관성을 파악하기 위해 매우 중요하다. 국내의 경우 식품의약품안전처를 비롯한 국가기관의 다양한 HBM 프로그램을 통하여 HBM 데이터가 생산되고 있다. 그러나, 목적, 시기, 연구자 및 측정 장비의 차이에 의하여 서로 다른 형식에 따라 생산되다 보니, 데이터의 호환성의 문제로 인하여 특정 HBM 데이터를 신속하게 조회해야 하거나 인구집단별 시간적 추이분석 내지는 다른 국가의 자료와 비교에 난점을 가지고 있다. 따라서, 본 연구에서는 HBM 데이터를 체계적으로 데이터베이스(Database, DB)화하고 활용성을 증진하게 시킬 목적으로 지식 모델링을 실시하였다. 지식 모델링은 HBM 데이터의 생산되는 변수들을 그룹화하고 관계를 분석하여 2차원 구조의 개체 및 집합론에 기초한 방법론인 관계형 데이터 모델링 기법을 활용하여 실시하였다. 지식 모델은 조사대상자를 인구집단으로 중심으로 설문자료, 측정자료, 노출 평가자료 개체로 구성하고 그 안에 속성들을 정의하고, 개체간에 관계를 설정하는 방식으로 구성하였다. 또한, 도출된 지식 모델을 기반으로 식품의약품안전처에서 2006년-2018년까지 수행한 HBM의 원시데이터를 수집, 정제 및 정규화하여 통합 DB를 구축하였다. 이와 같이 통합 된 HBM-DB는 개별 자료원 내지는 특정 자료원들을 선택 하여 기간별 농도 수준에 대한 통계분석은 물론, 다양한 검 색조건을 통하여 데이터 추출을 할 수 있는 구조로 구축하였다. 본 HBM-DB는 관계형 DB모델로 구축되어 지속적인 대용량 DB 축적이나 HBM 데이터 해석을 위한 도구로써 효율적으로 수행할 수 있을 것으로 생각된다.
해수면온도는 해양-대기 상호작용, 열속 변화, 대양의 해양 순환을 이해할 수 있는 가장 중요한 해양 변수들 중의 하나이다. 0oC 이하 −2oC까지 극저 해수면온도는 기후변화 및 지구환경 변화를 유도하고 조절하기 때문에 다른 범위의 해수면온도보다 더 중요하게 다루어져야 한다. 전구 대양에서 이러한 극저 해수면온도의 시간적 공간적 변동성을 이해하기 위하여 1982년부터 2018년까지의 기간 동안 관측된 인공위성 일별 해수면온도 데이터베이스를 활용하여 평균 기후장을 산출하였다. 또한 장기간의 해양 실측 자료에 기반하여 생산된 표층 수온의 기후 평균장을 활용하여 극저 해수면온도가 전구 대양에서 존재하는 해역과 0oC 등온선의 월별 공간 변동을 분석하였다. 그 결과 극저 해수면온도는 북극해와 남극해와 같은 극지 해역과 고위도의 연해에서 상당한 해양의 표면적을 차지하고 있었다. 이러한 극저 해수면 온도가 어떻게 시각화되어 있는지 검토하기 위하여 6종 지구과학교과서를 분석하였다. 대부분의 교과서에서 해수면온도 삽화는 0oC 혹은 그 이상 수온에서 부터 도시하여 학생들이 극저 해수면온도에 대한 개념과 역할에 대한 이해를 획득 하는 것을 저해하고 있었다. 데이터 시각화는 데이터 리터러시의 주요한 요소 중에 하나이므로 위성 해수면온도 자료가 교과서에 적절하게 시각화되도록 교과서 삽화의 개선이 필요하다. 본 연구는 인공위성 해수면온도 자료와 해양 실측 자료를 활용하여 해양 데이터의 시각화를 통하여 해양학적 소양과 데이터 리터러시가 동시에 함양되고 강화될 수 있음을 강조하였다.
In this study, acoustic and viscosity data are collected in real time during the ball milling process and analyzed for correlation. After fast Fourier transformation (FFT) of the acoustic data, changes in the signals are observed as a function of the milling time. To analyze this quantitatively, the frequency band is divided into 1 kHz ranges to obtain an integral value. The integrated values in the 2–3 kHz range of the frequency band decrease linearly, confirming that they have a high correlation with changes in viscosity. The experiment is repeated four times to ensure the reproducibility of the data. The results of this study show that it is possible to estimate changes in slurry properties, such as viscosity and particle size, during the ball milling process using an acoustic signal.
Building Information Modeling(BIM)기술을 유지관리 단계에서 활용하기 위해서는 상당량의 유지관리 데이터와 BIM기반 정보모델 객체들이 연계되어 운용되어야 한다. 본 연구에서는 교량 점검데이터를 표현하기 위해 확장된 IFC기반의 BIM모델과 온톨로지를 연계하여 정보를 관리하는 방법을 제시하였다. 이를 위해 현재의 IFC버전은 교량 객체를 제대로 표현할 수 없기 때문에 교량을 위한 IFC엔티티를 확장하였으며, 확장된 IFC기반의 정보모델을 생성하는 방법을 제시하였다. 또한, 교량 점검데이터에 대한 기본 개념을 추출하고, 교량 점검데이터를 위한 온톨로지(Ontology)를 생성하였다. 추출된 기본 개념들은 제시된 온톨로지에서 시멘틱 웹의 트리 플(Triple) 방식으로 관계를 형성되었다. 마지막으로, 생성된 IFC기반의 BIM모델은 제시된 온톨로지와의 통합을 위하여 시멘틱 데이터 형식으로 변환되었다. 확장된 IFC기반 BIM모델은 제시된 교량 점검데이터 관리를 위한 온톨로지와 통합되었고, 실제 교량 점검데 이터를 기반으로 테스트모델을 생성하였다. SPARQL query를 통해 목적에 맞는 교량 점검데이터가 추출됨을 확인하여 실효성을 검 증하였다.
본 연구는 데이터 마이닝 기반 의사결정 나무 분석을 적용해 Z세대 스포츠 소비 스타일을 탐색 하여 Z세대가 주도할 스포츠 소비 시장을 예측하기 위한 기초자료를 제공하고자 했다. 따라서 Z세대 중 만 19세 이상 남성 및 여성을 표본으로 선정해 본 조사를 실시했으며, 총 429명의 자료를 최종 분석에 사용했다. 자료처리는 SPSS statistics(ver. 21.0) 프로그램을 이용하여 빈도분석, 탐색적 요인분석, 재검사 신 뢰도 및 신뢰도 분석, 의사결정 나무 분석을 실시했다. 본 연구의 주요 결과는 다음과 같다. 첫째, 합리 효율성 지수가 높고, 심미적 소비 지수가 낮을 경우 여성 집단으로 분류될 확률이 96.8%로 나타났다. 반면에 합리 효율성과 가격 지향 지수가 낮을 경우 남성 집단으로 분류될 확률이 100%로 나타났다. 둘째, 브랜드 지향, 가격 지향, 합리 효율성 지수가 높을 경우 수도권 집단으로 분류될 확률이 97.3%로 나타났다. 앞서 제시한 결과와는 상반적으로 브랜드 지향, 기념 의례, 지위 상징 지수가 낮을 경우 이외 지역 집단으로 분 류될 확률이 82.1%로 나타났다. 셋째, 지위 상징, 유행 지향 지수가 높으며, 기능성 지수가 낮을 경우 일상 생활 및 패션 집단으로 분류될 확률이 77.6%로 나타났다. 이와 반대로 지위 상징 지수가 낮고, 소속감 유지, 소비 향유 지수가 높을 경우 운동 및 경기 집단으로 분류될 확률이 81.0%로 나타났다.
본 연구에서는 최근, 자연환경의 변화에 따른 생태계 예측과 지속가능한 개발과 보전의 정량적 근거 제시를 위해 전세계적으로 연구중요도와 활용도가 높아지고 있는 생태 조사연구 데이터의 정제와 표준화 및 서비스 방안에 대하여 제시하였다. 1997년부터 매 10년 단위로 전국을 대상으로 수행된 제2차, 제3차 전국자연환경조사 결과와 2014년부터 매 5년 단위로 수행된 제4차 전국자연환경조사 결과를 대상으로 전국자연환경조사 지침을 따라 별도 개발된 입력 오류 검증 프로그램을 통해 1차 정제 후 분야별 전문가의 검수를 거쳤다. 또한, 국내외 데이터 표준 사례들을 분석하여 국내의 자연환경과 생태조사 자료인 생태정보를 표준화하는 방안을 제시하였다. 전국자연환경조사 결과에 대해 (1) 조사자료인 데이터 용어의 표준화, (2) 유사한 유 형의 데이터 테이블 통합 및 (3) 불필요한 속성과 입력오류 를 제거하였고 (4) 현장 조사자 별로 상이한 입력항목의 단 일화, (5) 데이터를 일련번호 코드로 정리하고 (6) 입력항목 별 코드 매핑을 수행하였다. 연구결과, 연구자와 일반인들이 활용하기 쉽도록 전국자연환경조사 데이터를 정제하고 국내 최초의 생태데이터 표준안 마련의 기반을 수립하였다. 또한, 연구결과로 산출된 전국자연환경조사 데이터는 국내의 환경영향평가, 서식지 보전지역 설정, 멸종위기종 분포 예측, 기후변화에 따른 생태계 위험 예측은 물론, 국외 생태정보 연계 등에 손쉽게 공유 및 활용가능하여 다양한 환경정책수립과 관련 연구활성화에 기여할 것으로 기대된다. 본 연구를 통해 정제된 전국자연환경조사 데이터는 국립생태원에서 국내 최초로 개발중인 생태정보포털서 비스 시스템인 에코뱅크 (http://nie-ecobank.kr)를 통해 개 방하여 누구나 온라인상에서 쉽게 접근하고 활용할 수 있도록 하였다.
Economic indicators are a factor that affects air cargo volume. This study analyzes the different factors affecting air cargo volume by each Chinese cities according to the main characteristics. The purpose of this study is to help companies related to China, airlines, and other stakeholders predict and prepare for the fluctuations in air cargo volume and make optimal decisions. To this end, 20 economic data were used, and the entire data was reduced to 5 dimensions through factor analysis to build a dataset necessary and evaluated the influencing factors by multi regression. The result shows that Macro-Economic Indicators, Production/Service indicators are significant for every cities and Chinese manufacture/Customer indicators, Korean manufacture/Oil Price indicators, Trade/Current indicators are significant for each other city. All adjusted R2 values are high enough to explain our model and the result showed excellent performance in terms of analyzing the different factors which affects air cargo volume. If companies that are currently doing business with China can identify factors affecting China's cargo volume, they can be flexible in response to changes in plans such as plans to enter China, production plans and inventory management, and marketing strategies, which can be of great help in terms of corporate operations.
This paper proposes an outlier detection model based on machine learning that can diagnose the presence or absence of major engine parts through unsupervised learning analysis of main engine big data of a ship. Engine big data of the ship was collected for more than seven months, and expert knowledge and correlation analysis were performed to select features that are closely related to the operation of the main engine. For unsupervised learning analysis, ensemble model wherein many predictive models are strategically combined to increase the model performance, is used for anomaly detection. As a result, the proposed model successfully detected the anomalous engine status from the normal status. To validate our approach, clustering analysis was conducted to find out the different patterns of anomalies the anomalous point. By examining distribution of each cluster, we could successfully find the patterns of anomalies.
In order to improve the ground-motion prediction equation, which is an important factor in seismic hazard assessment, it is essential to obtain good quality seismic data for a region. The Korean Peninsula has an environment in which it is difficult to obtain strong ground motion data. However, because digital seismic observation networks have become denser since the mid-2000s and moderate earthquake events such as the Odaesan earthquake (Jan. 20, 2007, ML 4.8), the 9.12 Gyeongju earthquake (Sep. 12, 2016, ML 5.8), and the Pohang earthquake (Nov. 15, 2017, ML 5.4) have occurred, some good empirical data on ground motion could have been accumulated. In this study, we tried to build a ground motion database that can be used for the development of the ground motion attenuation equation by collecting seismic data accumulated since the 2000s. The database was constructed in the form of a flat file with RotD50 peak ground acceleration, 5% damped pseudo-spectral acceleration, and meta information related to hypocenter, path, site, and data processing. The seismic data used were the velocity and accelerogram data for events over ML 3.0 observed between 2003 and 2019 by the Korean National Seismic Network administered by the Korea Meteorological Administration. The final flat file contains 10,795 ground motion data items for 141 events. Although this study focuses mainly on organizing earthquake ground-motion waveforms and their data processing, it is thought that the study will contribute to reducing uncertainty in evaluating seismic hazard in the Korean Peninsula if detailed information about epicenters and stations is supplemented in the future.
본 View Point에서는 COVID-19으로 초래된 사회 경제적 새로운 질서(New Normal)에서 데이터 산업의 성장 가능성을 조망하고 데이터 비즈니스가 산업생태계에서 생존하는 데 필요한 요소와 전략을 살펴본다. 비대면 사회로의 전환은 데이터의 양적 팽창과 함께 집중화 현상 촉진으로 이어지고 있다. 국가적으로 데이터 산업생태계의 발전 전략을 수립하고 자본의 흐름이 뒤따르고 있는 지금은 데이터 비즈니스에 기회의 시기라고 할 수 있다. 특정 데이터 비즈니스가 산업 생태계에서 생존하고 성장하기 위해서는 안정적인 데이터 품질을 기반으로 경쟁사 대비 비교우위에 있는 품질 속성을 파악해야 하고 특히 어떤 비즈니스 세분화 영역에 해당하는지를 판단할 수 있어야 불필요한 자원투입의 낭비를 막고 효율적인 투자를 할 수 있다.
최근 빅데이터 기술의 발전에 따라 보건의료 빅데이터를 헬스케어에 접목하여 부가가치를 창출하고자 하는 논의가 활발하다. 그러나 보건의료 정보는 민감한 개인정보로서 개인정보보호 규제를 받기 때문에, 개인정보보호와 보건의료 빅데이터 활성화 방안을 함께 검토할 필요가 있다. 이에 본 연구에서는 먼저 보건의료 빅데이터 관련 주요 개념을 살펴보고, 보건의료정보가 개인 정보보호와 보건의료법제에서 어떻게 규율되고 있는지 관련 법규 및 판결을 고찰하였다. 법원은 정보 활용시 얻을 수 있는 이익과 정보주체의 개인정보 자기결정권을 비교형량하여 정보주체의 동의 없이도 정보처리가 가능하다고 판시하였다. 그러나 개별 기업이 공개정보 등을 처리하려고 할 때마다 법익을 비교형량하여 판단하는 것은 현실적으로 불가능하다. 따라서 본 연구에서는 EU에서 진행된 시민 참 여형 보건의료 빅데이터 조성논의를 참고하여 동의 없이 어느 범위까지 정보처리가 가능한지에 대한 사회적인 합의가 선행되어야 한다고 보았다. 사회적 논의 이후 법제화 과정에서는 보건의료정 보의 세분화, 목적 외 처리가 가능한 정보의 범위 등 정보처리의 법적 근거 마련, 정보주체의 권리를 보호하면서도 악용을 방지하기 위한 보안장치가 필요함을 주장하였다.
기후 변화에 따른 이상기상 등 농업환경변화에 따른 농작물의 생산성 및 품질 저하 등의 문제가 발생하고 있다. 최근에는 이러한 문제를 해결하기 위해 정보통신기술(Information & Communications Technology; ICT), 사물인터넷 (Internet of Things; IoT) 및 인공지능(Artificial Intelligence; AI) 등을 이용한 지능한 작물 모델 개발과 정보화 자원 구축 등의 연구가 진행되고 있다. 국내의 ICT를 적용한 스마트팜은 비닐하우스와 같은 시설 내부 환경을 제어하는 기술로 구성되어 있으나 국내 농경지 면적의 95%는 노지로 되어 있어 노지에 쉽게 적용할 수 있는 농업 ICT 기술 이 필요하다. 따라서 본 연구는 노지 작물의 지능형 생육 환경 모델 개발을 위한 IoT 기반 환경 데이터 획득 시스 템을 구축하고 시계열 계측을 통해 농작물 생육의 주요 인자인 토양 수분과 토양 온도의 변화 특성을 파악하고자 한다. 본 실험은 전북 완주군 소재 국립식량과학원 풍산나물콩 및 대풍콩 재배 포장에 환경데이터 획득 시스템을 구축하였으며 IoT 기반 토양센서(Sentek Drill&Drop, Australia)을 통해 토양의 수분 및 온도를 측정하였다. 토양 센 서는 서로 간섭을 최소화하기 위해 일정 간격으로 설치하고 지면으로부터 전극을 깊이 30 cm 까지 삽입시킨 후 20년 07월 04일부터 20년 10월 07일까지 깊이 10 cm, 20 cm, 30 cm의 토양 수분 및 온도의 시계열 변화를 비교 분 석하였다. 토양 수분 및 온도 변화는 지면으로부터 깊이 10 cm, 20 cm, 30 cm 순으로 크게 나타났다. 본 연구의 결 과는 4차 산업 기술의 농업적 적용성을 높이기 위한 빅데이터 구축 및 노지 스마트팜 기술 기반 확보를 위한 자료 로 활용될 수 있을 것으로 판단된다.