PURPOSES : For autonomous vehicles, abnormal situations, such as sudden changes in driving speed and sudden stops, may occur when they leave the operational design domain. This may adversely affect the overall traffic flow by affecting not only autonomous vehicles but also the driving environment of manual vehicles. Therefore, to minimize the traffic problems and adverse effects that may occur in mixed traffic situations involving manual and autonomous vehicles, an autonomous vehicle driving support system based on traffic operation optimization is required. The main purpose of this study was to build a big-data-classification system by specifying data classification to support the self-driving of Lv.4 autonomous vehicles and matching it with spatio-temporal data. METHODS : The research methodology is explained through a review of related literature, and a traffic management index and big-dataclassification system were built. After collecting and mapping the ITS history traffic information data of an actual Living Lab city, the data were classified using the traffic management indexing method. An AI-based model was used to automatically classify traffic management indices for real-time driving support of Lv.4 autonomous vehicles. RESULTS : By evaluating the AI-based model performance using the test data from the Living Lab city, it was confirmed that the data indexing accuracy was more than 98% for the KNN, Random Forest, LightGBM, and CatBoost algorithms, but not for Logistics Regression. The data were severely unbalanced, and it was necessary to classify very low probability nonconformities; therefore, precision is also important. All four algorithms showed similarly good performances in terms of accuracy. CONCLUSIONS : This paper presents a method for efficient data classification by developing a traffic management index to easily fuse and analyze traffic data collected from various institutions and big data collected from autonomous vehicles. Additionally, EdgeRSU is presented to support the driving of Lv.4 autonomous vehicles in mixed autonomous and manual vehicles traffic situations. Finally, a database was established by classifying data automatically indexed through AI-based models to quickly collect and use data in real-time in large quantities.
본 연구는 관광 관련 서비스 분야에 필요한 특수 목적 중국어(CSP) 교육과정 개 발을 위한 첫 단계로 AI 데이터 기반으로 구축된 구어체 병렬 코퍼스에서 CSP 어휘 리스트를 선정하여 용어색인과 어휘다발(n-gram)등을 분석하였다. 어휘리스트 어휘 규모는 토큰 수 총 304, 228개와 타입 수 17, 286개로 나타났으며, 어휘 누적 증가율 을 분석하면 2-Gram과 3-Gram의 어휘다발이 가장 많았고, 실무 현장에서 가장 많 이 활용되고 있음을 알 수 있었다. 본 연구에서 구축된 특수 목적 관광 중국어 어휘 리스트는 실제 교육 자료로 제공하여 관광 중국어 학습자와 교수자에게 실용적으로 사용될 수 있을 것이라 기대한다.
최근 회전 회전기계의 건전성 관련 연구가 활발하게 진행중이며, 조선업의 대표적인 회전기계인 갠트리 크레인에도 이를 적용하고자 하는 연구가 활발하게 진행되고 있다. 하지만 조선업의 갠트리 크레인의 경우 상대적으로 낮은 RPM으로 구동되고 잦은 운 전과 정지가 이루어지며 충격, 소음 등의 외부환경 인자가 측정 데이터에 영향을 크게 미쳐 오차를 발생시킬 수 있다. 본 연구에서는 조선업의 내업공정에서 사용되는 갠트리 크레인의 Hoist 모사장비를 제작하여, 운전조건(RPM) 변화와 데이터 획득 센서의 위치 차이가 획득 데이터에 미치는 오차를 통계적으로 분석하였다. 연구결과 상대적으로 낮은 운전조건에서는 센서 위치 차이에 따른 획득 데이터 의 오차는 크게 발생하지 않았으나, 상대적으로 높은 운전조건에서는 획득 데이터의 오차가 크게 발생하는 것으로 확인하였으며, 회전 기계의 데이터 획득 시 운전조건과 획득 센서위치가 획득 데이터에 영향을 미치는 것으로 확인하였다.
예로부터 우리나라는 중국과 정치, 경제, 문화적으로 가장 가까운 관계에 있었으며, 중국어는 늘 중요한 외국어로 인정받고 있었다. 한글 창제 이후 간행된 조선 시대 중국어 역학서는 당시 언어 특징과 생활, 문화상에 대한 풍부한 정보를 담고 있는 寶庫라 할 수 있다. 이들에 대한 연구성과는 상당히 축적되어 있으나 아직도 연구 방법과 연구 환경에 있어서 매우 초보적인 단계에 머물러있어, 스캔한 원본 이미지 혹은 중국어 원문이나 언해문 등의 불완전한 2차 가공물 정도만 웹사이트 상에서 열 람할 수 있다. 이에, 본 연구는 조선 시대 중국어 역학서인 『老乞大諺解』, 『朴通事諺 解』, 『譯語類解』, 『五倫全備諺解』, 『譯語類解補』, 『朴通事新釋諺解』, 『重刊老乞大諺解 』, 『華音啓蒙諺解』, 『華語類抄』와 중국어 원문만으로 이루어진 『老乞大』, 『朴通事新 釋』의 총 11종 역학서 및 동일한 서명의 다른 판본 총 31개의 서적을 대상으로 규장 각한국학연구원 웹사이트에서 아직 제공하지 않는 원문과 번역문에 대한 데이터를 TSV(Tab Separated Values)와 XML(eXtensible Markup Language) 형식으로 구축하였다. 본 연구는 조선 시대 중국어 역학서에 대한 원문과 번역문을 총망라한 최초 의 연구성과이다. 이를 통해 대중에게 국학 자료에 대한 관심을 제고하고, 연구자들 에게 더 나은 연구 환경을 제공하며, 한국어, 중국어학 및 문화사 등의 교육 및 연구 에 활용할 수 있을 것이다. 그리고 여러 관련 데이터베이스를 연계하여 동아시아 지 역의 교류에 대한 사회사적, 문화사적 연구의 발판이 되어줄 것이다.
In order to implement a dialogue system for Korean language tutoring, this paper aimed to describe a method of constructing a large amount of Korean task-oriented dialogue data using the Wizard-of-OZ method and a pedagogical feedback and evaluation method for Korean language errors made by foreign learners. The procedure for constructing a large amount of Korean task-oriented dialogue data consisted of three steps. The first step was the preparation step for the learner’s prior learning. The second step was related to a large Korean dialogue map constructed by Korean native speakers using the Wizard-of-OZ method. The third step was implementation of a Korean dialogue system based on the dialogue map. In educational feedback and evaluation, functions such as paraphrases, recommendation expressions, educational success rate, and error content evaluation by learner level were proposed. By means of the Wizard-of-OZ method, 3,253 Korean task-oriented dialogue data were established in four domains: restaurant, hotel, tourist attraction, and taxi. The dialogue system for Korean language tutoring is currently being implemented based on Korean taskoriented dialogue data. Ultimately, the task-oriented dialogue system for Korean language tutoring aims at an “augmentation of education” that collaborates with human teachers, not “teacher-less education” that replaces human teachers.
인체 바이오모니터링(Human biomonitoring, HBM) 데이터는 뇨와 혈액 등 생체지표으로부터 환경유해물질의 측정을 통해 획득되며, 다양한 노출원과 경로로부터 노출되는 유해물질의 인체노출수준 및 건강영향과의 상관성을 파악하기 위해 매우 중요하다. 국내의 경우 식품의약품안전처를 비롯한 국가기관의 다양한 HBM 프로그램을 통하여 HBM 데이터가 생산되고 있다. 그러나, 목적, 시기, 연구자 및 측정 장비의 차이에 의하여 서로 다른 형식에 따라 생산되다 보니, 데이터의 호환성의 문제로 인하여 특정 HBM 데이터를 신속하게 조회해야 하거나 인구집단별 시간적 추이분석 내지는 다른 국가의 자료와 비교에 난점을 가지고 있다. 따라서, 본 연구에서는 HBM 데이터를 체계적으로 데이터베이스(Database, DB)화하고 활용성을 증진하게 시킬 목적으로 지식 모델링을 실시하였다. 지식 모델링은 HBM 데이터의 생산되는 변수들을 그룹화하고 관계를 분석하여 2차원 구조의 개체 및 집합론에 기초한 방법론인 관계형 데이터 모델링 기법을 활용하여 실시하였다. 지식 모델은 조사대상자를 인구집단으로 중심으로 설문자료, 측정자료, 노출 평가자료 개체로 구성하고 그 안에 속성들을 정의하고, 개체간에 관계를 설정하는 방식으로 구성하였다. 또한, 도출된 지식 모델을 기반으로 식품의약품안전처에서 2006년-2018년까지 수행한 HBM의 원시데이터를 수집, 정제 및 정규화하여 통합 DB를 구축하였다. 이와 같이 통합 된 HBM-DB는 개별 자료원 내지는 특정 자료원들을 선택 하여 기간별 농도 수준에 대한 통계분석은 물론, 다양한 검 색조건을 통하여 데이터 추출을 할 수 있는 구조로 구축하였다. 본 HBM-DB는 관계형 DB모델로 구축되어 지속적인 대용량 DB 축적이나 HBM 데이터 해석을 위한 도구로써 효율적으로 수행할 수 있을 것으로 생각된다.
기후 변화에 따른 이상기상 등 농업환경변화에 따른 농작물의 생산성 및 품질 저하 등의 문제가 발생하고 있다. 최근에는 이러한 문제를 해결하기 위해 정보통신기술(Information & Communications Technology; ICT), 사물인터넷 (Internet of Things; IoT) 및 인공지능(Artificial Intelligence; AI) 등을 이용한 지능한 작물 모델 개발과 정보화 자원 구축 등의 연구가 진행되고 있다. 국내의 ICT를 적용한 스마트팜은 비닐하우스와 같은 시설 내부 환경을 제어하는 기술로 구성되어 있으나 국내 농경지 면적의 95%는 노지로 되어 있어 노지에 쉽게 적용할 수 있는 농업 ICT 기술 이 필요하다. 따라서 본 연구는 노지 작물의 지능형 생육 환경 모델 개발을 위한 IoT 기반 환경 데이터 획득 시스 템을 구축하고 시계열 계측을 통해 농작물 생육의 주요 인자인 토양 수분과 토양 온도의 변화 특성을 파악하고자 한다. 본 실험은 전북 완주군 소재 국립식량과학원 풍산나물콩 및 대풍콩 재배 포장에 환경데이터 획득 시스템을 구축하였으며 IoT 기반 토양센서(Sentek Drill&Drop, Australia)을 통해 토양의 수분 및 온도를 측정하였다. 토양 센 서는 서로 간섭을 최소화하기 위해 일정 간격으로 설치하고 지면으로부터 전극을 깊이 30 cm 까지 삽입시킨 후 20년 07월 04일부터 20년 10월 07일까지 깊이 10 cm, 20 cm, 30 cm의 토양 수분 및 온도의 시계열 변화를 비교 분 석하였다. 토양 수분 및 온도 변화는 지면으로부터 깊이 10 cm, 20 cm, 30 cm 순으로 크게 나타났다. 본 연구의 결 과는 4차 산업 기술의 농업적 적용성을 높이기 위한 빅데이터 구축 및 노지 스마트팜 기술 기반 확보를 위한 자료 로 활용될 수 있을 것으로 판단된다.