본 연구는 북한이 2024년을 전쟁 준비 완성의 해로 선언하고 연이어 미사일을 발사하여 안보를 위협하는 상황에서, 빅데이터 분석을 활용하 여 한국 언론보도와 포털 사이트에 나타난 북핵 및 미사일 위협에 대한 담론과 인식의 특성을 실증적으로 분석하고, 그에 따른 시사점을 도출하 는 것을 목적으로 한다. 이를 위해 국내 주요 언론보도와 포털 사이트에 서 총 33,318건의 데이터를 수집하여, TF-IDF 분석을 통해 상위 50개 의 주요 키워드를 도출하고, 사회연결망 분석을 통해 각 키워드 간의 연 결 정도와 구조를 파악하였다. 분석 결과, 러시아-우크라이나 전쟁, 이스 라엘-하마스 전쟁 등 국제적 안보 불안과 동북아에서의 북-러 군사협력 및 한-미-일 군사협력의 대립 구도 등이 사회적 담론 형성에 큰 영향을 미친 것으로 나타났다. 이에 따라 한-미-일 군사협력 강화와 확장 억제 전략의 신뢰성을 높이고, 사회적 차원에서 위기의식과 안보의식의 제고 가 필요하다는 시사점이 도출되었다.
The pressure sensor had been widely used to effectively monitor the flow status of the water distribution system for ensuring the reliable water supply to urban residents for providing the prompt response to potential issues such as burst and leakage. This study aims to present a method for evaluating the performance of pressure sensors in an existing water distribution system using transient data from a field pipeline system. The water distribution system in Y District, D Metropolitan City, was selected for this research. The pressure data was collected using low-accuracy pressure sensors, capturing two types of data: daily data with 1Hz and high-frequency recording data (200 Hz) according to specific transient events. The analysis of these data was grounded in the information theory, introducing entropy as a measure of the information content within the signal. This method makes it possible to evaluate the performance of pressure sensors, including identifying the most sensitive point from daily data and determining the possible errors in data collected from designated pressure sensors.
PURPOSES : The reliability of traffic volume estimates based on location intelligence data (LID) is evaluated using various statistical techniques. There are several methods for determining statistical significance or relationships between different database sets. We propose a method that best represents the statistical difference between actual LID-based traffic volume estimates and the VDS values (i.e., true values) for the same road segment. METHODS : A total of 2,496 datasets aggregated for 1-h LID and VDS data were subjected to various statistical analyses to evaluate the consistency of the two datasets. The VDS data were defined as the true values for comparison. Four different statistical techniques (procrutes, 2-sample t-test, paired-sample t-test, and model performance rating scale) were applied. RESULTS : In cases where there is a specific pattern (e.g., traffic volume distribution considering peak and off-peak times), distribution tests such as Procrustes or Kolmogorov-Smirnov are useful because not only the prediction accuracy but also the similarity of the data distribution shape is important. CONCLUSIONS : The findings of this study provide important insight into the reliability of LID-based traffic volume estimation. To evaluate the reliability between the two groups, a paired-sample t-test was considered more appropriate than the performance evaluation measure of the machine-learning model. However, it is important to set the acceptance criteria necessary to statistically determine whether the difference between the two groups in the paired-sample t-test varies according to the given problem.
PURPOSES : For autonomous vehicles, abnormal situations, such as sudden changes in driving speed and sudden stops, may occur when they leave the operational design domain. This may adversely affect the overall traffic flow by affecting not only autonomous vehicles but also the driving environment of manual vehicles. Therefore, to minimize the traffic problems and adverse effects that may occur in mixed traffic situations involving manual and autonomous vehicles, an autonomous vehicle driving support system based on traffic operation optimization is required. The main purpose of this study was to build a big-data-classification system by specifying data classification to support the self-driving of Lv.4 autonomous vehicles and matching it with spatio-temporal data. METHODS : The research methodology is explained through a review of related literature, and a traffic management index and big-dataclassification system were built. After collecting and mapping the ITS history traffic information data of an actual Living Lab city, the data were classified using the traffic management indexing method. An AI-based model was used to automatically classify traffic management indices for real-time driving support of Lv.4 autonomous vehicles. RESULTS : By evaluating the AI-based model performance using the test data from the Living Lab city, it was confirmed that the data indexing accuracy was more than 98% for the KNN, Random Forest, LightGBM, and CatBoost algorithms, but not for Logistics Regression. The data were severely unbalanced, and it was necessary to classify very low probability nonconformities; therefore, precision is also important. All four algorithms showed similarly good performances in terms of accuracy. CONCLUSIONS : This paper presents a method for efficient data classification by developing a traffic management index to easily fuse and analyze traffic data collected from various institutions and big data collected from autonomous vehicles. Additionally, EdgeRSU is presented to support the driving of Lv.4 autonomous vehicles in mixed autonomous and manual vehicles traffic situations. Finally, a database was established by classifying data automatically indexed through AI-based models to quickly collect and use data in real-time in large quantities.
기존 항만 건설 시 화물차 전용 주차장이 고려되지 않았으며, 해양수산부의 ‘제2차 신항만건설기본계획(2019~2040)’에 따라 총 11 개의 새로운 항만이 건설될 예정이다. 따라서 화물차 전용 주차장 설계에 대한 연구가 필요한 실정이다. 현재 항만에서는 화물차 전용 주차 공간 부족으로 불법 주차가 발생하고 있으며, 이로 인해 교통사고 위험이 증가하고 있다. 기존 연구에서는 전체 항만을 대상으로 한 분류 방법이 제안되었으나, 신설 항만 설계 시 과소 또는 과대 설계 문제를 초래한다. 따라서 본 연구는 부두별로 4대 요소(안벽 길이, 야적장 면적, 접안 능력, 하역 능력)를 기반으로 분류하며, DWT와 TEU 단위를 고려하여 데이터를 분석하였다. 14개 국가 관리 항만의 총 380 부두 데이터를 조사하고, 이를 통해 그룹핑 작업을 통해 정규화 곡선으로 평균 ± 표준편차를 기준으로 항만 전체 부두 에 대한 분류를 실시하였다. 이를 통해 향후 연구결과를 통해 검증 후 최종 분류방법을 결정하여 새로운 항만분류법을 제안하고, 제안 된 방법론의 분류검증을 실시할 예정이다.
본 연구는 치유정원 및 치유정원 내 도입 프로그램과 관련된 시기별 이용행태의 변화를 파악하여 프로 그램 및 서비스 제공에 있어 개선하는데 도움이 되는 기초자료를 제공하는 것을 목적으로 한다. 이를 위해 텍스트마이닝 기법을 활용하고 『수목원정원법』시행 및 코로나19 전후를 기점으로 하여 2014 년, 2019년, 2023년 세 가지 시기로 구분하여 시계열적으로 시기별 이용행태 간의 변화를 조사하였다. 연구결과 치유정원과 치유정원 내 도입 프로그램은 이용자들에게 있어 긍정적 경험으로 나타났다. 프 로그램의 경우 초기에는 치유농업 및 원예를 중심으로 시작되었으나 시간이 지남에 따라 산림치유를 비롯하여 가드닝을 포함한 다양한 활동으로 확장되었으며, 이용자 계층 또한 다양한 계층으로 확대되 었다. 아울러 치유정원은 원예치료, 산림치유 등 다양한 자연환경 기반 치유분야의 도입요소로 사용됨 에 따라 혼용되어 사용되고 있는 것으로 나타났다. 따라서 치유정원에 대한 명확한 개념정립과 함께 다양한 계층을 고려한 프로그램이 필요한 것으로 나타났다.
세계 해양산업은 자율운항선박 기술의 등장으로 급속도로 발전하고 있으며, 해양 데이터에서 파생된 인공지능 활용에 관한 관 심이 높아지고 있다. 다양한 기술 발전 중에서 선박 항로 군집화는 자율운항선박 상용화를 위한 중요한 기술로 부각되고 있다. 항로 군집 화를 통해 해상에서 선박 항로 패턴을 추출하여 가장 빠르고 안전한 항로를 최적화하고 충돌 방지 시스템의 개발에 기반이 된다. 항로 군 집화 알고리즘의 정확성과 효율성을 보장하기 위해 고품질의 잘 처리된 데이터가 필수적이다. 본 연구에서는 다양한 항로 군집화 방법 중 항로의 실제 형태와 특성을 정확히 반영할 수 있는 선박 항로 유사도 기반 군집화 방식에 주목하였다. 이러한 방식의 효율을 극대화하 기 위해 최적의 데이터 전처리 기술 조합을 구성하고자 한다. 구체적으로, 4가지의 선박 항로 간 유사도 측정법과 3가지의 차원 축소 방 법을 조합하여 연구를 진행하였다. 각 조합에 대해 k-means 군집 분석을 수행하고, 그 결과를 Silhouette Index를 통해 정량적으로 평가하여 최고 성능을 보이는 전처리 기법 조합을 도출하였다. 본 연구는 단순히 최적의 전처리 기법을 찾는 것에 그치지 않고, 광범위한 해양 데 이터에서 의미 있는 정보를 추출하는 과정의 중요성을 강조한다. 이는 4차 산업혁명 시대의 해양 및 해운 산업이 직면한 디지털 전환에 효과적으로 대응하기 위한 기초 연구로서 의의를 갖는다.
PURPOSES : This study aims to investigate the reliability of the real-time estimation of intersection traffic volumes based on the integration of location intelligence data and smart intersection data. METHODS : Location intelligence data (LID) and smart intersection data were obtained at eight intersections in Inju-daero, Incheon. The two datasets were then integrated to estimate traffic volumes for intersections in the shadow section, where traffic information was not expected to be obtained. The traffic estimation accuracy was evaluated using the total traffic, approach traffic, and turning movement volumes at the intersections. The estimated traffic was compared with the actual traffic volumes in the smart intersection data to validate the reliability of traffic estimation. RESULTS : The average traffic estimation error for the total intersection volume was approximately 4.5% for the five intersections in the shadow section. The estimation errors for the approach volumes (less than 5%) were also consistently low, except from 12 pm to 1 pm. CONCLUSIONS : The findings of this study suggest that location intelligence data can be combined with smart intersection data to estimate real-time traffic for shadow sections on roadways. This could enable a cost-effective cooperative intelligent transport system (C-ITS) when the municipal budget is limited, ultimately leading to the sustainable operation of C-ITS.
본 논문은 중국의 사이버 보안법을 둘러싼 쟁점을 살펴보고, 이 법이 기술무역장벽협정(TBT)의 규정을 위반하는지 여부를 검토하였다. 각 국 가들이 중국의 사이버 보안법을 TBT로 간주하는 주요 이유는 국경 간 데이터 흐름에 대한 제한 때문이다. 분석 결과, 국경 간 데이터 흐름에 대한 국가들의 상이한 태도 이면에 존재하는 핵심 문제는 주요 이해 관 계자들이 사이버 보안을 정의하는 방식에 있어 큰 차이가 있다는 것이 다. 따라서 주요 사이버 강국들은 사이버 보안을 정의하는 데 있어 합의 에 도달하는 것을 우선적으로 고려해야 한다. 각 국가들은 자국의 사이 버 전략을 강화하기 위해 관련 행정 규정, 부처 규칙, 및 규범에 관한 문서를 발행 및 개선하여 네트워크 운영자와 법 집행 기관을 위한 구체 적인 시행 기반을 제공해야 한다. 아울러 한국 정부는 중국과의 중요한 경제 관계와 국가 안보 및 경제 성장을 위해 데이터 현지화와 국경 간 데이터 흐름에 관한 정책의 균형이 필요하다고 강조한다.
이 글에서는 행정기관 간 분절되어 보유·관리되고 있는 공공데이터가 환류되지 않아 발생하는 소위 ‘데이터 칸막이 문제’에 대해 심도깊게 논 의하였다. 칸막이 현상은 우리 법 현실에서 관행적으로 뿌리내린 부처소관 주의가 행정의 영역에도 영향을 미치고 있음을 단적으로 보여준다. 각 부처 별로 구획되어 관련 행정사무를 분장하다 보니 소관 사무를 다른 기관에 이전하였을 때 책임의 문제로부터 자유롭기 어려우며, 이로 인해 소관사무 의 일환인 데이터 처리 업무를 재량껏 수행하기 어려워 나타나는 현상의 단면인 것이다. 따라서 객관적인 명분과 당위성이 존재하거나 법률상 명시 적 근거가 없는 경우 공행정주체에게 적극적인 집행을 기대하기는 어렵다 고 할 것이다. 이처럼 행정기관의 재량의 영역에서 발생하는 비효율성 문제 는 사안의 본질을 꿰뚫지 않는 한 해갈(解渴)이 쉽지 않다. 자칫 소극행정 에 대한 일관된 지적과 같이 행정작용이 전개되는 양상에만 몰두한 나머지, 시장에서의 현실적인 변화를 만들어내지 못할 가능성이 있기 때문이다. 이에 본 연구에서는 데이터 칸막이 현상이 발생하는 본질적인 원인을 파 악하기 위해 기존에 제시된 대안들이 갖는 한계를 도출하는 것으로부터 논 의를 출발하였다. 또 데이터를 규율하는 개별 법령을 분석함으로써 모범적 인 입법례와 정비가 필요한 대상 입법례를 발굴하였다. 이를 통해 얻은 다 양한 시사점은 그 동안 기관 간 칸막이 문제로 인해 소관 기관에 머물러야 했던 수요 데이터가 재조명받을 수 있도록 하는 문제 해결의 단초가 될 수 있을 것으로 기대한다.
2021년 이후 2년간 전 세계에서 모두 26억 건의 개인정보유출 피해가 발생했는데, 이는 10년 전인 2013년과 비교할 때 3배 이상 증가한 수치 라고 한다. 우리나라 또한 2020년 8월 이후 3년 동안 유출된 개인정보 건수가 6,505만 2,2232건에 달할 정도로 개인정보의 침해 사례가 많이 발생하였다. 이로 인하여 기업들은 자신들의 책임문제가 대두되어 고객의 개인정보를 적극적으로 수집·분석하여 마케팅에 활용하지 못하고 있다. 이 에 기업들은 관련 법률에 정보주체의 권리를 명확하게 설정하여 책임 범위 를 예측하여 고객들의 개인정보를 적극적으로 활용할 수 있도록 해 줄 것 을 요구하였으며, 고객들 또한 관련 법률에 그들의 권리를 명시하여 자신들 의 개인정보를 보호받기를 원하고 있다. 물론 우리나라는 2011년 개인정 보호법의 제정, 2020년 데이터3법의 개정 그리고 2023년 3월 14일 공포 되어 2023년 9월 15일 시행하는 개인정보보호법의 개정을 통해 정보주체 의 권리를 강화하기는 하였지만 여전히 미흡하다. 이에 이 논문에서는 2018년 5월부터 적용되는 EU의 일반 데이터 보호 규칙상 정보주체의 권리를 우리나라 개인정보보호법상 정보주체의 권리와 비교 검토를 통해 개선방안을 마련하고자 하였다. 그 결과 개인정보보호법 상 개인정보 열람권, 개인정보 전송권, 개인정보의 정정·삭제권, 개인정보 의 처리 제한권, 자동화된 결정에 대한 정보주체의 권리 및 이의제기권 관 련하여 일부 규정을 도입할 필요가 있다고 보고 그에 대한 개선방안을 제 시하였다.
Abstract Handling imbalanced datasets in binary classification, especially in employment big data, is challenging. Traditional methods like oversampling and undersampling have limitations. This paper integrates TabNet and Generative Adversarial Networks (GANs) to address class imbalance. The generator creates synthetic samples for the minority class, and the discriminator, using TabNet, ensures authenticity. Evaluations on benchmark datasets show significant improvements in accuracy, precision, recall, and F1-score for the minority class, outperforming traditional methods. This integration offers a robust solution for imbalanced datasets in employment big data, leading to fairer and more effective predictive models.
빅데이터 고객차별의 본질적인 문제는 플랫폼에 의한 사용자 정보의 과도한 수집 과 알고리즘을 부당하게 사용하여 소비자에게 차별화된 가격 전략을 구현하는 것이 다. 이것은 소비자의 합법적인 권익 침해 문제와 관련이 있다. 중국 정부는 소비자의 개인 정보 보호와 플랫폼 업체의 차별화된 가격 책정 금지 전략을 중심으로 관련 법 규를 제정했다. 하지만 2024년 5월 현재까지 빅데이터 고객차별에 대한 관련 행정처 벌 사례가 없고 소송으로 소비자가 승소한 사례도 없다. 따라서 현행법은 실제 실천 에 있어 많은 문제점이 있다. 본 연구는 소비자 정보 보호 및 빅데이터 고객차별과 관련된 현행 법률 및 규정의 단점을 분석하고 법적 수준에서 빅데이터 고객차별을 효과적으로 규제하기 위한 관련 정책 방안을 제안하였다.
태풍은 지구 시스템 내의 해양-대기-육상 상호작용을 일으키는 매우 중요한 현상으로 특히 태풍의 특성 인자 중 하나인 풍속은 중심 기압, 이동 경로, 해수면 온도 등의 매개변수에 의해 복잡하게 변화하여 실제 관측 자료를 기반으 로 이해하는 것이 중요하다. 2015 개정 교육과정 기반 중등학교 교과서에서 태풍 풍속은 본문 내용 및 삽화의 형태로 제시되고 있어 풍속에 대한 심층적 이해가 가능한 탐구활동이 무엇보다 필요한 실정이다. 본 연구에서는 교수-학습 과 정에서 간단한 조작만으로도 태풍의 풍속을 이해할 수 있도록 그래픽 사용자 인터페이스(GUI)를 기반으로 한 데이터 시각화 프로그램을 개발하였다. 2023년 발생한 태풍 마와르, 구촐, 볼라벤의 천리안 위성 2 A호 RGB (Red-Green-Blue) 영상 자료를 입력 자료로 활용하였다. 태풍 주변의 구름 이동 좌표를 입력하여 태풍의 풍속을 산출하고 태풍 중심 기 압, 폭풍 반경, 최대 풍속 등의 매개 변수를 입력하여 태풍 풍속 분포를 시각화 할 수 있도록 설계하였다. 본 연구에서 개발된 GUI 기반 프로그램은 천리안 위성 2 A호로 관측 가능한 태풍에 대해 오류 없이 적용 가능하며 교과서의 시공 간적 한계를 벗어난 실제 관측 자료 기반의 과학탐구활동이 가능하다. 학생과 교사는 별도의 유료 프로그램 및 전문적 인 코딩 지식이 없어도 실제 관측 자료를 수집, 처리, 분석, 시각화하는 과정을 경험할 수 있으며, 이를 통해 미래 정보 화 사회에서의 필수 역량인 디지털 소양을 함양시킬 수 있을 것으로 기대된다.
The objective of this study is to analyze the indoor air quality of multi-use facilities using an IoT-based monitoring and control system. Thise study aims to identify effective management strategies and propose policy improvements. This research focused on 50 multi-use facilities, including daycare centers, medical centers, and libraries. Data on PM10, PM2.5, CO2, temperature, and humidity were collected 24 hours a day from June 2019 to April 2020. The analysis included variations in indoor air quality by season, hour, and day of the week (including both weekdays and weekends). Additionally, ways to utilize IoT monitoring systems using big data were propsed. The reliability analysis of the IoT monitoring network showed an accuracy of 81.0% for PM10 and 76.1% for PM2.5. Indoor air quality varied significantly by season, with higher particulate matter levels in winter and spring, and slightly higher levels on weekends compared to weekdays. There was a positive correlation found between outdoor and indoor pollutant levels. Indoor air quality management in multi-use facilities requires season-specific strategies, particularly during the winter and spring. Furhtermore, enhanced management is necessary during weekends due to higher pollutant levels.
목적: 본 연구는‘2019년 생활시간조사’자료를 활용하여 작업치료 실행체계(Occupational Therapy Practice Frame; OTPF) 4판의 9가지 작업에 따라 독거노인과 비독거노인의 일상적 시간사용의 차이를 작업균형의 관점에서 알아보고자 한다. 연구방법: 통계청에서 추출한 자료를 기반으로 65세 이상 노인 자료를 독거노인과 비독거노인으로 분류하였다. 활동분류체계를 OTPF에 따라 재분류하고, 자료분석은 SPSS 29.0을 사용하였다. 결과: 활동유형 시간 사용에 따른 교차분석 결과 독거노인은 저활동에 속할 확률이 높았고, 비독거노인은 과활동에 속할 가능성이 높았다. 작업별 시간 사용에서는 독거노인은 비독거노인에 비해 일상생활, 일에 더 적은 시간을 사용한다. 결론: 독거노인들의 건강한 노년기를 위해서는 본 연구 결과를 노인들의 작업균형을 위한 중재에 활용하여야 할 것이다.
In the military, ammunition and explosives stored and managed can cause serious damage if mishandled, thus securing safety through the utilization of ammunition reliability data is necessary. In this study, exploratory data analysis of ammunition inspection records data is conducted to extract reliability information of stored ammunition and to predict the ammunition condition code, which represents the lifespan information of the ammunition. This study consists of three stages: ammunition inspection record data collection and preprocessing, exploratory data analysis, and classification of ammunition condition codes. For the classification of ammunition condition codes, five models based on boosting algorithms are employed (AdaBoost, GBM, XGBoost, LightGBM, CatBoost). The most superior model is selected based on the performance metrics of the model, including Accuracy, Precision, Recall, and F1-score. The ammunition in this study was primarily produced from the 1980s to the 1990s, with a trend of increased inspection volume in the early stages of production and around 30 years after production. Pre-issue inspections (PII) were predominantly conducted, and there was a tendency for the grade of ammunition condition codes to decrease as the storage period increased. The classification of ammunition condition codes showed that the CatBoost model exhibited the most superior performance, with an Accuracy of 93% and an F1-score of 93%. This study emphasizes the safety and reliability of ammunition and proposes a model for classifying ammunition condition codes by analyzing ammunition inspection record data. This model can serve as a tool to assist ammunition inspectors and is expected to enhance not only the safety of ammunition but also the efficiency of ammunition storage management.
PURPOSES : The tire-pavement interaction noise (TPIN) comprises four sources, among which the tire tread vibration noise (TTVN) and air pumping noise (APN) are known to be the most influential. However, when evaluating TPIN, the noise level is estimated based on the overall noise, because general noise measurement methods cannot separate TTVN and APN. Therefore, this study aims to develop a method to separate TTVN and APN in TPIN for quantitative assessment of pavement noise. METHODS : Based on the results of our literature review and frequency band noise data measured in our study, we identified the dominant frequency ranges for TTVN and APN. Additionally, we evaluated TTVN and APN across various pavement types. RESULTS : TTVN was found to be dominant in frequency bands below 800 Hz, while APN was dominant in frequency bands above 800 Hz. Additionally, regardless of the vehicle type, vehicle speed, or pavement type, APN exhibited higher levels compared to TTVN. This result shows that APN has a more significant impact on TPIN than TTVN. CONCLUSIONS : The separation method of TTVN and APN proposed in this study can be utilized to quantitatively assess the relationship between the primary noise sources in TPIN and the characteristics of pavement texture in future research. Furthermore, it is anticipated that characteristics of low TPIN and optimal texture conditions can be proposed to mitigate TPIN, thus contributing to the development of lownoise pavements.
본 연구는 관광 관련 서비스 분야에 필요한 특수 목적 중국어(CSP) 교육과정 개 발을 위한 첫 단계로 AI 데이터 기반으로 구축된 구어체 병렬 코퍼스에서 CSP 어휘 리스트를 선정하여 용어색인과 어휘다발(n-gram)등을 분석하였다. 어휘리스트 어휘 규모는 토큰 수 총 304, 228개와 타입 수 17, 286개로 나타났으며, 어휘 누적 증가율 을 분석하면 2-Gram과 3-Gram의 어휘다발이 가장 많았고, 실무 현장에서 가장 많 이 활용되고 있음을 알 수 있었다. 본 연구에서 구축된 특수 목적 관광 중국어 어휘 리스트는 실제 교육 자료로 제공하여 관광 중국어 학습자와 교수자에게 실용적으로 사용될 수 있을 것이라 기대한다.