하수처리장의 안정성과 효율성의 향상을 위해 스마트 기술 도입이 요구되고 있으나, 운영 데이터베이스 구축에 있어 계측의 신뢰성과 연속성 확보에 어려움이 있다. 활성슬러지 모델은 하수처리장의 디지털트윈으로 활용되며, 유입수 성상이 동일하더라도 다양한 운전 조건에 대한 데이터를 생산할 수 있다. 본 연구에서는 실측 데이터와 시뮬레이터 기반 합성 데이터를 통합하여 하수처리장 질소 농도 예측 머신러닝 모델을 구축하였다. A2O 공정의 호기조를 대상으로 기체상 N2O 및 액상 NH4 + 농도를 측정하였으며, 내부반송량, 외부반송량 등 운전인자를 포함한 운영데이터베이스를 구축하고 분석하였다. 확보한 실측 데이터를 기반으로 운영 특성을 분석하고, Sumo4N 모델을 활용하여 다양한 운전 조건에서의 합성 데이터를 생성하였다. 이후 두 데이터를 통합하여 데이터 증강을 수행함으로써, 실측 데이터의 양적 한계를 보완하였다. 모델 학습을 위한 입력 변수로는 외부⋅내부 반송량, 폭기량, 온도, 유입 질소 부하, pH를 선정하였으며 호기조의 N2O, NH4 +과 방류수 TN 농도를 예측하기 위한 머신러닝 모델을 개발하였다. 모델 학습에는 Lasso Regression, Random Forest, k-NN, SVR 알고리즘을 적용하여 성능을 평가하였다. 그 결과 SVR 알고리즘이 모든 질소 성분 예측에서 가장 우수한 성능을 보였으며, 개발된 모델 모두 R² ≥ 0.75의 높은 예측 성능을 나타내었다. 이는 시뮬레이터 기반 데이터 증강을 통해 기체상 및 액상 질소의 통합 제어를 위한 머신러닝 모델 구축의 가능성을 시사한다.
기후 변동성과 시장 불확실성이 심화되는 상황에서 노지 작 물의 작황 모니터링은 점차 중요성이 커지고 있다. 기상자료 통계분석, 원격탐사기반 식생지수, 작물모형 중 하나에만 의 존하는 기존 모니터링 접근법은 부분적인 정보만 제공할 뿐, 현장상황을 종합적으로 판단하여 제시하지 못하는 한계가 있 다. 본 연구는 다중출처 데이터와 작물모형을 통합하여 지역 단위 작황 모니터링을 자동으로 수행하는 보고 서비스 개발을 목표로 한다. 제안하는 서비스는 (1) 기상자료 분석을 통한 환 경 특성 평가, (2) 위성영상을 활용한 식생지수 산출을 통한 실 시간 생육 상태 진단, (3) 작물모형을 활용한 기상환경에 따른 잠재 생산량 추정의 세 요소로 구성된다. 이러한 데이터는 파 이프라인을 통해 자동으로 처리하여 그 결과가 지도, 시계열 변화, 생산량 예측을 포함한 지역 단위 작황 보고서로 생성되 도록 시스템을 개발하였다. 잠재생산량은 생산량 통계 자료 와의 비교 검증을 통해 작물모형(APSIM)을 활용한 잠재 생 산량 추정치가 유의한 수준임을 확인하였다. 본 연구에서 제 안한 체계는 다양한 출처에서 생산되는 데이터를 자동화된 보 고 파이프라인으로 통합함으로써 농업 의사결정, 정책 수립, 기후 및 시장 위험에 대한 신속한 대응을 지원할 수 있는 의사 지원시스템의 주요 구성요소로 기여할 것이다.
Smart factory technology, a core component of the Fourth Industrial Revolution, demonstrates significant disparities in technological development across countries. To quantitatively assess these international technology gaps, this study proposes an integrated analytical framework that combines text mining-based topic modeling and social network analysis (SNA), using global smart factory-related patent data from 2017 to 2023. Approximately 4,300 patent documents (titles and abstracts) were collected through the GPASS system and preprocessed. Through Latent Dirichlet Allocation (LDA) modeling with optimized hyperparameters, major technology topics were identified. Semantic interpretation using ChatGPT and expert review enabled the assignment of precise topic labels, which were further mapped to CPC (Cooperative Patent Classification) codes to construct a standardized technology taxonomy. Subsequently, the network structures of topic and classification nodes were analyzed by country (China, the United States, and South Korea), and the relative importance of key technology areas was evaluated using centrality metrics such as degree, closeness, betweenness, and eigenvector centrality. The analysis revealed that, globally, the most central technology areas include manufacturing process management and control, IoT and data-driven decision making, and facility-based process optimization. At the national level, China showed a strategic focus on technologies related to product quality improvement and cost reduction, South Korea emphasized IoT-enabled technologies and equipment-level optimization, while the United States prioritized control systems and data-driven project management. By utilizing patent-based textual data, this study offers a novel methodology for quantitatively diagnosing structural differences in national technological capabilities. The proposed framework provides valuable insights for country-specific R&D planning and strategic decision-making in the field of smart manufacturing.
본 연구에서는 코로나 이후 색조화장품 시장의 소비자들의 온라인 관심 정보에 대한 자료 수집 을 통하여 색조화장품 정보 검색의 특성과 텍스트 마이닝 분석 결과에 나타난 코로나 이후 색조화장품 시 장의 주요 관심정보들을 분석하고자 하였다. 실증분석에서는 “색조화장품” 이라는 단어를 포함하는 뉴스, 블로그, 카페, 웹페이지 등의 모든 문서들을 분석 대상으로 텍스트 마이닝을 수행하였다. 분석 결과 코로나 이후 색조화장품에 대한 온라인 정보 검색은 주로 구매 정보와 피부와 마스크 관련 화장법 등에 관한 정보 와 관심 브랜드와 행사 정보 등의 주요 토픽이 주를 이루고 있었다. 결과적으로 코로나 이후 색조화장품 구매자들은 적극적인 온라인 정보 검색을 통하여 제품 가치와 안전성, 가격 혜택, 매장 정보 등의 구매 정 보에 더욱 민감하게 될 것이므로 이에 대한 대응전략이 요구된다.
인체 바이오모니터링(Human biomonitoring, HBM) 데이터는 뇨와 혈액 등 생체지표으로부터 환경유해물질의 측정을 통해 획득되며, 다양한 노출원과 경로로부터 노출되는 유해물질의 인체노출수준 및 건강영향과의 상관성을 파악하기 위해 매우 중요하다. 국내의 경우 식품의약품안전처를 비롯한 국가기관의 다양한 HBM 프로그램을 통하여 HBM 데이터가 생산되고 있다. 그러나, 목적, 시기, 연구자 및 측정 장비의 차이에 의하여 서로 다른 형식에 따라 생산되다 보니, 데이터의 호환성의 문제로 인하여 특정 HBM 데이터를 신속하게 조회해야 하거나 인구집단별 시간적 추이분석 내지는 다른 국가의 자료와 비교에 난점을 가지고 있다. 따라서, 본 연구에서는 HBM 데이터를 체계적으로 데이터베이스(Database, DB)화하고 활용성을 증진하게 시킬 목적으로 지식 모델링을 실시하였다. 지식 모델링은 HBM 데이터의 생산되는 변수들을 그룹화하고 관계를 분석하여 2차원 구조의 개체 및 집합론에 기초한 방법론인 관계형 데이터 모델링 기법을 활용하여 실시하였다. 지식 모델은 조사대상자를 인구집단으로 중심으로 설문자료, 측정자료, 노출 평가자료 개체로 구성하고 그 안에 속성들을 정의하고, 개체간에 관계를 설정하는 방식으로 구성하였다. 또한, 도출된 지식 모델을 기반으로 식품의약품안전처에서 2006년-2018년까지 수행한 HBM의 원시데이터를 수집, 정제 및 정규화하여 통합 DB를 구축하였다. 이와 같이 통합 된 HBM-DB는 개별 자료원 내지는 특정 자료원들을 선택 하여 기간별 농도 수준에 대한 통계분석은 물론, 다양한 검 색조건을 통하여 데이터 추출을 할 수 있는 구조로 구축하였다. 본 HBM-DB는 관계형 DB모델로 구축되어 지속적인 대용량 DB 축적이나 HBM 데이터 해석을 위한 도구로써 효율적으로 수행할 수 있을 것으로 생각된다.
The distribution of wild boar (Sus scropa) in the Republic of Korea was forecasted using environmental factors. A species distribution model was applied with the standard normalized difference vegetation index (NDVI), enhanced vegetation index (EVI), solar zenith angle (SUNZ), daytime land surface temperature (dTemp), and nighttime land surface temperature (nTemp). Understanding wild boar distribution is important for controlling African swine fever (ASF) because the disease could be endemic in wild boar or spread from wild boars to domestic pigs. Among the five predictors, the NDVI was the most influencing factor for the wild boar distribution. The relative contributions of the predictors were 67.4 for NDVI, 16.9 for dTemp, 10.5 for SUNZ, 4.4 for EVI, and 0.8 for nTemp. The area size under the receiver-operating curve of the receiver-operating characteristics for the current model was 0.62, but the real wild boar observation data overlapped with the predicted high-density wild boar distribution area. The wild boar distribution density was relatively higher in Gangwon-do, Gyeongsangbuk-do, Gyeongsangnam-do, and Jeollanam-do. Given the ASF epidemics, contact between ASF-infected animals and ASF-susceptible animals in high-density wild boar distribution areas should be prevented by long-range fencing or active surveillance.
토목분야 생산성 향상을 위해 BIM을 적용하기 위한 노력이 계속되고 있으나, 선형과 지반에 대한 정보가 필수적인 터널 구조물의 정보모델링에 대한 연구는 미흡한 상황이다. AMT에서 생성된 선형의 이산화를 통해 포인트의 정보를 BAT로 전 달하여 곡선 선형을 반영한 터널 모델 생성 방안을 제시하였다. 철도 구조물과 선형에 대한 물리적 요소와 공간적 요소를 모두 고려할 수 있도록 IFC 데이터 스키마를 확장하였으며, 확장된 데이터 스키마를 참조하여 선형, 구조물, 지반 정보에 대한 의미정보를 PSET에 담아 IFC기반의 정보관리를 가능하게 하였다. 제안한 방법에 따라 생성한 정보모델을 통해 터널과 밀접한 암반 등급을 자동으로 도출함으로써 활용성을 검증하였다.
온난화와 같은 전지구적 변화는 기온과 강수 등 기상요소에 직접적으로 반영되어 곡물 수확량의 변화를 가져온다. 기후변화 시나리오에 기초한 선행연구들에서는 GCM (general circulation model)의 공간해상도 문제로 인하여 상세한 모의가 어려웠고, 시계열통계법을 활용한 연구들에서는 기후요소를 통합하여 수확량을 예측한 사례가 매우 드물었다. 이에 본 연구에서는 상세화된 기후재분석자료의 시계열모델링을 통하여 옥수수와 콩의 수확량 예측실험을 수행하였다. 미국 아이오와 주의 99개 카운티를 대상으로 1960년부터 2009년까지 50년간의 고해상도 기후재분석자료와 정부통계 수확량 DB를 구축하고, 시계열통계법인 VAR (vector autoregression)와 ARIMA (autoregressive integrated moving average)를 이용하여 다음해 수확량 예측실험을 10개 연도에 대해 수행하여 예측력을 평가하였다. VAR는 16-18%, ARIMA는 11-14% 의 오차율로 다음해의 수확량을 예측할 수 있는 것으로 집계되었으며, 옥수수의 경우 표토의 산성도, 심토의 점토와 나트륨 함유량 등의 토양특성 이 실제 수확량 및 예측정확도에 영향을 미치는 것으로 나타났다.
In this paper, we investigate the statistical correlation of the time series for temperature measured at the heat box in the automobile drying process. We show, in terms of the sample variance, that a significant non-linear correlation exists in the time series that consist of absolute temperature changes. To investigate further the non-linear correlation, we utilize the volatility, an important concept in the financial market, and induce volatility time series from absolute temperature changes. We analyze the time series of volatilities in terms of the de-trended fluctuation analysis (DFA), a method especially suitable for testing the long-range correlation of non-stationary data, from the correlation perspective. We uncover that the volatility exhibits a long-range correlation regardless of the window size. We also analyze the cross correlation between two (inlet and outlet) volatility time series to characterize any correlation between the two, and disclose the dependence of the correlation strength on the time lag. These results can contribute as important factors to the modeling of forecasting and management of the heat box’s temperature.
In this paper, we have considered the modeling and analyses of categorical data. We modeled binary data with categorical predictors, using logistic regression to develop a statistical method. We found that ANOVA-type analyses often performed unsatisfactory, even when using arcsine-square-root transformations. We concluded that such methods are not appropriate, especially in cases where the fractions were close to 0 or 1. The logistic transformation of fraction data could be a promising alternative, but it is not desirable in the statistical sense. The major purpose of this paper is to demonstrate that logistic regression with an ANOVA-model like parameterization aids our understanding and provides a somewhat different, but sound, statistical background. We examined a simple real-world example to show that we can efficiently test the significance of regression parameters, look for interactions, estimate confidence intervals, and calculate the difference between the mean values of the referent and experimental subgroups. This paper demonstrates that precise confidence interval estimates can be obtained using the proposed ANOVA-model like approach. The method discussed here can be extended to any type of fraction data analysis, particularly for experimental design.