최근 급부상한 생성형 AI는 현실적인 이미지, 텍스트, 음악 및 가상 환경 등을 만들어내는 능력 에 기반하여 엔터테인먼트, 디자인, 의료 및 교육 분야 등 다양한 산업 분야에 근본적인 변화를 가 져올 혁신 동력으로서 주목받고 있다. 오픈AI 등을 중심으로 한 글로벌 빅테크 기업들은 막강한 자 본력을 바탕으로 이 분야의 기술의 고도화와 함께 산업 생태계를 빠르게 구축하며 선도적인 지위를 굳히고 있어 한국의 생성형 AI 산업의 국가경쟁력 강화가 시급하다고 할 수 있다. 본 연구는 국가 경쟁력을 설명하는 Porter의 다이아몬드 모형에 기반해 한국의 생성형 AI 경쟁력에 영향을 미치는 다양한 요인들을 분석하여 한국의 생성형 AI 산업의 성장과 혁신을 육성하기 위한 기업의 전략적 방안과 정부의 정책적 방향성을 다음과 같이 제시하였다. 연구 결과 생성형 AI 관련 기업들의 투자 활동이 응용프로그램 개발을 우선시하고 있는 것으로 나타나 정부는 근본적인 기술 혁신 분야에 R&D 지원에 나서야 함을 알 수 있었다. 또한 기업 사용자들의 생성형 AI 수요가 제한적임에 따라 다양한 관련 교육 프로그램을 개발하고 맞춤 솔루션을 제공해야하며 개인 사용자들간의 디지털 격 차를 해소하는 정책적 노력이 필요하다는 것을 보여주었다. 생성형 AI 유관 산업 육성을 위해, 기 술경쟁력 강화와 인재 육성이 필요하고, 이와 더불어 생성형 AI 산업 에코시스템 내의 기업간 협력 을 촉진하기 위해 정부의 역할이 중요하다는 것을 확인할 수 있었다.
This research presented the procedural framework of developing and optimizing an artificial intelligence model for predicting the change of bread texture by different baking enhancers. Emphasis was placed on the impact of various baking enhancers on the Mixolab thermo-mechanical properties of wheat flour and consequent alterations in bread texture. The application of baking enhancers positively contributed to dough formation and stability, producing bread with a soft texture. However, a relatively low Pearson correlation coefficient was observed between a single Mixolab parameter and bread texture (r<0.59). To more accurately predict the texture of bread from the thermo-mechanical features of wheat flour with baking enhancers, five AI models (multiple linear regression, decision tree, stochastic gradient descent, random forest, and multilayer perceptron neural network) were applied, and their prediction performance was compared. The multilayer perceptron neural network model was further utilized to enhance the prediction of bread texture by mitigating overfitting risks. Finally, the hyperparameter tuning (activation function [Leaky ReLU], regularization [0.0001], and dropout [0.1]) led to enhanced model performance (R2 = 0.8109 and RMSE = 0.1096).
Occurrence of process environment changes, such as influent load variances and process condition changes, can reduce treatment efficiency, increasing effluent water quality. In order to prevent exceeding effluent standards, it is necessary to manage effluent water quality based on process operation data including influent and process condition before exceeding occur. Accordingly, the development of the effluent water quality prediction system and the application of technology to wastewater treatment processes are getting attention. Therefore, in this study, through the multi-channel measuring instruments in the bio-reactor and smart multi-item water quality sensors (location in bio-reactor influent/effluent) were installed in The Seonam water recycling center #2 treatment plant series 3, it was collected water quality data centering around COD, T-N. Using the collected data, the artificial intelligence-based effluent quality prediction model was developed, and relative errors were compared with effluent TMS measurement data. Through relative error comparison, the applicability of the artificial intelligence-based effluent water quality prediction model in wastewater treatment process was reviewed.
급격한 산업화와 도시화로 인해 해양 오염이 심각해지고 있으며, 이러한 해양 오염을 실효적으로 관리하기 위해 수질평가 지수(Water Quality Index, WQI)를 마련하여 활용하고 있다. 하지만 수질평가지수는 다소 복잡한 계산과정으로 인한 정보의 손실, 기준값 변동, 실무자의 계산오류, 통계적 오류 등의 불확실성(uncertainty)을 내포하고 있다. 이에 따라 국내ㆍ외에서 인공지능 기법을 활용하여 수질평가지수를 예측하기 위한 연구가 활발히 이루어지고 있다. 본 연구에서는 해양환경측정망 자료(2000 ~ 2020년)를 활용하여 우리나 라 전 해역 즉, 5개의 생태구에 대한 WQI를 추정할 수 있는 가장 적합한 인공지능기법을 도출하기 위해 총 6가지의 기법(RF, XGBoost, KNN, Ext, SVM, LR)을 실험하였다. 그 결과, Random Forest 기법이 다른 기법에 비해 가장 우수한 성능을 보였다. Random Forest 기법의 WQI 점수 예측값과 실제값의 잔차 분석 결과, 모든 생태구에서 시간적 및 공간적 예측 성능이 우수한 것으로 나타났다. 이를 통해 본 연구에서 개발한 Random Forest 기법은 높은 정확도를 바탕으로 우리나라 전해역에 대한 WQI를 예측 가능할 것으로 사료된다.
The prediction of algal bloom is an important field of study in algal bloom management, and chlorophyll-a concentration(Chl-a) is commonly used to represent the status of algal bloom. In, recent years advanced machine learning algorithms are increasingly used for the prediction of algal bloom. In this study, XGBoost(XGB), an ensemble machine learning algorithm, was used to develop a model to predict Chl-a in a reservoir. The daily observation of water quality data and climate data was used for the training and testing of the model. In the first step of the study, the input variables were clustered into two groups(low and high value groups) based on the observed value of water temperature(TEMP), total organic carbon concentration(TOC), total nitrogen concentration(TN) and total phosphorus concentration(TP). For each of the four water quality items, two XGB models were developed using only the data in each clustered group(Model 1). The results were compared to the prediction of an XGB model developed by using the entire data before clustering(Model 2). The model performance was evaluated using three indices including root mean squared error-observation standard deviation ratio(RSR). The model performance was improved using Model 1 for TEMP, TN, TP as the RSR of each model was 0.503, 0.477 and 0.493, respectively, while the RSR of Model 2 was 0.521. On the other hand, Model 2 shows better performance than Model 1 for TOC, where the RSR was 0.532. Explainable artificial intelligence(XAI) is an ongoing field of research in machine learning study. Shapley value analysis, a novel XAI algorithm, was also used for the quantitative interpretation of the XGB model performance developed in this study.
Ambient Air Vaporizer (AAV) is an essential facility in the process of generating natural gas that uses air in the atmosphere as a medium for heat exchange to vaporize liquid natural gas into gas-state gas. AAV is more economical and eco-friendly in that it uses less energy compared to the previously used Submerged vaporizer (SMV) and Open-rack vaporizer (ORV). However, AAV is not often applied to actual processes because it is heavily affected by external environments such as atmospheric temperature and humidity. With insufficient operational experience and facility operations that rely on the intuition of the operator, the actual operation of AAV is very inefficient. To address these challenges, this paper proposes an artificial intelligence-based model that can intelligent AAV operations based on operational big data. The proposed artificial intelligence model is used deep neural networks, and the superiority of the artificial intelligence model is verified through multiple regression analysis and comparison. In this paper, the proposed model simulates based on data collected from real-world processes and compared to existing data, showing a 48.8% decrease in power usage compared to previous data. The techniques proposed in this paper can be used to improve the energy efficiency of the current natural gas generation process, and can be applied to other processes in the future.
목적 : 인공지능의 기계학습 또는 심층학습을 이용한 연구가 다양한 분야에서 시도되고 있다. 본 연구는 공공 시력데이터를 자동화 수집하고, 수집한 데이터를 기계학습에 적용 및 예측하였다. 다양한 학습모델간 성능을 비교 함으로써, 시과학분야에서 적용 가능한 기계학습 최적화모델을 제시함에 있다.
방법 : 국민건강보험(NHISS) 및 통계포털(KOSIS)에 발표된 국민 시력분포 현황관련 자료를 특정 색인을 포함하 는 자료검색기법인 크롤링(crawling)을 사용하여 검색 및 수집을 자동화하였다. 2011년부터 2018년까지 보고된 모든 자료를 수집하였으며, 데이터 학습을 위해 Linear Regression, LASSO, Ridge, Elastic Net, Huber Regression, LASSO/LARS, Passive Aggressive Regressor 그리고 Pansacregressor 총 8개 모델을 사용하여 각각 데이터 학습 하였다.
결과 : 수집한 데이터를 기반으로 기계학습 모델을 통해 2018년을 예측하였다. 각 모델간 2018년도 실제-예측데 이터 차이를 MAE(Mean Absolute Error)와 RMSE(Root Mean Square Error) 점수로 각각 나타냈다. 학습모델 별 차이 중 MAE 평가결과 모델간 우/좌 Linear Regression(0.22/0.22), LASSO(0.83/0.81), RIDGE(0.31/0.31), Elastic Net(0.86/0.84), Huber Regression(0.14/0.07), LASSO/LARS(0.15/0.14), Passive Aggressive Regressor (0.29/0.18) 그리고 RANSA Regressor(0.22/0.22)를 보였다. RMSE에서 Linear Regression(0.40/0.40), LASSO (1.08/1.06), Ridge(0.54/0.54), Elastic Net(1.19/1.17), Huber Regression(0.20/0.20), LASSO/LARS(0.24/0.23), Passive Aggressive Regressor(0.21/0.58) 그리고 RANSA Regressor(0.40/0.40) 각각 나타냈다.
결론 : 본 연구는 자동화 자료검색 및 수집을 위한 크롤링 기법을 이용하여 데이터를 수집하였다. 이를 기반으 로 고전 선형모델을 기계학습에 적용할 수 있도록 하고, 데이터 학습을 위한 8개 학습모델들 간 성능을 비교하였다.
This study is aimed at the development of a runoff forecasting model to solve the uncertainties occurring in the process of rainfall-runoff modeling and improve the modeling accuracy of the stream runoff forecasting. The study area is the downstream of Naeseung-chun. Therefore, time-dependent data was obtained from the Wolpo water level gauging station. 11 and 2 out of total 13 flood events were selected for the training and testing set of model. The model performance was improved as the measuring time interval(Tm) was smaller than the sampling time interval(Ts). The Neuro-Fuzzy(NF) and TANK models can give more accurate runoff forecasts up to 4 hours ahead than the Feed Forward Multilayer Neural Network(FFNN) model in standard above the Determination coefficient(R2) 0.7.
평창강 수질자동측정망 실시간 자료를 이용하여 강우시와 무강우시로 구분하여 분석하였다. 강우시에 측정된 TOC 자료는 무강우시 측정된 자료에 비해 평균값, 최대값, 표준편차가 크게 나타났으며, 강우시의 DO 자료는 무강우시에 측정된 자료보다 낮아 유량이 수질변화에 영향을 미치는 것으로 분석되었다. 신경망 모형과 뉴로-퍼지 모형으로 수질예측 모형을 구성하고, 적용하였다. LMNN, MDNN, ANFIS 모형은 TOC 모의에서 DO 예측에서는 LMNN, MD