작물 증발산량은 잠재 증발산량에서 작물계수를 곱하여 작 물의 요수량을 산출할 수 있어 수자원 관리에 널리 사용되는 방법이다. 특히 유엔식량농업기구(FAO)가 관개 및 배수 논 문 NO.56에서 발표한 Penman-Monteith 방정식(FAO 56-PM) 은 잠재 증발산량을 추정하는 표준방법으로, 평균온도, 최대 온도, 최소온도, 상대습도, 풍속 및 일사량의 6가지 기상 데이 터가 필요하다. 그러나 농경지 인근에 설치된 기상센서는 설 치 및 유지보수 비용이 높아 결측, 이상치와 같은 데이터 신뢰 성 문제를 야기하여 정확한 증발산량 계산을 복잡하게 만든 다. 본 연구에서는 인근 기상청의 데이터를 사용하여 필요한 6가지 기상 변수를 예측함으로써 기상 센서 없이 작물 증발산량을 추정할 수 있는지 조사하였다. 우리는 기상청의 API를 통해 수집할 수 있는 22개의 기상 변수를 입력 데이터로 활용 했다. 9개의 회귀 모델을 학습한 후 성능에 따라 상위 3개를 선 택하고 하이퍼파라미터 튜닝을 적용하여 최적의 모델을 식별 했다. 가장 좋은 성능을 보인 모델은 Extreme Gradient Boosting Regression(XGBR)이었으며 평균온도, 최대온도, 최소온도, 상대습도, 풍속 및 일사량에서 결정계수(R2)가 각 0.98, 0.99, 0.99, 0.91, 0.72, 0.86로 높은 결과를 얻을 수 있었다. 이러한 결과는 XGBR 모델이 작물 기상 데이터를 사용하여 작물 증 발산 모델에 필요한 입력 값을 정확하게 예측할 수 있어 값비 싼 기상 센서가 필요 없음을 시사한다. 이 접근 방식은 센서 설 치 및 유지보수가 어려운 지역에서 특히 유용할 수 있으며, 직 접적인 센서 데이터 없이도 표준 증발산 모델의 사용을 가능 하게 한다.
This study analyzes the impact of ESG (Environmental, Social, and Governance) activities on Corporate Financial Performance(CFP) using machine learning techniques. To address the linear limitations of traditional multiple regression analysis, the study employs AutoML (Automated Machine Learning) to capture the nonlinear relationships between ESG activities and CFP. The dataset consists of 635 companies listed on KOSPI and KOSDAQ from 2013 to 2021, with Tobin's Q used as the dependent variable representing CFP. The results show that machine learning models outperformed traditional regression models in predicting firm value. In particular, the Extreme Gradient Boosting (XGBoost) model exhibited the best predictive performance. Among ESG activities, the Social (S) indicator had a positive effect on CFP, suggesting that corporate social responsibility enhances corporate reputation and trust, leading to long-term positive outcomes. In contrast, the Environmental (E) and Governance (G) indicators had negative effects in the short term, likely due to factors such as the initial costs associated with environmental investments or governance improvements. Using the SHAP (Shapley Additive exPlanations) technique to evaluate the importance of each variable, it was found that Return on Assets (ROA), firm size (SIZE), and foreign ownership (FOR) were key factors influencing CFP. ROA and foreign ownership had positive effects on firm value, while major shareholder ownership (MASR) showed a negative impact. This study differentiates itself from previous research by analyzing the nonlinear effects of ESG activities on CFP and presents a more accurate and interpretable prediction model by incorporating machine learning and XAI (Explainable AI) techniques.
본 연구는 도로 프로젝트의 설계 단계에서 ESG(환경, 사회, 지배구조) 요소를 효과적으로 적용할 수 있는 구체적인 지표를 개발하고 제안하는 것을 목적으로 한다. 최근 글로벌 경영 환경에서 ESG의 중요성이 증대됨에 따라, 대규모 인프라 사업인 도로 프로젝트에서도 ESG 요소의 체계적인 적용이 요구되고 있다. 본 연구에서는 GRI, SASB, CDP 등 국제적 ESG 표준을 분 석하고, 도로 프로젝트의 설계 단계를 세부적으로 검토하여 각 단계에 적합한 ESG 지표를 개발하였다. 연구 결과, 프로젝트 목표 설정부터 지속가능성 고려까지 각 설계 단계별로 적용 가능한 구체적인 ESG 지표를 제시하였다. 이는 에너지 효율, 온 실가스 감축, 생태계 보호, 지역사회 참여, 자원 효율성, 안전 기준 등을 포함한다. 본 연구에서 제안된 지표는 도로 프로젝트 의 환경적 영향을 최소화하고, 사회적 가치를 증진하며, 투명하고 책임 있는 프로젝트 운영을 가능케 하는 실질적인 가이드라 인을 제공한다. 이를 통해 도로 프로젝트의 지속가능성을 제고하고 사회적 가치 창출에 기여할 수 있을 것으로 기대된다.
This study develops a model to determine the input rate of the chemical for coagulation and flocculation process (i.e. coagulant) at industrial water treatment plant, based on real-world data. To detect outliers among the collected data, a two-phase algorithm with standardization transformation and Density-Based Spatial Clustering of Applications with Noise (DBSCAN) is applied. In addition, both of the missing data and outliers are revised with linear interpolation. To determine the coagulant rate, various kinds of machine learning models are tested as well as linear regression. Among them, the random forest model with min-max scaled data provides the best performance, whose MSE, MAPE, R2 and CVRMSE are 1.136, 0.111, 0.912, and 18.704, respectively. This study demonstrates the practical applicability of machine learning based chemical input decision model, which can lead to a smart management and response systems for clean and safe water treatment plant.
실제세계에서 데이터 수집의 비용과 한계를 고려할 때, 시뮬레이션 생성 환경은 데이터 생성 과 다양한 시도에 있어 효율적인 대안이다. 이 연구에서는 Unity ML Agent를 로그라이크 장 르에 적합한 강화학습 모델로 구현하였다. 간단한 게임에Agent를 이식하고, 이 Agent가 적을 인식하고 대응하는 과정을 코드로 작성하였다. 초기 모델은 조준사격의 한계를 보였으나 RayPerceptionSensor-Component2D를 통해 Agent의 센서 정보를 직접 제공함으로써, Agent가 적을 감지하고 조준 사격을 하는 능력을 관찰할 수 있었다. 결과적으로, 개선된 모델 은 평균3.81배 향상된 성능을 보여주었으며, 이는 Unity ML Agent가 로그라이크 장르에서 강화학습을 통한 데이터 수집이 가능함을 입증한다.
The government is implementing a policy to expand eco-friendly energy as a power source. However, the output of new and renewable energy is not constant. It is difficult to stably adjust the power supply to the power demand in the power system. Therefore, the government predicts day-ahead the amount of renewable energy generation to cope with the output volatility caused by the expansion of renewable energy. It is a system that pays a settlement amount if it transitions within a certain error rate the next day. In this paper, Machine Learning was used to study the prediction of power generation within the error rate.
내화 구조물에서는 환기 계수, 재료 탄성 계수, 항복 강도, 열팽창 계수, 외력 및 화재 위치에서 불확실성이 관찰된다. 환기 불확실성 은 화재 온도에 영향을 미치고, 이는 다시 구조물 온도에 영향을 미친다. 이러한 온도는 재료 특성과 함께 불확실한 구조적 응답으로 이어지고 있다. 화재 시 구조적 비선형 거동으로 인해 몬테카를로 시뮬레이션을 사용하여 화재 취약성을 계산하는데, 이는 시간이 많 이 소요된다. 따라서 머신러닝 알고리즘을 활용해 화재 취약성 분석을 예측함으로써 효율성을 높이고 정확성을 확보하려는 연구가 진행되고 있다. 이 연구에서는 화재 크기, 위치, 구조 재료 특성의 불확실성을 고려하여 철골 모멘트 골조 건물의 화재 취약성을 예측 했다. 화재 시 비선형 구조 거동 결과를 기반으로 한 취약성 곡선은 로그 정규 분포를 따른다. 마지막으로 제안한 방법이 화재 취약성 을 정확하고 효율적으로 예측할 수 있음을 보여주었다.
PURPOSES : Construction cost estimates are important information for business feasibility analysis in the planning stage of road construction projects. The quality of current construction cost estimates are highly dependent on the expert's personal experience and skills to estimate the arithmetic average construction cost based on past cases, which makes construction cost estimates subjective and unreliable. An objective approach in construction cost estimation shall be developed with the use of machine learning. In this study, past cases of road projects were analyzed and a machine learning model was developed to produce a more accurate and time-efficient construction cost estimate in teh planning stage. METHODS : After conducting case analysis of 100 road construction, a database was constructed including the road construction's details, drawings, and completion reports. To improve the construction cost estimation, Mallow's Cp. BIC, Adjusted R methodology was applied to find the optimal variables. Consequently, a plannigs-stage road construction cost estimation model was developed by applying multiple regression analysis, regression tree, case-based inference model, and artificial neural network (ANN, DNN). RESULTS : The construction cost estimation model showed excellent prediction performance despite an insufficient amount of learning data. Ten cases were randomly selected from the data base and each developed machine learning model was applied to the selected cases to calculate for the error rate, which should be less than 30% to be considered as acceptable according to American Estimating Association. As a result of the analysis, the error rates of all developed machine learning models were found to be acceptable with values rangine from 17.3% to 26.0%. Among the developed models, the ANN model yielded the least error rate. CONCLUSIONS : The results of this study can help raise awareness of the importance of building a systematic database in the construction industry, which is disadvantageous in machine learning and artificial intelligence development. In addition, it is believed that it can provide basic data for research to determine the feasibility of construction projects that require a large budget, such as road projects.
인공지능은 4차 산업혁명의 프레임이 소개된 이후 점차 보편적인 기술로 자리를 잡아가고 있으며, 인공지능 관련 특허 출원도 크게 증가하고 있다. 최근에는 특허 생태계가 출원 건수 위주의 양적 경쟁에서 고품질의 특허 확보라는 질적 경쟁으로 패러다임이 변화되면서, 저품질 특허로 인한 비용 손실에 관심이 높아지고 있다. 이러한 배경으로 본 연구에서는 머신러닝과 Doc2Vec 알고리즘을 활용하여 특허 품질을 예측하는 방법을 제안하고자 한다. 본 연구를 위해 WIPO에서 정의한 CPC 코드를 활용하여 미국 특허청(USPTO)에 등록된 인공지능 관련 특허 데이터를 추출하였고, 이를 통해 정형 데이터 기반 19개 변수, 비정형 데이터 기반 7개 변수를 개발하였다. 특히, 새롭게 제안하는 Doc2Vec 알고리즘을 이용한 제목과 초록 텍스트 유사도 변수는 고품질 특허를 예측하는데 영향을 미칠 것으로 판단된다. 이에 유사도 변수의 효과를 확인하기 위해 유사도 변수를 포함한 앙상블 기반 머신러닝 모델과 포함하지 않은 모델을 개발하여 비교하였다. 실험 결과, 유사도 변수를 포함한 모델이 AUC 0.013, f1-score 0.025가 높게 나타나 더 우수한 성능을 보였다. 이는 유사도 변수가 고품질 특허 예측에 기여한다는 것을 시사한다. 또한, SHAP을 이용하여 블랙박스 형태의 머신러닝 변수 영향도를 설명하였다. 본 연구를 통해 핵심 기술 분야인 인공지능과 같은 영역에서 특허의 품질을 예측하고, 고품질 특허 개발을 장려함으로써 사회적 가치를 실현하는 데 기여할 수 있을 것으로 기대한다.
Fouling is an inevitable problem in membrane water treatment plant. It can be measured by trans-membrane pressure (TMP) in the constant flux operation, and chemical cleaning is carried out when TMP reaches a critical value. An early fouilng alarm is defined as warning the critical TMP value appearance in advance. The alarming method was developed using one of machine learning algorithms, decision tree, and applied to a ceramic microfiltration (MF) pilot plant. First, the decision tree model that classifies the normal/abnormal state of the filtration cycle of the ceramic MF pilot plant was developed and it was then used to make the early fouling alarm method. The accuracy of the classification model was up to 96.2% and the time for the early warning was when abnormal cycles occurred three times in a row. The early fouling alram can expect reaching a limit TMP in advance (e.g., 15-174 hours). By adopting TMP increasing rate and backwash efficiency as machine learning variables, the model accuracy and the reliability of the early fouling alarm method were increased, respectively.
Nowadays, artificial intelligence model approaches such as machine and deep learning have been widely used to predict variations of water quality in various freshwater bodies. In particular, many researchers have tried to predict the occurrence of cyanobacterial blooms in inland water, which pose a threat to human health and aquatic ecosystems. Therefore, the objective of this study were to: 1) review studies on the application of machine learning models for predicting the occurrence of cyanobacterial blooms and its metabolites and 2) prospect for future study on the prediction of cyanobacteria by machine learning models including deep learning. In this study, a systematic literature search and review were conducted using SCOPUS, which is Elsevier’s abstract and citation database. The key results showed that deep learning models were usually used to predict cyanobacterial cells, while machine learning models focused on predicting cyanobacterial metabolites such as concentrations of microcystin, geosmin, and 2-methylisoborneol (2-MIB) in reservoirs. There was a distinct difference in the use of input variables to predict cyanobacterial cells and metabolites. The application of deep learning models through the construction of big data may be encouraged to build accurate models to predict cyanobacterial metabolites.
목적 : 4차 산업혁명이 진행됨에 따라 타각적 굴절검사값, 수차 및 동공크기 등을 이용하여 최적의 안경처방값 을 도출해주는 머신러닝(machine learning)을 개발하고자 하였다. 방법: 시력에 영향을 줄 수 있는 안질환 및 전신질환이 없고 안구 수술 이력이 없는 근시안(1,000안)을 대상으로 진행하였다. I-Profilerplus(Zeiss, Berlin, Germany)를 사용하여 타각적 굴절이상도(objective-refraction) 및 안구수차(ocular wavefront-aberration), 동공 크기를 측정하였고, 자각적 굴절이상도(subjective-refraction)는 Visuphor500(Zeiss, Berlin, Germany)를 사용하여 구면 굴절력(S, Diopter), 원주 굴절력(C, Diopter), 난시 축(Ax, °)을 측정하였다. 측정 후, 파이썬(Python, version 3.10)을 이용하여 머신러닝 모델 생성 및 예측 성능을 확인하였다. 결과: 자각적 굴절이상도에서 구면 굴절력에 영향을 미치는 요인은 타각적 구면 굴절력, defocus aberration, spherical aberration, trefoil aberration 순으로 높았고, 원주 굴절력에 영향을 미치는 요인은 타각적 원주 굴 절력, defocus aberration, coma aberration, trefoil aberration 순으로 높았으며, 난시 축은 타각적 난시축만 영향을 미치는 것으로 나타났다. 구면 굴절력, 원주 굴절력, 난시 축의 자각적 굴절이상도와 머신러닝 예상값은 차이가 없는 것으로 나타났다(p=0.976, 0.948, and 0.349, respectively). 결론 : 자각적 굴절이상도를 예측하는 머신러닝 모델을 생성하였고, 해당 모델의 예측된 값과 자각적 굴절이상 도와 유의한 차이가 없는 것을 통해 예측 정확도를 확인하였으며 앞으로 개인 맞춤형 처방을 위한 정확한 안경처 방값을 도출하는데 기초자료가 될 수 있을 것으로 생각된다.