본 연구는 성격이 정신병리를 예측하는 가를 지도식 기계학습 방법론을 통해 확인해보고자 하였다. 이를 위해, 한국판 싱어루미스 심리 유형 검사(K-SLTDI) 제 2판과, KSCL-95 검사를 사용하여 전국의 총 521명의 성인을 대상으로 비대면 설문조사를 실시하였다. 예측 분석을 위하여 군집분석, 분류분석, 회귀기반 디코딩을 수행하였다. 그 결과 정신병리의 심 각도를 반영하는 4개의 군집을 확인하였다. 또한, 한국판 싱어루미스 심리 유형 검사로 정신병리 수준에 대한 가설 기반 및 데이터 기반 심각도가 반영된 군집을 예측할 수 있었으며, 이는 전체 KSCL-95 및 3개의 상위 범주, 그리고 타당도에 대해 모두 정확하게 분류되었다. 회귀기반 디코딩 결과는 SLTDI 유형검사는 전체 검사 데이터를 활용하였을 때 임상수준 을 유의미하게 예측할 수 있었으며, KSCL-95의 22가지 하위 범주 중 긍정왜곡, 우울, 불안, 강박, PTSD, 정신증, 스트레 스 취약성, 대인민감, 낮은 조절을 유의수준에서 개별적으로 예측하였다. 이러한 연구 결과는 성격 검사가 정신병리의 심 각도에 대한 선별 도구로 활용될 수 있고 예방 및 조기 개입 전략을 구현하는 데 활용될 수 있음을 시사한다.
Distribution and logistics industries contribute some of the biggest GDP(gross domestic product) in South Korea and the number of related companies are quarter of the total number of industries in the country. The number of retail tech companies are quickly increased due to the acceleration of the online and untact shopping trend. Furthermore, major distribution and logistics companies try to achieve integrated data management with the fulfillment process. In contrast, small and medium distribution companies still lack of the capacity and ability to develop digital innovation and smartization. Therefore, in this paper, a deep learning-based demand forecasting & recommendation model is proposed to improve business competitiveness. The proposed model is developed based on real sales transaction data to predict future demand for each product. The proposed model consists of six deep learning models, which are MLP(multi-layers perception), CNN(convolution neural network), RNN(recurrent neural network), LSTM(long short term memory), Conv1D-BiLSTM(convolution-long short term memory) for demand forecasting and collaborative filtering for the recommendation. Each model provides the best prediction result for each product and recommendation model can recommend best sales product among companies own sales list as well as competitor’s item list. The proposed demand forecasting model is expected to improve the competitiveness of the small and medium-sized distribution and logistics industry.
최근 소셜미디어 이용이 심리적 웰빙에 미치는 영향이 부각되고 있으나 어떤 요소가 소셜미디어 상에서의 관계 의 질을 예측할 수 있는지에 대한 연구는 상대적으로 드물다. 본 연구는 머신러닝 기법을 이용하여 COVID-19로 인한 자가격리 동안 인스타그램 활동과 외로움, 우울 등의 심리 상태가 소셜미디어 상에서의 관계의 질을 예측할 수 있는지 알아보고자 하였다. 성인 95명을 대상으로 자가격리 중과 자가격리 해제 후 시점에서 외로움, 인스타그 램 활동, 소셜미디어 상에서의 관계, 우울 등에 대해 자기보고식 설문에 응답하도록 하였다. 그 후, 다차원 척도법과 표상유사성분석, 분류분석을 각 시점에 대해 수행하였다. 다차원척도법 결과, 1차원에서 인스타그램 이용 시간과 우울이 다른 변인들과 구별되었으며, 2차원에서 외로움과 수동적 이용이 다른 변인들과 구별되었다. 그 후 소셜미 디어 상에서의 관계의 질의 고,저 집단에 대해 표상유사성분석을 실시한 결과, 소셜미디어 상에서의 관계의 질이 높은 집단은 낮은 집단보다 자가격리의 영향을 더 많이 받는 것으로 나타났다. 분류분석 결과에서도 소셜미디어 상에서의 관계의 질 예측 변인이 사회적 고립의 여부에 따라 달라지는 것으로 나타났다. 따라서 본 연구의 결과는 사람들이 사회적 고립 상황에 있지 않을 때 인스타그램 이용 변인과 심리적 변인이 소셜미디어 상에서의 관계를 더 잘 예측할 수 있음을 시사한다.
이 연구는 위성사진을 활용하여 건설지점의 기대풍속을 예측하기 위한 인공신경망 방법론을 제안한다. 제안된 방법은 기존 의 엔지니어의 판단을 대체하여, Auto-Encoder를 사용해 지형적 특성을 정량화하고, 이를 바탕으로 대상지점과 유사한 지역의 관측소 풍속 데이터를 선형 조합해 기대 풍속을 예측한다. 또한, 머신러닝과 인공신경망을 활용한 종단간 풍속 예측 모델을 제안하고, 성능을 비교 분석하였다. 그 결과 관측소의 풍속 데이터의 선형 조합보다는 종단간 모델을 구성하는 방법이 더 높은 정확도를 보였으며, 특히 Graph Neural Network (GNN)이 Multi-Layer Perceptron (MLP)에 비해 상당히 우수한 예측 성능을 나타내었다.
기후변화 영향으로 이상고수온, 태풍, 홍수, 가뭄 등 재난 및 안전 관리기술은 지속적으로 고도화를 요구받고 있으며, 특히 해 수면 온도는 한반도 주변에서 발생되는 여름철 적조 발생과 동해안 냉수대 출현, 소멸 등에 영향을 신속하게 분석할 수 있는 중요한 인자 이다. 따라서, 본 연구에서는 해수면 온도 자료를 해양 이상현상 및 연구에 적극 활용되기 위해 통계적 방법과 딥러닝 알고리즘을 적용하 여 예측성능을 평가하였다. 예측에 사용된 해수면 수온자료는 흑산도 조위관측소의 2018년부터 2022년까지 자료이며, 기존 통계적 ARIMA 방법과 Long Short-Term Memory(LSTM), Gated Recurrent Unit(GRU)을 사용하였고, LSTM의 성능을 더욱 향상할 수 있는 Sequence-to-Sequence(s2s) 구조에 Attention 기법을 추가한 Attention Long Short-Term Memory (LSTM)기법을 사용하여 예측 성능 평가를 진행하 였다. 평가 결과 Attention LSTM 모델이 타 모델과 비교하여 더 좋은 성능을 보였으며, Hyper parameter 튜닝을 통해 해수면 수온 성능을 개 선할 수 있었다.
Gate valves are hydraulic components used to shut-off the water flow in water distribution systems. Gate valves may fail owing to various aspects such as leakage through seats, wearing of packing, and corrosion. Because it is considerably challenging to detect valve malfunctioning until the operator identifies a significant fault, failure of the gate valve may lead to a severe accident event associated with water distribution systems. In this study, we proposed a methodology to diagnose the faults of gate valves. To measure the pressure difference across a gate valve, two pressure transducers were installed before and after the gate valve in a pilot-scaled water distribution system. The obtained time-series pressure difference data were analyzed using a machine learning algorithm to diagnose faults. The validation of whether the flow rate of the pipeline can be predicted based on the pressure difference between the upstream and downstream sides of the valve was also performed.
본 연구에서는 2 016년부터 2 02 0년까지 내륙 관측소 중 안개 최다발 지역인 안동을 대상으로 XGBoost-DART 머신러닝 알고리즘을 이용하여 1 시간 후 안개 유무를 예측하였다. 기상자료, 농업관측자료, 추가 파생자료와 각 자료 를 오버 샘플링한 확장자료, 총 6개의 데이터 세트를 사용하였다. 목측으로 획득한 기상현상번호와 시정계 관측으로 측 정된 시정거리 자료를 각각 안개 유[1]무[0]로 이진 범주화하였다. 총 12개의 머신러닝 모델링 실험을 설계하였고, 안개 가 사회와 지역사회에 미치는 유해성을 고려하여 모델의 성능은 재현율과 AUC-ROC를 중심으로 평가하였다. 전체적으 로, 오버샘플링한 기상자료와 기상현상번호 기반의 예측 목표를 조합한 실험이 최고 성능을 보였다. 이 연구 결과는 머 신러닝 알고리즘을 활용한 안개 예측에 있어서, 목측으로 획득한 기상현상번호의 중요성을 암시한다.
Predicting remaining useful life (RUL) becomes significant to implement prognostics and health management of industrial systems. The relevant studies have contributed to creating RUL prediction models and validating their acceptable performance; however, they are confined to drive reasonable preventive maintenance strategies derived from and connected with such predictive models. This paper proposes a data-driven preventive maintenance method that predicts RUL of industrial systems and determines the optimal replacement time intervals to lead to cost minimization in preventive maintenance. The proposed method comprises: (1) generating RUL prediction models through learning historical process data by using machine learning techniques including random forest and extreme gradient boosting, and (2) applying the system failure time derived from the RUL prediction models to the Weibull distribution-based minimum-repair block replacement model for finding the cost-optimal block replacement time. The paper includes a case study to demonstrate the feasibility of the proposed method using an open dataset, wherein sensor data are generated and recorded from turbofan engine systems.
Recently, not only traditional statistical techniques but also machine learning algorithms have been used to make more accurate bankruptcy predictions. But the insolvency rate of companies dealing with financial institutions is very low, resulting in a data imbalance problem. In particular, since data imbalance negatively affects the performance of artificial intelligence models, it is necessary to first perform the data imbalance process. In additional, as artificial intelligence algorithms are advanced for precise decision-making, regulatory pressure related to securing transparency of Artificial Intelligence models is gradually increasing, such as mandating the installation of explanation functions for Artificial Intelligence models. Therefore, this study aims to present guidelines for eXplainable Artificial Intelligence-based corporate bankruptcy prediction methodology applying SMOTE techniques and LIME algorithms to solve a data imbalance problem and model transparency problem in predicting corporate bankruptcy. The implications of this study are as follows. First, it was confirmed that SMOTE can effectively solve the data imbalance issue, a problem that can be easily overlooked in predicting corporate bankruptcy. Second, through the LIME algorithm, the basis for predicting bankruptcy of the machine learning model was visualized, and derive improvement priorities of financial variables that increase the possibility of bankruptcy of companies. Third, the scope of application of the algorithm in future research was expanded by confirming the possibility of using SMOTE and LIME through case application.
The fourth industrial revolution encourages manufacturing industry to pursue a new paradigm shift to meet customers' diverse demands by managing the production process efficiently. However, it is not easy to manage efficiently a variety of tasks of all the processes including materials management, production management, process control, sales management, and inventory management. Especially, to set up an efficient production schedule and maintain appropriate inventory is crucial for tailored response to customers' needs. This paper deals with the optimized inventory policy in a steel company that produces granule products under supply contracts of three targeted on-time delivery rates. For efficient inventory management, products are classified into three groups A, B and C, and three differentiated production cycles and safety factors are assumed for the targeted on-time delivery rates of the groups. To derive the optimized inventory policy, we experimented eight cases of combined safety stock and data analysis methods in terms of key performance metrics such as mean inventory level and sold-out rate. Through simulation experiments based on real data we find that the proposed optimized inventory policy reduces inventory level by about 9%, and increases surplus production capacity rate, which is usually used for the production of products in Group C, from 43.4% to 46.3%, compared with the existing inventory policy.
Recently, a study of prognosis and health management (PHM) was conducted to diagnose failure and predict the life of air craft engine parts using sensor data. PHM is a framework that provides individualized solutions for managing system health. This study predicted the remaining useful life (RUL) of aeroengine using degradation data collected by sensors provided by the IEEE 2008 PHM Conference Challenge. There are 218 engine sensor data that has initial wear and production deviations. It was difficult to determine the characteristics of the engine parts since the system and domain-specific information was not provided. Each engine has a different cycle, making it difficult to use time series models. Therefore, this analysis was performed using machine learning algorithms rather than statistical time series models. The machine learning algorithms used were a random forest, gradient boost tree analysis and XG boost. A sliding window was applied to develop RUL predictions. We compared model performance before and after applying the sliding window, and proposed a data preprocessing method to develop RUL predictions. The model was evaluated by R-square scores and root mean squares error (RMSE). It was shown that the XG boost model of the random split method using the sliding window preprocessing approach has the best predictive performance.
There have been a lot of studies in the past for the method of predicting the failure of a machine, and recently, a lot of researches and applications have been generated to diagnose the physical condition of the machine and the parts and to calculate the remaining life through various methods. Survival models are also used to predict plant failures based on past anomaly cycles. In particular, special machine that reflect the fluid flow and process characteristics of chemical plants are connected to hundreds or thousands of sensors, so there are not many factors that need to be considered, such as process and material data as well as application of derivative variables. In this paper, the data were preprocessed through time series anomaly detection based on unsupervised learning to predict the abnormalities of these special machine. Next, clustering results reflecting clustering-based data characteristics were applied to produce additional variables, and a learning data set was created based on the history of past facility abnormalities. Finally, the prediction methodology based on the supervised learning algorithm was applied, and the model update was confirmed to improve the accuracy of the prediction of facility failure. Through this, it is expected to improve the efficiency of facility operation by flexibly replacing the maintenance time and parts supply and demand by predicting abnormalities of machine and extracting key factors.
본 연구는 운항선의 운항 빅데이터를 활용하여 머신러닝 기법의 선박 마력 예측에 관한 것이다. 현재 신조선에는 ISO15016법을 이용하여 외부환경 요인에 대하여 수식을 통해 저항을 예측하나 관련 계산식이 복잡하고 요구하는 입력변수들이 많아 운항하는 실선 적 용에 많은 시간과 비용이 필요하다. 본 연구에서는 최근 예측, 인식 등에서 우수한 성능을 보이는 SVM(Support Vector Machine) 알고리즘을 이용하여 우수한 성능의 선박 출력 예측이 가능한 모델을 제안한다. 제안 예측 모델은 실선 운항 빅데이터만 확보된다면 ISO15016법 대비 우수한 성능의 예측이 가능한 장점이 있다. 본 연구에서는 178K 벌크캐리어의 운항 DATA를 활용하여 ISO15016 기법과 본 연구에서 제안 하는 SVM 알고리즘 기반의 마력해석법을 비교하여 ISO15016의 단점인 선박 모델 데이터 준비 부분을 줄이고 부정확한 마력 예측 성능을 개선하였다.
Recently, a number of researchers have produced research and reports in order to forecast more exactly air quality such as particulate matter and odor. However, such research mainly focuses on the atmospheric diffusion models that have been used for the air quality prediction in environmental engineering area. Even though it has various merits, it has some limitation in that it uses very limited spatial attributes such as geographical attributes. Thus, we propose the new approach to forecast an air quality using a deep learning based ensemble model combining temporal and spatial predictor. The temporal predictor employs the RNN LSTM and the spatial predictor is based on the geographically weighted regression model. The ensemble model also uses the RNN LSTM that combines two models with stacking structure. The ensemble model is capable of inferring the air quality of the areas without air quality monitoring station, and even forecasting future air quality. We installed the IoT sensors measuring PM2.5, PM10, H2S, NH3, VOC at the 8 stations in Jeonju in order to gather air quality data. The numerical results showed that our new model has very exact prediction capability with comparison to the real measured data. It implies that the spatial attributes should be considered to more exact air quality prediction.
동해 연안지역의 고해상도 파랑예측을 위하여 통계적 규모축소화 방안을 적용하여 고해상도 동해 연안 파랑예측시스템을 구축하였다. 예측시스템을 구축하기 위하여 기상청 현업에서 예측된 동해 및 남해 연안파랑예측모델과 전구 파랑예측모델의 예측결과를 이용하였다. 3일까지는 연안파랑예측모델들의 결과를 그대로 활용하였고 3일 이후 7일까지는 전구파랑예측모델의 예측결과를 통계적 규모축소화 방안(역거리 가중 내삽방법과 조건부합성방법)을 적용하여 예측하였다. 예측된 고해상도 연안예측시스템을 이용하여 예측된 파고의 2차원 공간분포는 연안예측모델의 초기장(분석장)과 자기상관관계를 이용하여 검증하였고 부이 등 해양관측소 자료를 이용하여 파고 및 풍속 예측을 검증되었다. 수치모델의 예측성능과 유사하게 초기시간에는 예측성능이 높게 나타났으나 시간이 지남에 따라 예측성능이 점진적으로 감소되었다. 전체 기간의 파고 예측결과를 파고 관측자료를 이용하여 검증하였을 때 역거리 가중 내삽과 조건부합성방법 적용에 따른 상관계수와 평균 제곱근 오차는 0.46과 0.34 m에서 0.6과 0.28 m로 개선되었다.
The paper presents the damage estimation of bridge structures in Daegu city based on the scenario-based earthquakes. Since the fragility curves for domestic bridge strucures are limited, the Hazus methodology is employed to derive the fragility curves and estimate the damage. A total of four earthuquake scenarios near Daegu city are assumed and structure damage is investigated for 81 bridge structures. The seismic fragility function and damage level of each bridge had adopted from the analytical method in HAZUS and then, the damage probability using seismic fragility function for each bridge was evaluated. It was concluded that the seismic damage to bridges was higher when the magnitude of the earthquake was large or nearer to the epicenter.