This study integrates TabTransformer and CTGAN for predicting job satisfaction among South Korean college graduates. TabTransformer handles complex tabular data relationships with self-attention, while CTGAN generates high-quality synthetic samples. The combined approach achieves an accuracy of 0.85, precision of 0.83, recall of 0.82, F1-score of 0.82, and an AUC of 0.88. Cross-validation confirms the model's robustness and generalizability with a mean accuracy of 0.85 and a standard deviation of 0.008. The integration of TabTransformer and CTGAN enhances predictive accuracy and model generalizability, providing valuable insights for employment policy and research.
In the military, ammunition and explosives stored and managed can cause serious damage if mishandled, thus securing safety through the utilization of ammunition reliability data is necessary. In this study, exploratory data analysis of ammunition inspection records data is conducted to extract reliability information of stored ammunition and to predict the ammunition condition code, which represents the lifespan information of the ammunition. This study consists of three stages: ammunition inspection record data collection and preprocessing, exploratory data analysis, and classification of ammunition condition codes. For the classification of ammunition condition codes, five models based on boosting algorithms are employed (AdaBoost, GBM, XGBoost, LightGBM, CatBoost). The most superior model is selected based on the performance metrics of the model, including Accuracy, Precision, Recall, and F1-score. The ammunition in this study was primarily produced from the 1980s to the 1990s, with a trend of increased inspection volume in the early stages of production and around 30 years after production. Pre-issue inspections (PII) were predominantly conducted, and there was a tendency for the grade of ammunition condition codes to decrease as the storage period increased. The classification of ammunition condition codes showed that the CatBoost model exhibited the most superior performance, with an Accuracy of 93% and an F1-score of 93%. This study emphasizes the safety and reliability of ammunition and proposes a model for classifying ammunition condition codes by analyzing ammunition inspection record data. This model can serve as a tool to assist ammunition inspectors and is expected to enhance not only the safety of ammunition but also the efficiency of ammunition storage management.
In recent automated manufacturing systems, compressed air-based pneumatic cylinders have been widely used for basic perpetration including picking up and moving a target object. They are relatively categorized as small machines, but many linear or rotary cylinders play an important role in discrete manufacturing systems. Therefore, sudden operation stop or interruption due to a fault occurrence in pneumatic cylinders leads to a decrease in repair costs and production and even threatens the safety of workers. In this regard, this study proposed a fault detection technique by developing a time-variant deep learning model from multivariate sensor data analysis for estimating a current health state as four levels. In addition, it aims to establish a real-time fault detection system that allows workers to immediately identify and manage the cylinder’s status in either an actual shop floor or a remote management situation. To validate and verify the performance of the proposed system, we collected multivariate sensor signals from a rotary cylinder and it was successful in detecting the health state of the pneumatic cylinder with four severity levels. Furthermore, the optimal sensor location and signal type were analyzed through statistical inferences.
빠르게 발전하는 이미지 인식 기술에도 불구하고 표 형식의 문서와 수기로 작성된 문서를 완벽하게 디지털화하기에는 아직 어려움이 따른다. 본 연구는 표 형식의 수기 문서인 선박 항해일지를 작성하는 데에 사용되는 규칙을 이용하여 보정 작업을 수행함으로 써 OCR 결과물의 정확도를 향상시키고자 한다. 이를 통해 OCR 프로그램을 통하여 추출된 항해일지 데이터의 정확성과 신뢰성을 높일 것 으로 기대된다. 본 연구는 목포해양대학교 실습선 새누리호의 2023년에 항해한 57일간의 항해일지 데이터를 대상으로 OCR 프로그램 인 식 후 발생한 오류를 보정하여 그 정확도를 개선하고자 하였다. 이 모델은 항해일지 기재 시 고려되는 몇 가지 규칙을 활용하여 오류를 식별한 후, 식별된 오류를 보정하는 방식으로 구성하였다. 모델을 활용하여 오류를 보정 후, 그 효과를 평가하고자 보정 전과 후의 데이터 를 항차별로 구분한 후, 같은 항차의 같은 변수끼리 비교하였다. 본 모델을 활용하여 실제 셀 오류율은 약 11.8% 중 약 10.6%의 오류를 식 별하였고, 123개의 오류 중 56개를 개선하였다. 본 연구는 항해일지 중 항해정보를 기입하는 Dist.Run부터 Stand Course까지의 정보만을 대 상으로 수행하였다는 한계점이 있으므로, 추후 항해정보 뿐만 아니라 기상정보 등 항해일지의 더 많은 정보를 보정하기 위한 연구를 진 행할 예정이다.
장대교량은 낮은 고유진동수와 감쇠비를 가지는 초유연구조물로 진동사용성 문제에 취약하다. 하지만 현재 국내 설계지침에서는 풍속이나 진폭에 대한 임계값을 기반으로 유해진동 발생 여부를 평가하고 있다. 본 연구에서는 장대교량에서 발생하는 유해진동을 보다 정교하게 식별하기 위하여 딥러닝 기반 신호분할 모델을 활용한 데이터 포인트 단위의 와류진동 식별 방법론을 제안한다. 특별 히 포락선을 가지는 사인파를 활용하여 와류진동에 해당하는 데이터를 합성함으로써 모델 구축에 필수적인 와류진동 데이터 획득 및 라벨링 과정을 대체하였다. 이후 푸리에 싱크로스퀴즈드 변환를 적용하여 시간-주파수 특징을 추출하여 신경망의 인풋 데이터로 사 용하였다. 합성데이터만을 이용하여 양방향 장단기 기억신경망(Bidirectional Long-Short-Term-Memory) 모델을 훈련하였고 이를 라 벨 정보를 포함한 실제 사장교의 계측데이터를 이용하여 학습한 모델과 비교하여 모델의 실시간 와류진동 식별 성능을 검증하였다.
증산은 적정 관수 관리에 중요한 역할을 하므로 수분 스트레스에 취약한 토마토와 같은 작물의 관개 수요에 대한 지식이 필요하다. 관수량을 결정하는 한 가지 방법은 증산량을 측정하는 것인데, 이는 환경이나 생육 수준의 영향을 받는다. 본 연구는 분단위 데이터를 통해 수학적 모델과 딥러닝 모델을 활용하여 토마토의 증발량을 추정하 고 적합한 모델을 찾는 것을 목표로 한다. 라이시미터 데이터는 1분 간격으로 배지무게 변화를 측정함으로써 증산 량을 직접 측정했다. 피어슨 상관관계는 관찰된 환경 변수가 작물 증산과 유의미한 상관관계가 있음을 보여주었다. 온실온도와 태양복사는 증산량과 양의 상관관계를 보인 반면, 상대습도는 음의 상관관계를 보였다. 다중 선형 회귀 (MLR), 다항 회귀 모델, 인공 신경망(ANN), Long short-term memory(LSTM), Gated Recurrent Unit(GRU) 모델을 구 축하고 정확도를 비교했다. 모든 모델은 테스트 데이터 세트에서 0.770-0.948 범위의 R2 값과 0.495mm/min- 1.038mm/min의 RMSE로 증산을 잠재적으로 추정하였다. 딥러닝 모델은 수학적 모델보다 성능이 뛰어났다. GRU 는 0.948의 R2 및 0.495mm/min의 RMSE로 테스트 데이터에서 최고의 성능을 보여주었다. LSTM과 ANN은 R2 값이 각각 0.946과 0.944, RMSE가 각각 0.504m/min과 0.511로 그 뒤를 이었다. GRU 모델은 단기 예측에서 우수한 성능 을 보였고 LSTM은 장기 예측에서 우수한 성능을 보였지만 대규모 데이터 셋을 사용한 추가 검증이 필요하다. FAO56 Penman-Monteith(PM) 방정식과 비교하여 PM은 MLR 및 다항식 모델 2차 및 3차보다 RMSE가 0.598mm/min으로 낮지만 분단위 증산의 변동성을 포착하는 데 있어 모든 모델 중에서 가장 성능이 낮다. 따라서 본 연구 결과는 온실 내 토마토 증산을 단기적으로 추정하기 위해 GRU 및 LSTM 모델을 권장한다.
기후변화 영향으로 이상고수온, 태풍, 홍수, 가뭄 등 재난 및 안전 관리기술은 지속적으로 고도화를 요구받고 있으며, 특히 해 수면 온도는 한반도 주변에서 발생되는 여름철 적조 발생과 동해안 냉수대 출현, 소멸 등에 영향을 신속하게 분석할 수 있는 중요한 인자 이다. 따라서, 본 연구에서는 해수면 온도 자료를 해양 이상현상 및 연구에 적극 활용되기 위해 통계적 방법과 딥러닝 알고리즘을 적용하 여 예측성능을 평가하였다. 예측에 사용된 해수면 수온자료는 흑산도 조위관측소의 2018년부터 2022년까지 자료이며, 기존 통계적 ARIMA 방법과 Long Short-Term Memory(LSTM), Gated Recurrent Unit(GRU)을 사용하였고, LSTM의 성능을 더욱 향상할 수 있는 Sequence-to-Sequence(s2s) 구조에 Attention 기법을 추가한 Attention Long Short-Term Memory (LSTM)기법을 사용하여 예측 성능 평가를 진행하 였다. 평가 결과 Attention LSTM 모델이 타 모델과 비교하여 더 좋은 성능을 보였으며, Hyper parameter 튜닝을 통해 해수면 수온 성능을 개 선할 수 있었다.
The Fourth Industrial Revolution and sensor technology have led to increased utilization of sensor data. In our modern society, data complexity is rising, and the extraction of valuable information has become crucial with the rapid changes in information technology (IT). Recurrent neural networks (RNN) and long short-term memory (LSTM) models have shown remarkable performance in natural language processing (NLP) and time series prediction. Consequently, there is a strong expectation that models excelling in NLP will also excel in time series prediction. However, current research on Transformer models for time series prediction remains limited. Traditional RNN and LSTM models have demonstrated superior performance compared to Transformers in big data analysis. Nevertheless, with continuous advancements in Transformer models, such as GPT-2 (Generative Pre-trained Transformer 2) and ProphetNet, they have gained attention in the field of time series prediction. This study aims to evaluate the classification performance and interval prediction of remaining useful life (RUL) using an advanced Transformer model. The performance of each model will be utilized to establish a health index (HI) for cutting blades, enabling real-time monitoring of machine health. The results are expected to provide valuable insights for machine monitoring, evaluation, and management, confirming the effectiveness of advanced Transformer models in time series analysis when applied in industrial settings.
현재의 해양산업의 기술은 스마트 선박 및 자율운항선박 등의 개발과 같은 자율화 및 지능화와 환경규제의 강화에 맞추어 선 박의 운항 효율성을 개선하는 친환경 선박을 위한 기술이 함께 개발되고 있다. 이러한 흐름에 맞추어, 세계각국에서는 선박의 안전운항을 보장하는 선에서 선박운항효율을 극대화하기 위해 다양한 방식으로 노력하고 있다. 본 연구에서는, 현존하는 선박운항효율 개선 기술이 운항 당시의 기상환경, 선박조종 등의 선박운항상태를 실시간으로 반영하지 못하는 문제를 개선하기 위해, 선박에서 수집한 선박운항데 이터를 활용하여 실시간 선박운항효율 분석모델을 개발하고자 한다. 본 연구의 실시간 선박운항효율 분석모델은 연료소모를 기준으로 판 단한 선박운항효율과 당시의 선박운항상태를 감안하여 판단한 선박운항효율을 비교하여, 식별된 선박운항효율의 타당성을 확인할 수 있 는 모델이다. 분석의 주요 내용은 대상선박의 선정과 선박운항데이터의 수집, 선박운항효율 특성과 선박운항상태 특성의 구분, 그리고 이 를 활용한 분류모델의 개발을 포함한다. 연구의 결과는 기존의 선박운항효율과 항해 당시 선박운항상태를 감안한 운항효율을 제시하여 선박 운항자의 의사결정을 지원하여 운항효율을 개선하고자 한다.
Welding is one of representative manufacturing processes in the industrial field. Cryogenic storage containers are also manufactured through welding, and conversion to laser welding is issue in the field due to many advantages. Since welding causes thermal-elastic deformation, design considering distortion is required. Prediction of distortion through FEM is essential, but laser welding has difficulties in the field because there is no representative heat source model. The author presented the model that can cover various models using a multi-layer heat source model in previous studies. However the previous study has a limitation which is a welding heat source model must be derived after performing bead on plate welding. Thus this study was attempted to estimate the welding heat source parameters by comparing the shape of bead under various conditions. First, the difference between penetration shape and welding heat source parameters according to welding power was analyzed. The radius of the welding heat source increased according to the welding power, and the depth of the welding heat source also increased. The correlation between the penetration shape and the welding heat source parameter appears at a similar rate, however the follow-up research is necessary with more model data.
Ball stud parts are manufactured by a cold forging process, and fastening with other parts is secured through a head part cutting process. In order to improve process quality, stabilization of the forging quality of the head is given priority. To this end, in this study, a predictive model was developed for the purpose of improving forging quality. The prediction accuracy of the model based on 450 data sets acquired from the manufacturing site was low. As a result of gradually multiplying the data set based on FE simulation, it was expected that it would be possible to develop a predictive model with an accuracy of about 95%. It is essential to build automated labeling of forging load and dimensional data at manufacturing sites, and to apply a refinement algorithm for filtering data sets. Finally, in order to optimize the ball stud manufacturing process, it is necessary to develop a quality prediction model linked to the forging and cutting processes.
PURPOSES : In this study, model-agnostic methods are applied for interpreting machine learning models, such as the feature global effect, the importance of a feature, the joint effects of features, and explaining individual predictions.
METHODS : Model-agnostic global interpretation techniques, such as partial dependence plot (PDP), accumulated local effect (ALE), feature interaction (H-statistics), and permutation feature importance, were applied to describe the average behavior of a machine learning model. Moreover, local model-agnostic interpretation methods, individual conditional expectation curves (ICE), local surrogate models (LIME), and Shapley values were used to explain individual predictions.
RESULTS : As global interpretations, PDP and ALE-Plot demonstrated the relationship between a feature and the prediction of a machine learning model, where the feature interaction estimated whether one feature depended on the other feature, and the permutation feature importance measured the importance of a feature. For local interpretations, ICE exhibited how changing a feature changes the interested instance’s prediction, LIME explained the relationship between a feature and the instance’s prediction by replacing the machine model with a locally interpretable model, and Shapley values presented how to fairly contribute to the instance’s prediction among the features.
CONCLUSIONS : Model-agnostic methods contribute to understanding the general relationship between features and a prediction or debut a model from the global and/or local perspective, securing the reliability of the learning model.
머신러닝 기법의 발달과 함께 기계에서 발생하는 다양한 종류(진동, 온도, 유량 등)의 데이터를 활용하여 기계의 상태를 진단하고 이상 탐지 및 비정상 분류 연구도 활발히 진행되고 있다. 특히 진동 데이터를 활용한 회전 기계의 상태 진단은 전통적인 기계 상태 모니터링 분야로 오랜 기간 동안 연구가 진행되었고, 연구 방법 또한 매우 다양하다. 본 연구에서는 가정용 에어컨에 사용되는 로터리 압축기에 가속도계를 직접 설치하여 진동 데이터를 수집하는 실험을 진행하였다. 데이터 부족 문제를 해결하기 위해 데이터 분할을 수행하였으며, 시간 영역에서의 진동 데이터로부터 통계적, 물리적 특징들을 추출한 후, Chi-square 검증을 통해 고장 분류 모델의 주요 특징을 추출하였다. SVM(Support Vector Machine) 모델은 압축기의 정상 혹은 이상 유무를 분류하기 위해 개발되었으며, 파라미터 최적화를 통해 분류 정확도를 개선하였다.
PURPOSES : The purpose of this study is to contribute to the utilization of standards while considering the possible upgrade of a local system as a subject of the application. Therefore, this study aims to explore the possible application of LandInfra for a local road management (maintenance) system in the context of enabling the basis of 3D geospatial road information management in Korea.
METHODS : Based on a review of related literature and international standards, an analysis of the current system is performed. After reviewing the LandInfra standard, an examination of corresponding classes between each data model (HMS and LandInfra) is performed for the mapping process. After the mapping process, a data model of the LandInfra-based HMS pavement data model is proposed.
RESULTS : To apply the LandInfa to the HMS pavement part, an examination of each data model is performed. After this procedure, a LandInfra-based HMS pavement database schema is proposed in the context of enabling 3D geospatial road information management and maintenance, particularly for pavement management information.
CONCLUSIONS : This paper presents how the LandInfra international open geospatial standard can be applied to the local road management system (HMS pavement part). As a result of this study, the LandInfra standard could be applied to the HMS; however, an encoding of the standard is required for conformance. Thus, further studies would be the encoding of the proposed data model for conformance with InfaGML encoding standards. In addition, a system prototype may be needed for complete application.