최근 고도화된 딥러닝 모형을 이용하여 하천 수질에 영향을 줄 수 있는 과도한 조류(algae) 발생을 예측하는 연구에 대한 관심이 지속되고 있으며, 모형의 구축에 사용되는 현장 측정 자료의 특성상 다양한 이상치를 포함할 수 있어 데이터의 이상치 관리 필요성이 높아지고 있다. 본 연구에서는 현장 자료의 이상치가 딥러닝 모형의 성능에 미치는 영향을 분석하기 위해 딥러닝 Long Short-Term Memory(LSTM) 모형을 이용하여 하천 조류 발생을 정량적으로 평가하는 지표인 클로로필-a를 예측하는 모형을 구축하였으며, 10%의 이상치를 포함한 자료와 이상치가 포함되지 않은 원본 자료로 학습된 모형의 성능을 비교하였다. 또한 딥러닝 기반 이상치 탐지 알고리즘인 Autoencoder(AE)를 이용하여 이상치를 제거한 후 모형의 성능에 미치는 영향을 비교하였다. 분석 결과 이상치를 포함하지 않은 자료로 학습된 Base 모형과 10%의 이상치를 포함한 자료로 학습된 모형의 Nash-Sutcliffe efficiency(NSE)가 각각 0.882 및 0.858로 나타나 이상치가 모형의 성능을 저하시킬 수 있음을 확인하였다. 한편 AE를 이용하여 이상치를 다양한 비율로(5–20%) 제거한 자료로 학습된 모형의 성능을 분석한 결과 NSE가 0.883–0.896으로 이상치의 제거에 따라 모형의 성능이 Base 모형과 유사한 수준으로 개선되는 것으로 나타났다. 본 연구에서는 이상치가 딥러닝 모형에 미치는 영향을 분석하고 이상치 탐지 모형의 활용에 따른 조류 발생 예측 딥러닝 모형의 성능 향상이 가능함을 확인하였다.
This study explores the use of a Deep Autoencoder model to predict depression among plant and machine operators, utilizing data from the Korean National Health and Nutrition Examination Survey (KNHANES, n=3,852). The Deep Autoencoder model outperformed the Logistic Regression, Naive Bayes, XGBoost, and LightGBM models, achieving an accuracy of 86.5%. Key factors influencing depression included work stress, exposure to hazardous substances, and ergonomic conditions. The findings highlight the potential of the Deep Autoencoder model as a robust tool for early identification and intervention in workplace mental health.