최근 고도화된 딥러닝 모형을 이용하여 하천 수질에 영향을 줄 수 있는 과도한 조류(algae) 발생을 예측하는 연구에 대한 관심이 지속되고 있으며, 모형의 구축에 사용되는 현장 측정 자료의 특성상 다양한 이상치를 포함할 수 있어 데이터의 이상치 관리 필요성이 높아지고 있다. 본 연구에서는 현장 자료의 이상치가 딥러닝 모형의 성능에 미치는 영향을 분석하기 위해 딥러닝 Long Short-Term Memory(LSTM) 모형을 이용하여 하천 조류 발생을 정량적으로 평가하는 지표인 클로로필-a를 예측하는 모형을 구축하였으며, 10%의 이상치를 포함한 자료와 이상치가 포함되지 않은 원본 자료로 학습된 모형의 성능을 비교하였다. 또한 딥러닝 기반 이상치 탐지 알고리즘인 Autoencoder(AE)를 이용하여 이상치를 제거한 후 모형의 성능에 미치는 영향을 비교하였다. 분석 결과 이상치를 포함하지 않은 자료로 학습된 Base 모형과 10%의 이상치를 포함한 자료로 학습된 모형의 Nash-Sutcliffe efficiency(NSE)가 각각 0.882 및 0.858로 나타나 이상치가 모형의 성능을 저하시킬 수 있음을 확인하였다. 한편 AE를 이용하여 이상치를 다양한 비율로(5–20%) 제거한 자료로 학습된 모형의 성능을 분석한 결과 NSE가 0.883–0.896으로 이상치의 제거에 따라 모형의 성능이 Base 모형과 유사한 수준으로 개선되는 것으로 나타났다. 본 연구에서는 이상치가 딥러닝 모형에 미치는 영향을 분석하고 이상치 탐지 모형의 활용에 따른 조류 발생 예측 딥러닝 모형의 성능 향상이 가능함을 확인하였다.
Recently, there has been growing interest in studies that predict algal blooms, which can affect the water quality of rivers, using advanced deep learning models. Due to the characteristics of field measurement data, there is a possibility that various anomaly values can be included in the data, thereby increasing the need for effective management of anomalies. In this study, a Long Short-Term Memory(LSTM) model was developed to predict chlorophyll-a concentrations, a quantitative indicator of river algal blooms. The model was used to analyze the impact of anomalies in field data on model performance by comparing the results of models trained with and without 10% anomalous data. In addition, the effect of anomaly removal on model performance was evaluated using an Autoencoder(AE), a deep learning-based anomaly detection algorithm. The Nash Sutcliffe efficiency(NSE) of the base model trained without anomalies and the model trained with 10% anomalous data were 0.882 and 0.858, respectively, indicating that anomalies can degrade model performance. Furthermore, analysis of models trained on datasets with anomalies removed at various ratios (5–20%) using the AE showed that the NSE ranged from 0.883 to 0.896, suggesting that removing anomalies improved model performance to a level comparable to that of the base model. This study analyzed the influence of anomalies on deep learning model performance and confirmed that applying an anomaly detection model can enhance the performance of a deep learning model for algal bloom prediction.