논문 상세보기

Autoencoder를 이용한 수질 자료 이상치 제거에 따른 조류 발생 예측 딥러닝 모형 성능 비교 KCI 등재

Performance comparison of a deep learning model for algal bloom prediction with anomaly removal in water quality data using an autoencoder

  • 언어KOR
  • URLhttps://db.koreascholar.com/Article/Detail/447617
구독 기관 인증 시 무료 이용이 가능합니다. 4,200원
상하수도학회지 (Journal of the Korean Society of Water and Wastewater)
대한상하수도학회 (Korean Society Of Water And Wastewater)
초록

최근 고도화된 딥러닝 모형을 이용하여 하천 수질에 영향을 줄 수 있는 과도한 조류(algae) 발생을 예측하는 연구에 대한 관심이 지속되고 있으며, 모형의 구축에 사용되는 현장 측정 자료의 특성상 다양한 이상치를 포함할 수 있어 데이터의 이상치 관리 필요성이 높아지고 있다. 본 연구에서는 현장 자료의 이상치가 딥러닝 모형의 성능에 미치는 영향을 분석하기 위해 딥러닝 Long Short-Term Memory(LSTM) 모형을 이용하여 하천 조류 발생을 정량적으로 평가하는 지표인 클로로필-a를 예측하는 모형을 구축하였으며, 10%의 이상치를 포함한 자료와 이상치가 포함되지 않은 원본 자료로 학습된 모형의 성능을 비교하였다. 또한 딥러닝 기반 이상치 탐지 알고리즘인 Autoencoder(AE)를 이용하여 이상치를 제거한 후 모형의 성능에 미치는 영향을 비교하였다. 분석 결과 이상치를 포함하지 않은 자료로 학습된 Base 모형과 10%의 이상치를 포함한 자료로 학습된 모형의 Nash-Sutcliffe efficiency(NSE)가 각각 0.882 및 0.858로 나타나 이상치가 모형의 성능을 저하시킬 수 있음을 확인하였다. 한편 AE를 이용하여 이상치를 다양한 비율로(5–20%) 제거한 자료로 학습된 모형의 성능을 분석한 결과 NSE가 0.883–0.896으로 이상치의 제거에 따라 모형의 성능이 Base 모형과 유사한 수준으로 개선되는 것으로 나타났다. 본 연구에서는 이상치가 딥러닝 모형에 미치는 영향을 분석하고 이상치 탐지 모형의 활용에 따른 조류 발생 예측 딥러닝 모형의 성능 향상이 가능함을 확인하였다.

Recently, there has been growing interest in studies that predict algal blooms, which can affect the water quality of rivers, using advanced deep learning models. Due to the characteristics of field measurement data, there is a possibility that various anomaly values can be included in the data, thereby increasing the need for effective management of anomalies. In this study, a Long Short-Term Memory(LSTM) model was developed to predict chlorophyll-a concentrations, a quantitative indicator of river algal blooms. The model was used to analyze the impact of anomalies in field data on model performance by comparing the results of models trained with and without 10% anomalous data. In addition, the effect of anomaly removal on model performance was evaluated using an Autoencoder(AE), a deep learning-based anomaly detection algorithm. The Nash Sutcliffe efficiency(NSE) of the base model trained without anomalies and the model trained with 10% anomalous data were 0.882 and 0.858, respectively, indicating that anomalies can degrade model performance. Furthermore, analysis of models trained on datasets with anomalies removed at various ratios (5–20%) using the AE showed that the NSE ranged from 0.883 to 0.896, suggesting that removing anomalies improved model performance to a level comparable to that of the base model. This study analyzed the influence of anomalies on deep learning model performance and confirmed that applying an anomaly detection model can enhance the performance of a deep learning model for algal bloom prediction.

목차
요약문
ABSTRACT
1. 서 론
2. 연구방법
    2.1 연구 자료
    2.2 데이터 전처리
    2.3 이상치 생성
    2.4 Autoencoder 이상치 탐지 모형
    2.5 LSTM 모형 구축
    2.6 모형 구성
    2.7 모형 성능 평가
3. 결과 및 토의
    3.1 이상치 탐지 결과
    3.2 LSTM 모형 성능 비교
    3.3 종합 고찰 및 향후 연구 방향
4. 결 론
References
저자
  • 이은지(국립한밭대학교 환경공학과) | Eunji Lee (Deptment of Environmental Engineering, Hanbat National University)
  • 박정수(국립한밭대학교 건설환경공학과) | Jungsu Park (Deptment of Civil and Environmental Engineering, Hanbat National University) Corresponding author