Determination of optimal clustering conditions for classifying influent load patterns at wastewater treatment plant in response to meteorological variability
기후변화로 기상 조건의 변동성이 증가함에 따라, 하수처리장 유입 부하의 변동성 또한 전반적으로 확대되고 있다. 특히 합류식 하수관거 시스템을 사용하는 도시 지역에서는 강수 및 기온 변화에 따라 유입 부하 변동이 더욱 두드러지게 나타난다. 이에 따라 기존에 활용되는 계절 기반 분류 방법은 예외적인 유입 부하 패턴을 충분히 포착하는 데 한계를 가진다. 본 연구는 기상 자료와 유입 수질 자료를 통합하여 군집화 기반으로 하수처리장 유입 부하 패턴을 분류하는 것을 목적으로 한다. 유입 부하 변동 특성을 효과적으로 나타낼 수 있는 최적의 군집화 조건을 도출하기 위해 다양한 실험 조건에서 여러 군집화 알고리즘의 성능을 비교ㆍ분석하였다. 9년간의 일 단위 기상 자료와 유입 수질 자료를 활용하여 다양한 입력 변수 및 파라미터 조건에서 4개 군집화 알고리즘의 성능을 평가하였다. 분석 결과, 학습에 활용된 특징 변수의 수가 증가할수록 군집 간 상대적 거리인 분리도는 전반적으로 감소하여 분류 성능이 저하되는 경향을 보였다. 반면, 기상 변수를 포함하면 군집 성능이 일관되게 향상되었다. 결과적으로, 강수량의 비대칭적 분포 특성으로 인해 밀도 기반 및 분포 기반 알고리즘은 군집 경계 형성을 저해하여 성능이 저하되었고, 거리 기반 알고리즘은 강수 변수를 포함할 때 분리도가 증가하며 실루엣 지수(Silhouette Index, SI) 높게 나타났다. 이러한 결과는 적절히 선택된 군집화 조건이 기존의 계절 분류를 넘어 예외적인 유입 부하 패턴을 효과적으로 구분할 수 있음을 시사한다. 본 연구는 기상 자료와 수질 자료를 통합한 유입 부하 군집화가 기존 접근법보다 정교한 분류를 가능하게 하며, 선제적 운영과 공정 수준 예측 성능 향상에 기여할 수 있는 정량적 근거를 제시한다.
Climate change has increased the variability of meteorological conditions, which in turn has amplified the variability of influent loading to wastewater treatment plants (WWTPs). This effect is more pronounced in urban areas served by combined sewer systems, where precipitation and temperature fluctuations strongly influence influent loading patterns. Accordingly, conventional season-based grouping often fails to capture non-seasonal or event-driven influent loading patterns. This study aims to classify WWTP influent loading patterns using clustering based on integrated meteorological and influent water-quality data. To identify clustering settings that effectively represent influent loading variability, we compared the clustering validity of multiple clustering algorithms across a range of analysis configurations. Using nine years of daily meteorological and influent water-quality data, we evaluated four clustering algorithms under various feature sets and hyperparameter settings. Overall, increasing the number of features tended to reduce inter-cluster separation and thereby degrade clustering validity; however, including meteorological variables consistently improved clustering validity. Due to the highly skewed distribution of precipitation, density-based and model-based algorithms exhibited degraded clustering validity, likely because skewness hindered stable boundary formation. In contrast, distance-based algorithms achieved higher silhouette index values when precipitation-related features were included, as they increased inter-cluster separation. These findings suggest that appropriately selected clustering settings can distinguish atypical influent loading patterns beyond conventional season-based grouping. The proposed clustering framework, which integrates meteorological and water-quality data, enables a more refined grouping than conventional approaches and provides quantitative evidence that can support proactive operation and improved process-level prediction.