본 연구는 준거집단(취직자)들의 활동 데이터 뱅크를 생성하여 예비 취업자(고등교육기관의 체 육계열 전공자)들이 현재까지 활동했던 데이터를 데이터마이닝 기반 추천 알고리즘을 적용해 예비 취업자 들에게 가장 적합한 직업군을 추천해주는 스포츠 일자리 추천모형을 개발하고 검증하는 것이다. 따라서 평 가지표를 구성하고, 준거집단을 대상으로 인터뷰 및 조사를 통해 데이터 뱅크를 생성했다. 또한 비확률 표 본추출법 중 할당표본 추출법과 눈덩이표본 추출법을 적용해 예비 취업자 조사를 실시했으며, 총 921명의 자료를 통해 스포츠 일자리 추천모형 개발과 유사도를 통해 모형을 검증했다. 즉, 본 결과는 다음과 같다. 첫째, 준거집단과 예비 취업자의 평가지표를 구성했다. 둘째, 준거집단의 데이터 뱅크를 생성했다. 셋째, 스 포츠 전공 청년들을 위한 일자리 추천모형을 개발하고, 유사도를 통해 모형을 검증했다.
As renewable energy penetration continues to increase, the output variability and forecasting uncertainty of photovoltaic generation have emerged as major operational risks in power systems. This study establishes a sensor-based data quality control procedure to ensure the reliability of meteorological data collected at a PV plant. For temperature, humidity, and wind speed, a four stage QC process physical range check, persistence check, step change check, and median filtering was applied. Solar radiation, which exhibits strong temporal and distributional characteristics, was processed using a three-stage QC procedure consisting of physical range, step change, and frequency distribution checks. Using the quality-controlled meteorological data, PV generation forecasting was performed with SVM and XGBoost models. As a result, the MAPE values improved to 6.32% for SVM and 6.08% for XGBoost after QC application. The findings confirm that meteorological data quality control significantly enhances PV forecasting accuracy and can support future strategies for distributed energy resource management, curtailment mitigation, and power system risk reduction.
하수처리장의 안정성과 효율성의 향상을 위해 스마트 기술 도입이 요구되고 있으나, 운영 데이터베이스 구축에 있어 계측의 신뢰성과 연속성 확보에 어려움이 있다. 활성슬러지 모델은 하수처리장의 디지털트윈으로 활용되며, 유입수 성상이 동일하더라도 다양한 운전 조건에 대한 데이터를 생산할 수 있다. 본 연구에서는 실측 데이터와 시뮬레이터 기반 합성 데이터를 통합하여 하수처리장 질소 농도 예측 머신러닝 모델을 구축하였다. A2O 공정의 호기조를 대상으로 기체상 N2O 및 액상 NH4 + 농도를 측정하였으며, 내부반송량, 외부반송량 등 운전인자를 포함한 운영데이터베이스를 구축하고 분석하였다. 확보한 실측 데이터를 기반으로 운영 특성을 분석하고, Sumo4N 모델을 활용하여 다양한 운전 조건에서의 합성 데이터를 생성하였다. 이후 두 데이터를 통합하여 데이터 증강을 수행함으로써, 실측 데이터의 양적 한계를 보완하였다. 모델 학습을 위한 입력 변수로는 외부⋅내부 반송량, 폭기량, 온도, 유입 질소 부하, pH를 선정하였으며 호기조의 N2O, NH4 +과 방류수 TN 농도를 예측하기 위한 머신러닝 모델을 개발하였다. 모델 학습에는 Lasso Regression, Random Forest, k-NN, SVR 알고리즘을 적용하여 성능을 평가하였다. 그 결과 SVR 알고리즘이 모든 질소 성분 예측에서 가장 우수한 성능을 보였으며, 개발된 모델 모두 R² ≥ 0.75의 높은 예측 성능을 나타내었다. 이는 시뮬레이터 기반 데이터 증강을 통해 기체상 및 액상 질소의 통합 제어를 위한 머신러닝 모델 구축의 가능성을 시사한다.
국제해운의 탈탄소 전환과 IMO GHG 전략에 따른 규제 강화로 선박별 정밀 배출 산정이 요구되고 있다. 그러나 실제 운항 선 박의 주기관 출력 정보는 외부 데이터베이스에 의존하는 경우가 많아 데이터 수집 단계에서 상당한 경제적 비용과 시간 지연이 발생한 다. 이러한 제약을 완화하기 위해, 본 연구는 AIS 정적 정보 중 선체길이를 단일 입력변수로 활용하여 선종별 주기관 출력을 기계학습으 로 추정하는 방법을 제안한다. 본 연구에서는 선형회귀, K-최근접이웃, 랜덤포레스트, 그래디언트부스팅, AdaBoost, XGBoost, LightGBM, CatBoost 등 8종의 기계학습 모델을 적용하였다. 수집한 데이터는 선종별로 분리한 뒤 무작위 분할하였고, 90% 학습셋에서 10-fold 교차검 증을 수행한 후 10% 홀드아웃 테스트로 최종 성능을 평가하였다. 테스트셋 기준 화물선은 CatBoost가 R²=0.96, 탱커선은 Gradient Boosting이 R²=0.96으로 가장 우수하였다. 여객선은 XGBoost가 R²=0.89, 예인선은 CatBoost가 R²=0.76을 보였다. 본 연구를 통해 AIS 데이터를 이용하여 주기관 출력을 추정할 수 있음을 확인하였다.
전기추진 선박의 추진축계 이상상태는 심각한 선박 운항 장애를 초래할 수 있으므로, 추진 시스템의 상태를 정확히 진단하고 사전에 예방 유지보수를 수행하는 Prognostics and Health Management(PHM) 기술의 필요성이 증가하고 있다. 본 연구에서는 전기추진 선박 의 추진축 이상상태를 조기에 감지하고 진단하기 위하여 진동 데이터를 기반으로 한 머신러닝 기반 PHM 시스템의 개발과 성능 평가를 수행하였다. Land-Based Testing System(LBTS) 시스템에서 수집된 정상 상태와 축 정렬 이상 상태(0.5 mm, 1.0 mm, 1.5 mm)의 진동 데이터를 활용하여 데이터 전처리 및 특성 추출을 수행하였다. 연구에서는 Fully Connected Neural Network(FCNN) 및 Convolutional Neural Network(CNN)을 적용하여 이상 상태를 진단하는 모델을 개발하고 비교 분석하였다. FCNN 기반 모델은 단순한 구조로 빠른 학습이 가능 하여 실시간 모니터링에 적합한 반면, CNN 모델은 미세한 상태 변화를 효과적으로 탐지하는 데 탁월한 성능을 보였다. 성능 평가 결과 FCNN 모델은 평균 95% 이상의 정확도를 나타냈으며, CNN 모델은 이보다 더욱 향상된 성능을 제공하였다. 본 연구를 통해 개발된 진동 기반 PHM 시스템은 전기추진 선박 추진축 이상상태를 효과적으로 조기에 진단할 수 있는 능력을 입증하였다. 이러한 연구 성과는 전기 추진 선박의 안전하고 효율적인 운항을 위한 신뢰성 높은 유지보수 전략 수립에 중요한 기여를 할 것으로 기대된다. 향후 연구로는 데이 터 품질 개선 및 추가적인 딥러닝 모델 적용을 통한 성능 향상을 목표로 한다.
본 연구는 기계학습 및 설명 가능한 인공지능(xAI) 기법을 활용하여 폭발 하중을 받는 철근콘크리트 기둥의 보강 단계(Retrofit Level, RL)를 신속하게 평가하는 종합적 프레임워크를 제시한다. 파괴 유형와 보강 요구사항을 예측하기 위한 다단계 기계학습 접근 법을 개발하였으며, 이후 부분 의존성 그래프(Partial Dependence Plot, PDP) 분석을 통해 데이터 기반 보강 전략을 수립하였다. 제안 된 프레임워크는 두 가지 주요 프로세스로 구성된다: (1) 파괴유형 분류 및 RL 예측을 위한 다단계 기계학습 모델을 활용한 폭발 성능 평가, (2) 입력 변수 효과의 체계적 분석을 통한 PDP 기반 보강 전략 개발. RL 예측 모델은 광범위한 폭발 손상 평가 데이터를 바탕으 로 학습되었으며, 휨 및 전단 파괴유형에 대해 세 가지 손상 조건(심각, 보통, 경미)에서 검증되었다. PDP 분석 결과, 파괴유형과 손상 조건에 따라 서로 다른 보강 특성이 나타남을 확인하였다. PDP 기반 분석을 통해 주철근비 및 전단철근비에 대한 보강 가능 구간과 불가능 구간을 성공적으로 식별하였다.
과도한 조류 발생은 수생태계 교란과 수질 악화를 초래하는 대표적인 환경 문제로, 효과적인 관리와 대응을 위해 정확한 예측이 필요하다. 우리나라는 사계절의 기후 특성이 뚜렷하며, 수온이 상승하는 하절기에 조류 발생이 집중되는 경향을 보인다. 이에 따라 실시간 모니터링 자료는 대부분 저농도 상태가 유지되어 데이터 불균형 문제가 발생한다. 본 연구에서는 chlorophyll-a 농도를 기준으로 하천 현장의 조류 발생 수준을 Class 1 (Chl-a ≤ 10 ㎍/L), Class 2 (10 < Chl-a ≤ 50 ㎍/L), Class 3 (Chl-a > 50 ㎍/L)와 같이 3개의 class로 구분하고, 대표적인 앙상블 머신러닝 모형인 extreme gradient boosting (XGB) 알고리즘을 이용하여 조류 발생 수준을 예측하는 분류 모형을 구축하였다. 데이터 불균형 해소를 위해 생성형 인공지능 기반 알고리즘인 conditional generative adversarial network (CGAN)과 전통적인 데이터 보강 알고리즘인 synthetic minority over-sampling technique (SMOTE), 그리고 딥러닝 기반 기법인 autoencoder (AE)를 활용한 3가지 데이터 보강 알고리즘을 활용하여 데이터의 불균형을 개선한 자료를 생성하고 이를 XGB 모형에 적용하여 성능 변화를 비교하였다. 분석 결과 macro average 기준으로 원본 데이터를 사용한 모형의 recall은 0.606이었으나 SMOTE, AE 및 CGAN의 recall은 각각 0.666, 0.682, 0.720으로 크게 개선되었고, F1 score도 데이터 불균형 해소를 통해 약 7–13%의 성능이 향상되는 등 전체적으로 데이터 불균형 해소로 모형의 성능이 향상되었으며 CGAN이 가장 우수한 성능 개선 효과를 보이는 것으로 나타냈다. 본 연구의 결과를 통해 데이터 불균형 해소를 통한 머신러닝 모형 성능 개선 가능성을 확인하였다.
Accurate estimation of vehicle exhaust emissions at urban intersections is essential to assess environmental impacts and support sustainable traffic management. Traditional emission models often rely on aggregated traffic volumes or measures of average speed that fail to capture the dynamic behaviors of vehicles such as acceleration, deceleration, and idling. This study presents a methodology that leverages video data from smart intersections to estimate vehicle emissions at microscale and in real time. Using a CenterNet-based object detection and tracking framework, vehicle trajectories, speeds, and classifications were extracted with high precision. A structured preprocessing pipeline was applied to correct noise, missing frames, and classification inconsistencies to ensure reliable time-series inputs. Subsequently, a lightweight emission model integrating vehicle-specific coefficients was employed to estimate major pollutants including CO and NOx at a framelevel resolution. The proposed algorithm was validated using real-world video data from a smart intersection in Hwaseong, Korea, and the results indicated significant improvements in accuracy compared to conventional approaches based on average speed. In particular, the model reflected variations in emissions effectively under congested conditions and thus captured the elevated impact of frequent stopand- go patterns. Beyond technical performance, these results demonstrate that traffic video data, which have traditionally been limited to flow monitoring and safety analysis, can be extended to practical environmental evaluation. The proposed algorithm offers a scalable and cost-effective tool for urban air quality management, which enables policymakers and practitioners to link traffic operations with emission outcomes in a quantifiable manner.
본 연구는 네트워크 분석 기법을 적용하여 색상(Color), 소재(Material), 가공기술(Technique) 간 조합을 체계적으 로 탐색하고 분석하는 것을 목적으로 한다. 한국디자인진흥원의 CMF HOW’S 아카이브 데이터를 기반으로 C–M–T 통합 네트워크를 구축하고, 이분 네트워크 분할과 투영(Projection) 분석을 통해 구조적 특성과 조합 양상을 정량적으 로 도출하였다. 중심성, 밀도, 군집 계수, 모듈러리티 지표를 활용한 결과, 색상은 다양한 소재⋅기술과 폭넓게 결합 되는 유연성을 보였고, 소재는 가공기술 선택을 제약하거나 반복적 조합을 형성하는 핵심 요소로 확인되었다. 일부 소재는 높은 중심성을 보여 다수의 색상⋅기술과 연결된 반면, 다른 소재는 제한적 적용성을 나타냈다. 또한 모듈러 리티 분석을 통해 유사한 가공 전략을 공유하는 조합군이 식별되어, 제품군별 설계 전략이나 공정 최적화로 확장될 수 있음을 시사한다. 전문가 인터뷰에서는 본 분석틀이 CMF 기획 및 실무 의사결정에서 활용 가능한 참조 지표로 평가되었으며, 향후 친환경 규제 대응, 산업군 비교, 제품군 사례 분석 등으로 확장 가능성이 제시되었다. 본 연구는 CMF 데이터를 구조 화하여 조합 경향을 객관적으로 이해하고, 디자인 실무에 적용 가능한 분석 도구를 제시한다는 점에서 학술적⋅실무 적 의의를 갖는다.