The National Highway Traffic Safety Administration (NHTSA) and the California Department of Motor Vehicles (CA DMV) collect and utilize data from traffic accidents caused by Automated Driving Systems (ADS) driving on real roads, as a policy. Leading autonomous driving technology companies such as Tesla and Waymo collect their own driving and accident data and use them for technology advancement. ADS traffic accident data that occur when driving on real roads are valuable for identifying problems in unexpected situations. This study analyzes the risk of traffic accidents by Operational Design Domain (ODD) on ADS traffic accident data that occurred while driving on an actual road and aims to present a road traffic law-based driving ability evaluation scenario in a complex ODD configuration in high-risk situations, wherein an ADS can be particularly vulnerable in mixed traffic situations. The actual road traffic accident data of ADS from 2,289 accidents as provided by the NHTSA were analyzed. Analysis of the characteristics of ADS traffic accidents revealed that accidents occurred mainly on ordinary ODDs with high traffic demand during actual road driving, that is, on dry roads during clear days and daylight. In traffic situations including ADS and Human Driving Vehicle(HDV), approximately 40% of traffic accidents were confirmed to have occurred because of HDV colliding with stationary ADS and occurred in unexpected situations, such as changing the HDV when driving straight ahead of the ADS. Results of analyzing the risk of traffic accidents on the driving status of ADS by ODD, showed that the risk of traffic accidents that occurred while the ADS was driving straight ahead was 2.27, with dry road conditions, sunny weather, and a road speed limit of 21 to 30 mph at night when streetlights were turned on. Thus, the ADS road traffic law-based driving ability evaluation scenario can be used to evaluate whether to recognize and respond to accident risk situations by developing ADS road traffic law-based driving ability evaluation scenarios for situations vulnerable to accidents due to HDV cut-in in traffic situations that include ADS and HDV. In future, this can be used as basic data for preparing related regulations and institutional devices, such as traffic accident investigations and driving ability evaluations by ADS.
Potholes on urban expressways are a critical pavement maintenance problem because they threaten driving safety, generate vehicle-damage claims, and require repeated emergency repairs. However, network-level evidence integrating climate, traffic, maintenance execution, and detection practice remains limited. This study addressed this gap through a stage-1 empirical assessment of pothole occurrence and pavement maintenance response on the Seoul urban expressway network. The novelty lies in integrating six years of operational data, including pothole repair records, compensation cases, monthly rainfall, monthly average temperature, route-level traffic volume, maintenance budget and execution records, detection pathways, and repeated pothole locations. A total of 28,821 pothole repairs were recorded between 2020 and 2025, with Olympic-daero (11,330 cases), Dongbu Trunk Road (6,594 cases), and Gangbyeonbuk-ro (5,067 cases) accounting for approximately 79.8% of the total. The compensation burden was also concentrated, with 158 cases and a total payout of KRW 48,592,000. Pothole occurrence showed a clear dual-season pattern, with high counts during the thawing period and a stronger summer peak, increasing from 1950, 3100, and 3773 cases in June, July, and August when rainfall rose from 174.60 mm to 333.68 mm and 352.15 mm, respectively. Traffic remained consistently high (48,576–96,700 vehicles/day) but varied by only approximately 5.1% annually, indicating that climate governed outbreak timing, while traffic acted mainly as a chronic aggravating factor. Artificial intelligence (AI)-based Camera Detection System (CDS) detection contributed to 54.3% and 57.2% of external detections in 2024 and 2025, respectively, while repeated repairs accounted for 3,957 cases across 783 locations (13.7% of total repairs). These findings support seasonal preventive maintenance, route-based prioritization, AI-assisted detection, and hotspot-focused management.
This study comparatively analyzes the energy generation performance and economic evaluation of monofacial and bifacial photovoltaic (PV) modules, utilizing empirical data obtained from the Saemangeum project. The analysis is based on field data collected over a three-year period from 2022 to 2024. The results indicate that bifacial modules achieved an average power generation increase of approximately 8.27% compared to monofacial modules, attributed to the additional energy yield from rear-side irradiance. For the economic assessment, the Levelized Cost of Electricity (LCOE) and the Break-Even Point (BEP) were analyzed. Although the initial investment cost for bifacial modules was approximately 7.4% higher than that of monofacial modules, the LCOE was found to be lower for bifacial modules (114.7 KRW/kWh) compared to monofacial modules (117.8 KRW/kWh) over a 20-year operation period, due to the benefits of increased energy generation. The BEP analysis revealed that bifacial modules reach a break-even point relative to monofacial modules after 7.02 years. Furthermore, the study examined the trends of the BEP in response to variations in electricity selling prices and bifacial gain. In conclusion, this study confirms that bifacial PV modules demonstrate superior results in both power generation performance and economic analysis within the testbed environment. Consequently, these findings suggest a high potential for the application of bifacial modules in future domestic and international photovoltaic projects.
국내 노후 교량의 증가에 따라 유지관리 비용과 사회적 피해가 지속적으로 확대되고 있으며, 특히 포트홀 발생으로 인한 피해 보상액 또한 최근 증가하는 추세를 보이고 있다. 교량 포장 구조에서 포트홀은 아스팔트 포장과 콘크리트 바닥판 사이 계면의 박리로부터 구조적으로 시작된다. 차량 제동 및 가속에 따른 수평 하중, 수분 침투, 층간 차등 팽창 등은 계면에 인 장응력을 유발하여 결합 상태를 약화시키며, 이는 표면 균열로 진전되어 최종적으로 포트홀로 이어진다. 따라서 계면 박리는 포트홀 발생의 구조적 전조증상으로 볼 수 있다. 하지만 기존의 육안 점검은 표면 손상 중심의 평가에 국한되어 계면 박리 와 같은 내부 구조 상태를 직접적으로 파악하는 데 한계가 있다. 최근에는 구조물 내부 상태를 평가하기 위해 다양한 NDT 기법의 활용이 증가하고 있으나, 탄성파 기반의 IE(Impact-Echo) 및 UT(Ultrasonic Testing) 기법은 아스팔트와 같은 다공성 재료 내부에서 신호 감쇠가 발생하여 적용에 제약이 있다. 반면, 전자기파를 활용하는 GPR(Ground Penetrating Radar)은 포 장 내부 및 계면 상태 평가에 적합하나, 신호 해석 과정에서 전문가의 경험에 의존하는 주관적 한계가 존재한다. 이에 본 연구에서는 GPR 데이터를 기반으로 계면 박리 유무를 자동으로 분류하고, 이를 통해 포트홀 발생 위험 지점을 예측하는 딥 러닝 기반 프레임워크를 제안하였다. ResNet-50을 백본으로 하는 2-stage 전이학습 기법을 적용하였으며, 1단계에서는 3,708 개의 시험체 데이터를 활용하여 기초 분류 모델을 구축하고, 2단계에서는 28,890개의 실교량 데이터를 추가 학습하여 현장 조건에 대한 일반화 성능을 향상시켰다. 그 결과, 제안된 모델은 전체 정확도 85.2%와 weighted F1-score 0.8493의 성능을 나 타내었다. 본 연구에서 제안한 방법은 포트홀 발생 이전 단계에서 내부 계면 박리를 탐지할 수 있는 기술적 기반을 제시하 였으며, 이를 통해 선제적 유지관리 전략 수립과 교통 안전성 향상, 유지관리 비용 및 피해 보상액 감소에 기여할 수 있을 것으로 판단된다.
This study aims to enhance accessibility in transportation-disadvantaged areas by utilizing Large Language Model(LLM) to analyze public transportation and advanced mobility status data (e.g., platform taxis and Demand Responsive Transport(DRT)), and proposes a methodology to support region-specific mobility activation strategies. The study was divided into three stages: first, the collection of mobility data; second, the implementation of geographic information system (GIS)-based visualization and preprocessing; and third, the application of LLM-based image interpretation and classification. A variety of mobility data were consolidated into a unified spatial entity, converted into visualization information for LLM processing, and examined using a rule-based classification system to ascertain the mobility environment types. This approach addresses the limitations of single-data analysis and enables a multi-layered interpretation of regional transportation gaps. Through the LLM interpretation of visual elements, including grid colors, patterns, bus routes, and designated DRT operation areas, transportation characteristics such as mobility supply levels, DRT operation status, and taxi dependency were identified. The LLM model demonstrated a high level of performance with a precision rate of 78.2 %, accuracy rate of 73.1 %, recall rate of 91.8 %, and F1-score of 84.5 %. Notably, the recall rate exceeded 90 %, signifying comprehensive recognition of various transportation environment types. This study proposes an LLM-based spatial data interpretation framework for analyzing regional mobility conditions in Paju City. The integration of complex spatial information into QGIS enables the LLM to automatically analyze data, thereby unveiling micro-level mobility characteristics and identifying four types of regional mobility improvements.
This study proposes a data-driven framework for analyzing freeway driving behavior using multiple real-world trajectory datasets, and applies it consistently to mainline and ramp sections. The four large-scale datasets—namely highD, exiD, NGSIM I-80, and NGSIM US- 101—were processed through a unified preprocessing pipeline that converted all variables to International System Units(SI), resampled trajectories to 10 Hz, applied Savitzky-Golay smoothing to speed, and removed physically implausible and statistical outliers based on joint physical-statistical criteria. For each vehicle, 24 summary features were constructed from six longitudinal indicators–speed, acceleration, deceleration, time headway (THW), distance headway (DHW), and time-to-collision (TTC)–using their minimum, maximum, mean, and standard deviation. Indicator distributions by road type were compared using relative frequency histograms with common binning; then, principal component analysis (PCA) and K-means clustering were applied independently to each dataset. The leading principal components revealed interpretable axes related to longitudinal driving intensity (speed and acceleration level), safety margin (THW/DHW/TTC), and onramp sections; responsiveness was characterized by acceleration-deceleration variability, as observed within the analyzed datasets. Cluster interpretation yielded four relative driving behavior categories–aggressive, responsive, stable, and defensive–defined within each dataset based on indicator levels and variability rather than absolute thresholds.
As renewable energy penetration continues to increase, the output variability and forecasting uncertainty of photovoltaic generation have emerged as major operational risks in power systems. This study establishes a sensor-based data quality control procedure to ensure the reliability of meteorological data collected at a PV plant. For temperature, humidity, and wind speed, a four stage QC process physical range check, persistence check, step change check, and median filtering was applied. Solar radiation, which exhibits strong temporal and distributional characteristics, was processed using a three-stage QC procedure consisting of physical range, step change, and frequency distribution checks. Using the quality-controlled meteorological data, PV generation forecasting was performed with SVM and XGBoost models. As a result, the MAPE values improved to 6.32% for SVM and 6.08% for XGBoost after QC application. The findings confirm that meteorological data quality control significantly enhances PV forecasting accuracy and can support future strategies for distributed energy resource management, curtailment mitigation, and power system risk reduction.
본 논문은 조선시대 비변사에서 생산한 기록물이자 역사 연구자들이 이용하는 사료인 비변 사등록을 디지털인문학 연구에 활용하기 위해 기록된 정보들을 분석하여 그에 적합한 데이터를 구축하는 방안을 제시하는 데 목적이 있다. 비변사등록에 기록된 정보는 크게 좌목과 기사로 구분한다. 좌목은 매월 1일 현재 비변사에 소속된 관원의 명단이다. 기사는 날짜, 등서된 문서의 내용, 추기로 구성된다. 문서는 비변사 뿐만 아니라 다양한 관서에서 작성하여 국왕에게 아뢰는 문서들과 승정원에서 등출한 문서 위주로 등서되어 있다. 구조화된 데이터를 구축할 때도 좌목과 기사를 각각의 데이터셋으로 구축하는 방안을 제시하였다.
목적: 본 연구는 산재보험패널조사 2⋅3차 데이터를 활용하여 산재 수부 손상 환자의 요양 종결 연도에 따른 동향을 분석하기 위해 실시되었다. 연구방법: 본 연구는 산재보험패널 데이터를 활용한 후향적 코호트 연구로, 산업재해로 인한 수부 손상 환자 1,967명을 대상으로 하였다. 연구 대상자의 기초 특성을 파악하기 위해 인구통계학적, 산업재해 관련, 직업재활 및 직업 특성에 대한 빈도분석을 실시하였다. 또한 산재요양 종결 연도에 따른 특성 변화를 분석하기 위해 2017년(982명)과 2022년(985명) 두 시점으로 구분하여 카이제곱 검정을 수행하였다. 결과: 2022년 산재요양 종결자는 인구통계학적 특성에서 60세 이상, 미혼 및 대졸 이상의 비율이 증가하였다. 산업재해 특성에서 업무상 질병의 비율이 높아졌고, 요양 기간은 길어졌다. 직업재활 특성에서는 유의한 차이가 없었고 직업 특성에서는 첫 번째 직장에서의 수부 손상 비율은 감소하였지만 근무기간 2개월 미만에서 손상 비율은 증가하였다. 결론: 산재 수부 손상 환자의 특성 변화를 확인하여 사업장 내 수부 손상 예방을 위한 교육 강화와 함께 효과적인 수부 치료 향상 및 직업복귀 촉진을 위한 산재 의료 전달 체계 개선의 필요성을 제시하였다.
본 연구는 국가표준식물목록(KPNI)에 수록된 재배식물 6,346 종을 대상으로 주요 국제 데이터베이스(POWO, WFO, GBIF, Tropicos, EPPO, GRIN)와의 학명 비교 및 자생지 분석을 수 행하였다. 자료는 마지막으로 업데이트 된 최신 버전을 활용하 였으며, R 프로그램을 통해 학명, 명명자, 분류군, 학명 상태를 정리·표준화한 후 KPNI와 대조하였다. 분석 결과, 전반적으로 모든 데이터베이스에서 정명의 비율이 가장 높았고, 그 중 POWO와 WFO가 정명 비율이 특히 높았으며, GRIN과 GBIF 또한 정명이 다수를 차지하였다. 그러나 이명 및 기타 범주 처리 방식은 데이터베이스별로 상이하였다. POWO, WFO, GBIF는 이명을 2-3개 항목으로 구분한 반면, EPPO와 GRIN은 단순히 accepted와 not accepted로 제시하였다. Tropicos는 Bulk Name Matching 기능을 통해 합법명과 비합법명(illegitimate) 만을 구분하였다. 또한 학명 불일치 처리 비율은 POWO와 WFO 에서 적었으나, EPPO와 GRIN에서는 상대적으로 높게 나타났 다. 이러한 차이는 데이터베이스별 분류학적 관리 수준과 해석 범위의 차이를 반영하며, 향후 국내 재배식물 목록과 국제 데이 터베이스 간 동기화의 필요성을 시사한다.
섬 관광은 새로운 관광 트렌드로 주목받고 있으며, 힐링·생태·체류형 등 다양한 형태로 발전하고 있다. 인천은 우리나라에서 가장 많은 섬을 보유한 해양관광 중심지로서, 강화도·백령도·연평도·자월도·덕적도·이작 도·신도·영흥도 등 주요 도서들이 각기 다른 자연환경, 문화유산, 해양레 저 자원을 갖추고 있다. 이를 기반으로 인천시는 풍부한 관광 자원을 활 용해 ‘섬 관광벨트 조성 및 바다로 통하는 인천’ 프로젝트를 추진하고 있 다. 본 연구는 인천 섬 관광에 대한 인식과 트렌드를 파악하기 위해 수 행되었다. 이를 위해 소셜미디어와 SNS에서 인천 섬 관광 관련 키워드 를 수집·정제하고, 단계적인 분석 절차를 거쳐 연구를 진행하였다. 연구 결과, 첫째, ‘여행’, ‘공항’, ‘투어’, ‘시간’, ‘도착’, ‘일정’, ‘바다’, ‘추천’, ‘출발’, ‘방문’, ‘관광공사’, ‘체험’ 등의 키워드가 온라인상에서 활발하게 언급되었다. 둘째, ‘지역’, ‘지원’, ‘서울’, ‘사업’, ‘호텔’ 등의 키워드가 높은 연결중심성을 보였으며, ‘체험’, ‘시간’, ‘바다’, ‘거리’, ‘일정’, ‘추 천’ 등은 강한 근접중심성을 나타냈다. 셋째, CONCOR 분석 결과, ‘관광 계획 및 체류활동’, ‘관광상품 및 교통정보’, ‘관광정책 및 개발계획’ 등 을 포함한 총 5개의 군집이 도출되었다.
전 세계 식량 안보는 기후 변화와 인구 증가로 인해 점점 더 위협받고 있으며, 이를 해결하기 위해서는 유전체학, 표현형 학, 인공지능을 통합한 첨단 육종 전략이 필요하다. 본 연구는 유전자형 데이터 증강과 반지도 학습을 활용하여 토마토 육종 에서의 표현형 예측 정확도를 향상시키는 것을 목표로 한다. 총 192종의 토마토 계통을 온실 환경에서 재배하며, 과중, 높 이, 너비, 경도, 당도 등 5가지 주요 형질에 대한 유전자형, 표 현형, 환경 데이터를 수집한다. 제안된 1차원 합성곱신경망 기반의 유전자형 데이터 증강 프레임워크는 원본 데이터셋을 확장하고, 라벨이 안된 데이터를 효과적으로 활용하기 위한 수도 라벨링 전략을 도입한다. 또한, 온도, 습도 등 환경 변수 는 생육 기간 동안의 통계적 특징값을 추출하여 모델 입력에 통합함으로써 재배 조건을 보다 현실적으로 반영하였다. 표 현형 예측은 트리 기반 및 딥러닝 아키텍처를 포함한 다양한 모델을 통해 수행되었으며, 서로 다른 네트워크 구조에 따른 성능을 비교 및 평가한다. 실험 결과, 유전자형 데이터 증강은 전반적으로 예측 성능을 향상시켰으며, 특히 LightGBM과 CatBoost와 같은 트리 기반 모델에서 가장 큰 개선 효과를 보 였다. 또한 최신 딥러닝 모델과의 비교 실험을 통해 제안된 접 근법의 강건성을 확인한다. 이러한 결과는 제안된 방법이 데 이터가 제한된 육종 환경에서도 실질적인 성능 향상을 달성할 수 있는 효과적인 전략임을 보여주며, 향후 멀티오믹스 및 환 경 데이터와의 통합을 통해 확장 가능한 디지털 육종 프레임 워크로 발전할 가능성을 제시한다.
본 연구는 기계학습 및 설명 가능한 인공지능(xAI) 기법을 활용하여 폭발 하중을 받는 철근콘크리트 기둥의 보강 단계(Retrofit Level, RL)를 신속하게 평가하는 종합적 프레임워크를 제시한다. 파괴 유형와 보강 요구사항을 예측하기 위한 다단계 기계학습 접근 법을 개발하였으며, 이후 부분 의존성 그래프(Partial Dependence Plot, PDP) 분석을 통해 데이터 기반 보강 전략을 수립하였다. 제안 된 프레임워크는 두 가지 주요 프로세스로 구성된다: (1) 파괴유형 분류 및 RL 예측을 위한 다단계 기계학습 모델을 활용한 폭발 성능 평가, (2) 입력 변수 효과의 체계적 분석을 통한 PDP 기반 보강 전략 개발. RL 예측 모델은 광범위한 폭발 손상 평가 데이터를 바탕으 로 학습되었으며, 휨 및 전단 파괴유형에 대해 세 가지 손상 조건(심각, 보통, 경미)에서 검증되었다. PDP 분석 결과, 파괴유형과 손상 조건에 따라 서로 다른 보강 특성이 나타남을 확인하였다. PDP 기반 분석을 통해 주철근비 및 전단철근비에 대한 보강 가능 구간과 불가능 구간을 성공적으로 식별하였다.
과도한 조류 발생은 수생태계 교란과 수질 악화를 초래하는 대표적인 환경 문제로, 효과적인 관리와 대응을 위해 정확한 예측이 필요하다. 우리나라는 사계절의 기후 특성이 뚜렷하며, 수온이 상승하는 하절기에 조류 발생이 집중되는 경향을 보인다. 이에 따라 실시간 모니터링 자료는 대부분 저농도 상태가 유지되어 데이터 불균형 문제가 발생한다. 본 연구에서는 chlorophyll-a 농도를 기준으로 하천 현장의 조류 발생 수준을 Class 1 (Chl-a ≤ 10 ㎍/L), Class 2 (10 < Chl-a ≤ 50 ㎍/L), Class 3 (Chl-a > 50 ㎍/L)와 같이 3개의 class로 구분하고, 대표적인 앙상블 머신러닝 모형인 extreme gradient boosting (XGB) 알고리즘을 이용하여 조류 발생 수준을 예측하는 분류 모형을 구축하였다. 데이터 불균형 해소를 위해 생성형 인공지능 기반 알고리즘인 conditional generative adversarial network (CGAN)과 전통적인 데이터 보강 알고리즘인 synthetic minority over-sampling technique (SMOTE), 그리고 딥러닝 기반 기법인 autoencoder (AE)를 활용한 3가지 데이터 보강 알고리즘을 활용하여 데이터의 불균형을 개선한 자료를 생성하고 이를 XGB 모형에 적용하여 성능 변화를 비교하였다. 분석 결과 macro average 기준으로 원본 데이터를 사용한 모형의 recall은 0.606이었으나 SMOTE, AE 및 CGAN의 recall은 각각 0.666, 0.682, 0.720으로 크게 개선되었고, F1 score도 데이터 불균형 해소를 통해 약 7–13%의 성능이 향상되는 등 전체적으로 데이터 불균형 해소로 모형의 성능이 향상되었으며 CGAN이 가장 우수한 성능 개선 효과를 보이는 것으로 나타냈다. 본 연구의 결과를 통해 데이터 불균형 해소를 통한 머신러닝 모형 성능 개선 가능성을 확인하였다.
In this study, we propose a data-driven analytical framework for systematically analyzing the driving patterns of autonomous buses and quantitatively identifying risky driving behaviors at the road-segment level using operational data from real roads. The analysis was based on Basic Safety Message (BSM) data collected over 125 days from two Panta-G autonomous buses operating in the Pangyo Autonomous Driving Testbed. Key driving indicators included speed, acceleration, yaw rate, and elevation, which were mapped onto high-definition (HD) road maps. A hybrid clustering method combining self-organizing map (SOM) and k-means++ was applied, which resulted in eight distinct driving pattern clusters. Among these, four clusters exhibited characteristics associated with risky driving such as sudden acceleration, deceleration, and abrupt steering, and were spatially visualized using digital maps. These visualizations offer practical insights for real-time monitoring and localized risk assessment in autonomous vehicle operations. The proposed framework provides empirical evidence for evaluating the operational safety and reliability of autonomous buses based on repeated behavioral patterns. Its adaptability to diverse urban environments highlights its utility for intelligent traffic control systems and future mobility policy planning.