This study presents the development of an AI-based real-time on-device segmentation system designed to support recyclable waste sorting. A lightweight semantic segmentation model was implemented by combining the MobileViT-x-small backbone with the DeepLabV3 architecture, enabling pixel-level classification of recyclable items and intuitive visualization on a smartphone screen. A total of 200 real-world images were collected, with 150 used for training and 50 for testing. To enhance generalization under limited data conditions, the training set was expanded to 750 images through geometric and color-based augmentation techniques. The trained model was subsequently converted into ONNX format and deployed within a Flutter-based mobile application, allowing real-time inference directly on the device without reliance on external servers. The proposed system overlays semi-transparent masks and class labels onto the live camera feed, thereby reducing sorting errors and promoting active user participation in everyday recycling practices.
코로나19 발생 직후 감소하였던 도시철도 이용객 수가 다시 증가하면서 도시철도 역사 내 승강장이나 대합실과 같은 대기 공간에서 의 인파 밀집 사고에 대한 국민들의 우려가 커지고 있다. 2022년 이태원에서 발생한 압사 사고로 인하여 인파 밀집 사고에 대한 국민 들의 관심과 우려가 크게 증가한 상황이며, 정부와 지방자치단체는 이러한 사고를 예방하기 위하여 혼잡도 예측 기술을 개발하는 등 다양한 시도가 이루어지고 있다. 특히 이용객들의 보행 동선이 한정되어 있고, 인파 밀집 현상이 빈번하게 나타나는 대중교통 시설의 혼잡 상황을 사전에 파악하고 이를 관리하기 위한 정량적인 혼잡도 분석 기술의 필요성이 더욱 강조되고 있다. 현재 도시철도 역사 내 인파 밀집도는 CCTV 영상을 기반으로 객체 검지 방식 또는 면적 대비 점유율을 산정하는 방식으로 도출되고 있으며, 대기 공간의 혼잡도는「도시철도 정거장 및 환승·편의시설 설계 지침」(국토교통부, 2018)에 제시된 서비스수준(Level of Service, LOS) 기준에 따라 공간 밀도와 보행 상태 등을 기반으로 평가되고 있다. 그러나 해당 방법론은 군중이 밀집된 상황에서 검지의 정확도가 떨어지고, 역사 내 대기 공간의 면적에 관한 정보가 필요하며, CCTV 화각에 따른 원근감 왜곡으로 인해 위치별로 점유율이 과대 또는 과소 추정되는 한계점이 존재한다. 이에 따라 본 연구에서는 Semantic Segmentation 방식을 활용하여 도시철도 역사 내 대기 공간의 면적과 인파의 수를 직접 산출하지 않고도 인파 밀집도를 예측하는 모형을 개발하였다. 이 모형은 승강장 CCTV 영상을 일정한 시간 단위로 분할한 이미지를 Semantic Segmentation 방식을 활용하여 인파 밀집도 산출 대상 영역을 구분하는 방식으로 대기 공간의 혼잡도를 예측한다. 다만, 해당 기법을 단독으로 적용하는 경우 동일한 인원이 존재하더라도 화각에 따른 원근감 차이로 인해 위치에 따라 점유율이 다르게 산출되는 문제점 이 존재한다. 이러한 한계점을 해소하기 위하여 CCTV 화각에 따른 점유율 왜곡을 최소화하는 보정 작업을 추가로 수행하였다. 모형은 CCTV 영상 이미지에 대한 Semantic Segmentation 과정을 수행하여 mask를 생성하고, 반복적으로 셀 분할 및 가중치 학습을 실시하여 화각에 따른 보정을 진행한다. 보정은 Huber Loss 함수와 경사하강법을 활용하여 이루어지며, 이 과정을 통해 셀의 적정 크기와 위치 별 가중치 행렬이 결정된다. 학습이 완료되면 모형은 이를 전체 이미지에 적용하여 최종적인 점유율을 예측한다. 해당 모형을 활용한 결과 전반적으로 우수한 예측 성능을 보였으나, CCTV 영상 내 인원이 증가할수록 예측의 정확도가 저하되는 경향이 확인되었다. 이는 고밀도 군중 상황에서의 공간 왜곡 보정 및 점유율 산정 방식에 대한 추가적인 개선 필요성을 보여주며, 향후 다양한 밀집 수준을 고 려한 보정 알고리즘의 고도화 연구로 확장될 필요가 있다.
농업 분야 컴퓨터 비전(Computer Vision) 기술 확산으로 고품질 학습 데이터 확보가 필수적이나, 기존의 수동 데이터 구축 방식은 많은 시간과 비용이 소요되는 한계가 있다. 이에 본 연구는 최신 멀티모달 파운데이션 모델인 SAM3(Segment Anything Model 3)를 기반으로 반자동 어노테이션 시스템을 개발하였다. 제안 시스템은 (1) 텍스트 프롬프트 기반 객체 인 식, (2) SAM3 기반 정밀 마스크 생성 및 학습 가능한 폴리곤 좌표 변환, (3) 사용자 검증의 3단계로 구성되며 GUI로 구현 되었다. 600장 이미지 평가 결과, SAM3는 92.9%의 매칭률 과 0.790의 평균 정밀도(mAP)를 달성하였으며, 데이터셋 구 축 시간을 수동 작업 대비 96~98% 단축시켰다. 이는 SAM+ CLIP, Grounding DINO+SAM 등 기존 파운데이션 모델 대 비 정확도와 효율성 모든 면에서 월등한 성능이다. 본 연구는 파운데이션 모델의 제로샷 성능을 활용해 농업 데이터 레이블 링 효율을 개선하고 관련 AI 연구 가속화에 기여할 것으로 기 대된다.
Defect detection in manufacturing processes is a critical requirement for ensuring product reliability and maintaining production stability. As smart manufacturing environments continue to advance, the need for precise and robust vision-based inspection methods has become increasingly significant. This study proposes a hybrid defect analysis framework that integrates YOLOv5-based defect candidate detection with an Attention U-Net–based segmentation module. Experiments conducted on chromate-coated industrial images demonstrate that the proposed framework achieves an accuracy of 0.97, precision of 0.91, recall of 0.89, F1-score of 0.93, and IoU of 0.88, exhibiting stable performance even for small defects and irregular boundaries. The combination of region- of-interest extraction and attention-enhanced pixel-level segmentation improves both computational efficiency and boundary reconstruction quality. The findings extend the applicability of attention-based segmentation to industrial defect inspection and provide practical insights for deploying deep learning–based quality monitoring systems in automated manufacturing environments.
This study investigated the use of weakly supervised learning (WSL) and partial annotation-based semantic segmentation for recognizing ingredients in the traditional Korean dish bulgogi. A dataset was created to encompass various cooking stages and imaging conditions, with pixel-level labels generated for major ingredients: beef, onion, green onion, carrot, chili pepper, mushroom, button mushroom, and king oyster mushroom, using partial annotations. To enhance model robustness, data augmentation techniques such as rotation, scaling, horizontal flipping, and color jittering were employed. The DeepLabV3+ architecture was utilized, with ResNet50 and ResNet101 serving as backbone networks. The results demonstrated that ResNet50 provided stable performance with lower computational costs, while ResNet101 achieved higher segmentation accuracy for smaller or visually complex ingredients. Models trained with data augmentation showed improved recall and F1-scores, especially for smaller ingredient classes. Overall, both backbone models exhibited consistent performance across key segmentation metrics, including mean Intersection over Union (mIoU), precision, recall, and F1-score. These findings indicate that WSL, in conjunction with partial annotation, can effectively facilitate ingredient-level segmentation in mixed dishes like bulgogi.
경량 골재 콘크리트는 높은 다공성을 지닌 골재를 사용하여 제작되며, 이는 재료의 역학적 성질 및 내구성에 중대한 영향을 미친 다. 최근 콘크리트 분야에서는 내부 공극 구조를 비파괴적으로 분석할 수 있는 기술로서 micro-computed tomography(micro-CT)의 활 용이 활발히 이루어지고 있으며, 특히 경량 골재 콘크리트의 공극 구조를 정밀하게 포착하는 데 효과적인 것으로 나타났다. 그러나 경 량골재는 이질적인 밀도 분포와 내부 다공성으로 인해 영상 내 분할 과정에서 어려움을 유발하며, 이로 인해 골재가 공극으로 잘못 인 식되거나 경계가 명확히 구분되지 않는 문제가 발생할 수 있다. 이러한 한계를 극복하기 위해 본 연구에서는 경량 골재 콘크리트의 micro-CT 영상에서 골재를 정밀하게 식별할 수 있도록 고안된 향상된 분할 알고리즘을 제안하였다. 제안된 알고리즘의 성능은 기존 의 세분화 방법과의 비교 분석을 통해 평가되었으며, 더불어 제안 방식과 기존 방식 각각으로 생성된 3차원 micro-CT 데이터를 활용 하여 열전도도 시뮬레이션을 수행하였다. 그 결과, 제안된 알고리즘은 공극 및 골재 경계의 정확한 식별에 있어 기존 기법보다 향상된 정확도를 보였으며, 이는 LWAC의 미세구조 분석 및 거동 예측 모델링의 정밀도를 높이는 데 기여할 수 있는 가능성을 보여준다.
주택 시장은 수요와 공급의 불균형으로 인해 여러 개의 하위 시장으로 구분되며, 하위 시장은 주택의 특성 뿐만 아니라 근린과 같은 주변 환경을 총체적으로 고려하여 구획화되므로 공간적 영향력이 중요하다. 주택 시장을 구획화하는 기준은 주택의 특성, 가격 등 다양하나, 주택 수요를 기반으로 구획화할 경우 주택 정책을 수립하는데 활용할 수 있으며, 정책의 효율성을 증대시킬 수 있다는 점에서 큰 장점이 있다. 본 연구에서는 서울의 주택 시장을 대상으로 공간적 영향력을 고려한 장래 주택 수요를 추정하고, 수요에 기반하여 주택 시장을 공간적으로 세분화함으로써 국지적 주택 수요 시장을 새롭게 정의하고, 장래의 수요 시장이 어떻게 변화할지를 살펴본다. 분석 결과, 서울의 장래 수요 기반 주택 시장은 총 10개로 구분될 수 있으며, 단기적으로 는 공간적 변화가 있을 것으로 보이지만, 장기적으로는 안정적인 하위 시장을 형성할 것으로 전망된다. 본 연구는 서울의 주택 시장을 가격이 아닌 수요의 관점에서 세분화를 시도하였다는 점에서 의의가 있으며, 하위 시장의 공간적 패턴이 장래에 어떻게 변화할지에 대한 유의미한 전망을 제공함으로써 향후 주택 정책 방향 수립에 중요한 자료로 활용될 수 있을 것으로 기대된다.
본 연구는 수수를 대상으로 수수 주산지에서 취득한 무인기 기반 RGB영상에 Seg-Net과 U-Net모델을 작성 후, 일반화 가능성을 검토하여 실시간 재배지 파악에 더 효율적인 기법을 제안하기 위해 수행되었다. 경상북도 안동시의 수수 재배지 영상 264장을 이용해 모델학습을 진행하고, 충청북도 제천시 수수 재배지 영상 14장을 이용하여 테스트를 진행하였다. U-Net의 학습은 14epoch, AccuracyC = 0.9426, LossC = 0.1593, Dice_coefC = 0.9223, AccuracyV = 0.6403, LossV = 1.9624, Dice_coefV = 0.6402에 4시간 37분이 소요되었으며, Seg-Net의 학습은 101epoch, AccuracyC = 0.6363, LossC = 0.6573, Dice_coefC = 0.5586, AccuracyV = 0.5711, LossV = 0.6785, Dice_coefV = 0.5586이며 1시간 55분이 소요되었다. Test결과 U-Net은 AccuracyT = 0.6806, LossT = 0.7180, Dice_coefT = 0.5558, Seg-Net은 AccuracyT = 0.7472, LossT = 0.5225, Dice_coefC = 0.6159로 나타났다. Seg-Net의 Calibration성능은 낮지만 일반화 성능이 뛰어나며, 모델의 빠른 학습 시간, 더 낮은 메모리 요구량으로 수수 재배지 분할에서 U-Net보다 효율적인 모델이라고 사료된다.
2022년 국내에서 이태원 참사라는 대형 인파사고가 발생한 이래로 인파밀집 현상이 수시로 발생하고, 인파가 이동할 수 있는 방향이 한정되어 있는 도시철도 역사내 대기공간의 인파밀집 문제가 심각하게 대두됨에 따라 인파밀집에 대한 모니터링 및 관리에 대한 중요 성이 커졌다. 이러한 문제사항을 해결하기 위해 영상분석에서 개별 객체의 수를 파악하여 인파의 밀집도를 파악한 연구들은 많이 이 루어졌으나 객체 간의 중첩으로 인해 검지 정확도가 떨어진다는 단점이 존재한다. 따라서 본 연구는 개별 객체를 검지하는 방식이 아 닌 Semantic Segmentation 기법 중 사전에 라벨링이 된 이미지들을 활용하는 지도학습 방식을 사용하여 밀집된 인파의 영역과 그렇지 않은 영역을 구분하고, 관심영역(ROI) 전체 공간 대비 인파가 차지하고 있는 영역의 점유율을 산출하여 혼잡도를 파악하는 방법을 적 용하였다. 본 연구의 목적은 도시철도 역사 내 대기공간의 인파의 밀집도를 점유율을 이용하여 산출하는 방법론을 만들고, 이를 혼잡 도를 나타내는 지표(MOE)로 적용할 수 있도록 그 기준을 검토하는 것이다. 데이터수집의 경우, 첨두시간대에 지하철 2호선 교대역의 대기공간인 대합실을 촬영한 CCTV 영상 데이터를 확보하여 이를 10fps 단위로 분할한 이미지들을 사용하였다. 이후 각 서비스수준별 (LOS A~F)로 다양한 이미지들에 대하여 인파에 해당하는 부분과 그렇지 않은 부분을 라벨링하였다. 분석방법론의 경우, 지도학습 기 반의 Semantic Segmentation 기법을 적용하여 대상 이미지들 전체에 대해서 인파와 인파가 아닌 부분을 구분하도록 이미지를 가공하였 으며, 이미지에 ROI를 설정하여 “전체 ROI 대비 인파 점유 공간의 비율”에 해당하는 점유율을 계산하였다. 여기서 인파와 인파가 아 닌 부분의 원활한 구분을 위해 픽셀 단위로 학습을 하며, 사전에 라벨링이 된 이미지들을 학습하는 모델을 적용하는게 본 연구에 적 합하다고 판단하여 해당 분석 기법을 사용하였다. 모든 이미지들의 점유율을 도출한 후 전체 결과를 Classification 기법을 활용하여 인 파 혼잡도의 서비스수준을 나타내는 현행 지침과 동일하게 6단계로 구분하였으며, 각 단계를 구분하는 경계값에 해당하는 점유율 역 시 도출하였다. 최종적으로 분할된 이미지들을 합쳐 영상에서 연속적인 인파분석 기법을 적용할 수 있도록 하였다. 향후에는 test dataset을 할용하여 해당 인파분석 기법의 적정성을 검토할 예정이며, 객체 검지 방식을 사용하는 기존의 모델과 성능을 비교하여 해당 기법의 우수성을 검토할 예정이다. 본 연구가 새로운 방식의 인파 혼잡도의 서비스수준 기준을 제공하는 모델을 개발하는 것을 목적 으로 함에 따라 실제 현장에 이 방법론을 적용할 시 인파밀집사고 예방 및 관리에 기여할 수 있을 것이다.
Block pavements are widely used in various infrastructures, offering durability and aesthetic appeal. However, assessing their condition through manual methods is resource-intensive and subjective. This study proposes a deep learning approach using the Hybrid TransUNet model to enhance the accuracy and efficiency of detecting block pavement distresses. A dataset of over 10,000 images was used to train and test binary and multiclass segmentation models, significantly improving detection accuracy. The results show that the Hybrid TransUNet model outperforms other models, though challenges in detecting certain distress types like cracks persist.
이미지 분석을 통한 재료의 상 구분은 재료의 미세구조 분석을 위해 필수적이다. 이미지 분석에 주로 사용되는 마이크로-CT 이미 지는 대체로 재료를 구성하고 있는 상에 따라 회색조 값이 다르게 나타나므로 이미지의 회색조 값 비교를 통해 상을 구분한다. 순환골 재의 고체상은 수화된 시멘트풀과 천연골재로 구분되는데, 시멘트풀과 천연골재는 CT이미지 상에서 유사한 회색조 분포를 보여 상 을 구분하기 어렵다. 본 연구에서는 Unet-VGG16 네트워크를 활용하여 순환골재 CT 이미지로부터 천연골재를 분할하는 자동화 방법 을 제안하였다. 딥러닝 네트워크를 활용하여 2차원 순환골재 CT 이미지로부터 천연골재 영역을 분할하는 방법과 이를 3차원으로 적 층하여 3차원 천연골재 이미지를 얻는 방법을 제시하였다. 선별된 3차원 천연골재 이미지에서 각각의 골재 입자를 분할하기 위해 이 미지 필터링을 사용하였다. 골재 영역 분할 성능을 정확도, 정밀도, 재현율 F1 스코어를 통해 검증하였다.
Consumption market research was conducted on gradually increasing vegetarians using various selection attributes. Factors were extracted to identify vegetarian selection attributes and to divide the study cohort into groups, continuous variables (health, animal welfare, eco-friendliness, religion, familiarity, convenience, stability, and cost) and categorical variables (age, marital status, vegetarian duration, and vegetarian frequency) were simultaneously subjected to two-step cluster analysis. Cluster 1 contained high proportions of 20-29 and 30-39 year-olds, which are MZ-generation age groups. A high proportion had a vegetarian duration of 1-3 years, and the popular reasons for vegetarian selection were animal welfare and eco-friendliness. Cluster 2 contained high proportions of 50-59 and 40-49 year-olds, and many in this cluster were married, and mean vegetarian duration was ≥15 years. In addition, significant differences were observed between Clusters 1 and 2 in terms of religion, health, familiarity, cost, stability, and convenience. This study should contribute significantly to predicting vegetarian consumers’ selection decisions and consumption behaviors and provide reliable marketing data for foodservice companies that develop vegetarian foods.