본 연구는 수수를 대상으로 수수 주산지에서 취득한 무인기 기반 RGB영상에 Seg-Net과 U-Net모델을 작성 후, 일반화 가능성을 검토하여 실시간 재배지 파악에 더 효율적인 기법을 제안하기 위해 수행되었다. 경상북도 안동시의 수수 재배지 영상 264장을 이용해 모델학습을 진행하고, 충청북도 제천시 수수 재배지 영상 14장을 이용하여 테스트를 진행하였다. U-Net의 학습은 14epoch, AccuracyC = 0.9426, LossC = 0.1593, Dice_coefC = 0.9223, AccuracyV = 0.6403, LossV = 1.9624, Dice_coefV = 0.6402에 4시간 37분이 소요되었으며, Seg-Net의 학습은 101epoch, AccuracyC = 0.6363, LossC = 0.6573, Dice_coefC = 0.5586, AccuracyV = 0.5711, LossV = 0.6785, Dice_coefV = 0.5586이며 1시간 55분이 소요되었다. Test결과 U-Net은 AccuracyT = 0.6806, LossT = 0.7180, Dice_coefT = 0.5558, Seg-Net은 AccuracyT = 0.7472, LossT = 0.5225, Dice_coefC = 0.6159로 나타났다. Seg-Net의 Calibration성능은 낮지만 일반화 성능이 뛰어나며, 모델의 빠른 학습 시간, 더 낮은 메모리 요구량으로 수수 재배지 분할에서 U-Net보다 효율적인 모델이라고 사료된다.
산업의 발달로 인한 생활습관과 신체활동 부족 등으로 한국인의 비만인구가 급증하고 있다. 전산화단층 영상을 이용한 기존의 지방량 계산 프로그램에서 반자동방식의 프로그램이 사용되고 있다. 관련 문제를 해결하기 위한 방법들이 제시되고 있으나 본 연구에서는 모폴로지 연산을 이용한 알고리즘을 제시하고 절차가 간단하고 비교적 계산량이 적은 새로운 방법으로 문제를 해결하고자 한다. 모폴로지 연산을 통해 침식과 팽창을 반복한 결과 영상으로부터 문제점이 해결된 것을 알 수 있어 결과로부터 각 조직 간의 경계를 더욱 정교하게 얻을 수 있었다. LoG (Laplace of Gaussian) 함수를 이용해서 각 조직간 경계 부분을 분할하였다. 각 경계는 명확하게 구분이 되었으며, 피하지방을 계산하기 위해 충분한 정보를 제공하였다. 개발된 분할결과를 사용하여 향후 자동 지방량 계산을 할 수 있다. 정확한 분할 도구를 제공함으로써 의사에게 편리함을 주고 재검사로 인한 피폭과 검사비용을 줄이는데 도움이 될 것으로 판단한다.
This paper proposes a convolutional neural network model for distinguishing areas occupied by obstacles from a LiDAR image converted from a 3D point cloud. The channels of a LiDAR image used as input consist of the distances to 3D points, the reflectivities of 3D points, and the heights of 3D points from the ground. The proposed model uses a LiDAR image as an input and outputs a result of a segmented LiDAR image. The proposed model adopts refinement modules with skip connections to segment a LiDAR image. The refinement modules with skip connections in the proposed model make it possible to construct a complex structure with a small number of parameters than a convolutional neural network model with a linear structure. Using the proposed model, it is possible to distinguish areas in a LiDAR image occupied by obstacles such as vehicles, pedestrians, and bicyclists. The proposed model can be applied to recognize surrounding obstacles and to search for safe paths.
본 논문에서는 구면 영상에서 영역 분할 정보를 사용하여 바닥 영역을 검출하는 방법을 제시 한다. 평면 영상에서의 Watershed 영역 분할 방법을 수정하여 구면 영상의 영역 분할에 적용할 수 있도록 하였다. 영역들을 분할한 뒤 가정된 바닥 영역 픽셀의 색상과 질감을 그 외의 영역 들과 비교하여 바닥 영역을 검출한다. 구면 파노라마 영상에서는 구면 왜곡으로 인하여 평면에 서의 바닥 검출 방법을 그대로 적용할 수 없다. 구면 왜곡을 고려한 바닥 영역 검출을 위하여 바닥 영역의 외곽선을 검출하는 알고리즘을 설계하였다. 실험에서 지상물이 없는 경우와 있는 경우의 모두에서 적절하게 바닥 영역을 검출할 수 있는 결과를 보였다.
This paper proposes a method to segment urban scenes semantically based on location prior information. Since major scene elements in urban environments such as roads, buildings, and vehicles are often located at specific locations, using the location prior information of these elements can improve the segmentation performance. The location priors are defined in special 2D coordinates, referred to as road-normal coordinates, which are perpendicular to the orientation of the road. With the help of depth information to each element, all the possible pixels in the image are projected into these coordinates and the learned prior information is applied to those pixels. The proposed location prior can be modeled by defining a unary potential of a conditional random field (CRF) as a sum of two sub-potentials: an appearance feature-based potential and a location potential. The proposed method was validated using publicly available KITTI dataset, which has urban images and corresponding 3D depth measurements.
영상 워핑은 입력 영상을 주어진 조건에 적합하게 변형하는 기술로, 최근 영화나 애니메이션 분야에서 캐릭터의 얼굴 형상을 변형하는데 활용되고 있다. 얼굴 특징을 기반으로 형상을 변형하는 워핑 방법 가운데 하나인 메쉬 워핑은 입력 영상에서 눈, 코, 입 주변의 사각형 모양의 메쉬 그룹을 형성하여 1:1정합시킴으로써 워핑 영상을 생성하는 방법이다. 이는 메쉬 제어점 좌표에 오차가 있거나 작은 면적의 메쉬로 세분화되어 생성된 경우 메쉬들의 경계 선분에서 결과 영상이 일그러지는 문제점이 있다. 본 연구는 얼굴의 자연스러운 워핑 영상을 생성하는 과정에서 오류 발생을 최소로 하며 정확한 결과를 적은 연산량과 시간에 처리하기 위해 삼각형기반의 영상 보간 기법을 제안한다. 우선 얼굴을 대표하는 특징점들을 찾고 이들을 연결하여 기본 삼각형 메쉬를 구성한다. 제안하는 방법은 기존의 메쉬 워핑과 비교하여 연산 처리량과 시간은 단축되면서 워핑 과정에서의 오류 발생을 줄일 수 있음을 실험으로 보인다.
심근영상의 SPECT(Single Photon Emission Computed tomography)검사는 감마선을 방출하는 방사성의약품을 환 자에게 정맥주사한 후 이 의약품이 심장에 고루 퍼지면 관심부위를 촬영하여 질병으로 인한 변화를 컴퓨터를 이용하여 진단하는 검사법이다. 기능적인 정보를 담고 있는 심근관류 영상은 비침습적인 심근질환 검사에 유용한 방법이지만, 물리적 인자들에 의해 잡음과 낮은 해상도는 판도하는데 어려움을 주게 된다. 본 논문은 심근영상을 레벨 셋 알고리즘 을 이용하여 영상을 분할하고 분할된 영역을 3차원으로 구현하여 판독에 도움을 주는 방안을 제안하였다. 판독의 어려 움을 해결하기 위하여 레벨 셋을 이용하여 관심부위인 좌심실 영역을 분할하였고 분할된 영역을 3차원영상으로 모델 링하였다.