딥러닝을 이용한 망막혈관 추출: 새로운 DirectNet 구조
목적: 본 연구는 망막 영상의 혈관 분할을 위한 새로운 심층 인공 학습 시스템을 구축하는데 목적이 있 다. 기존 CNN (Convolutional Neural Network) 아키텍처를 제시하고, CNN 방식을 토대로 성능을 개선한 DirectNet을 고안하는데 있다. 특히, 기존 CNN에 비해 처리 시간을 크게 단축시키는데 있다.
방법: 제안된 DirectNet 아키텍처는 피라미드 형식의 블록(Block)들로 구성되며 각 블록은 컨볼루션레이 어 (Convolution layer) 묶음을 포함한다. 하나의 블록은 학습 결과를 보존(저장)하는 단위이다. 블록들은 순차적으로 하나씩 증가하며 피라미드 형식으로 쌓이게 되고 이를 통해 초기 학습 결과가 소멸되지 않고 최종 분석에 활용될 수 있도록 하였다. DirectNet은 패치(Patch) 추출과 Pooling 과정 없이 이미지를 학습하여 학습 층을 거듭하여도 원본 이미지와 동일하게 유지되는 것이 특징이다. 또한 다양한 커널사이즈를 활용 하되 Depthwise Separable Convolution(DSC)을 활용하여 색을 구성하는 RGB(Red, Green, Blue)픽셀로 부터 혈관 모양을 인식 및 탐지한다.
결과: DirectNet은 최첨단 패치 기반 CNN 접근 방식 (0.9538 vs 0.9327, 0.7851 vs 0.7346, 0.9782 vs 0.9730, 0.8458 vs 0.7987)과 비교하여 더 높은 정확도, 감도, 특이도 및 정밀도 값을 제공하였다. Direct Net의 학습 시간은 8시간에서 1시간, 테스트에 소요된 시간은 1시간에서 이미지 당 6초로 크게 단축하였다.
결론: 제안 된 심층 학습 아키텍처는 기존의 CNN 방식으로 진행한 학습 시간에 비해 8배, 테스트에서 600배 빠른 속도로 결과를 제공한다. DirectNet은 CNN에 비해 2.11%의 약간 높은 정확도를 보였으며, 다 른 측정 항목에서도 동등하거나 그 이상의 결과를 보여 분석 시간 효율을 크게 높였다.
Purpose : The aim of this study is to develop a novel deep learning system for vessel segmentation of retinal images. We present a recurrent Convolutional Neural Network (CNN) architecture and compare performance with existing CNN approaches, showing greatly reduced processing time with excellent performance.
Methods : The proposed DirectNet architecture is composed of blocks, with each block containing a collection of convolutional layers. Blocks are stacked up in a pyramid, such that the number of blocks is increased by one at each level. Data are repeatedly processed by each block and combined with outputs of other blocks. This recurrent structure combined with the use of large kernel avoids the need for up- or downsampling layers, thus creating a direct pixel-to-pixel mapping from pixel inputs to the outputs of segmentation.
Results : DirectNet provides higher accuracy, sensitivity, specificity, and precision values compared to a state-of-the-art, patch-based CNN approach (0.9538 vs 0.9327, 0.7851 vs 0.7346, 0.9782 vs 0.9730, 0.8458 vs 0.7987). Training time on a standard dataset for DirectNet is reduced from 8 hours to 1 hour, and testing time per image is greatly reduced from 1 hour for the patch-based method to 6 seconds for our method.
Conclusion : The proposed deep-learning architecture is eight times faster for training and 600 times faster for testing at slightly higher accuracy values than a state-of-the-art method. Segmentation successfully highlights retinal blood vessels of large down to small sizes.