APro, developed by KAERI as a process-based total system performance assessment model, can simulate the radionuclide transport affected by thermal, hydraulic, mechanical and geochemical changes that may occurs in the engineering and natural barriers of a geological disposal system. APro targets a large-scale and heterogeneous 3D system that includes more than 10,000 boreholes located about 500 m underground and hundreds of fractures of different sizes distributed within an area of several km2. Simulating transport and reaction phenomena for such a system through the global implicit approach (GIA) may require considerable computational resources or be intractable in some cases. Therefore, APro adopts the sequential non-iterative approach (SNIA), one of the operator splitting (OS) methods, to separate the mass transport and reaction phenomena into independent problems. By using SNIA, the parallel computation performance in APro with multiple cores is expected to be improved. In this study, the effect of SNIA on the parallel computation performance was analyzed through a simple 1D reactive transport problem. Without SNIA, finite difference equations, discretized from the partial differential equations (PDEs) describing the reactive transport problem, have to be solved at once because all dependent variables are nonlinearly and spatially interconnected through reaction and mass transport terms. When the reaction and mass transport terms are separated through SNIA, the mass transport problem can be converted into independent linear equations for each chemical and the efficient linear system solver can be applied to each linear equation. In particular, since the reaction problem is changed to independent nonlinear equations for each node, the parallel computation performance can be greatly improved. To verify this, the 1D reactive transport problem was implemented in MATLAB, and SNIA and GIA were applied to solve the problem. As a result, there was no significant difference in results between SNIA and GIA for proper spatial and temporal discretization, which verified the accuracy of SNIA. In order to see the parallel computation performance, the calculation times for SNIA and GIA with increasing number of cores were measured and compared. As the number of cores increased, the SNIA calculation speed became faster than that of GIA, which verified that SNIA could improve parallel computation performance in APro. In the future, the effect of SNIA on the parallel computation performance will be verified for the numerical analysis of large-scale geological disposal systems.
High resolution reconstruction technology is developed to help enhance the spatial resolution of observational images for ground-based solar telescopes, such as speckle masking. Near real-time reconstruction performance is achieved on a high performance cluster using the Message Passing Interface (MPI). However, much time is spent in reconstructing solar subimages in such a speckle reconstruction. We design and implement a novel parallel method for speckle masking reconstruction of solar subimage on a shared memory machine using the OpenMP. Real tests are performed to verify the correctness of our codes. We present the details of several parallel reconstruction steps. The parallel implementation between various modules shows a great speed increase as compared to single thread serial implementation, and a speedup of about 2.5 is achieved in one subimage reconstruction. The timing result for reconstructing one subimage with 256×256 pixels shows a clear advantage with greater number of threads. This novel parallel method can be valuable in real-time reconstruction of solar images, especially after porting to a high performance cluster.
목 적 : 신호대 잡음비는 자기공명영상 장치의 성능과 영상의 질을 평가하기 위한 객관적인 정보를 제공하는 중요한 척도이며 이를 측정하기 위한 많은 방법들이 제안되고 있다. 그 중 두 영역 측정방법은 측정방법이 간단하고 시간이 짧기 때문에 가장 흔히 사용되고 있다. 본 연구에서는 다중채널코일과 병렬영상기법 적용 시 두 영역측정방법에 의해 산출된 신호대 잡음비의 정확성에 대해 알아보고자 하였다.
대상 및 방법 : 장비는 Philips 3.0T MRI(Achieva, Philips medical system, Netherlands)과 transmit receive head coil, SENSE 8 channel head coil을 사용하였으며 MR sequence는 spin echo T1, T2 강조영상을 사용하여 축상면으로 ACR phantom 영상을 획득하였다. Transmit receive head coil을 사용한 두 영역 측정방법, AAPM, NEMA, Philips에서 제안한 측정방법, 다중채널코일과 병렬영상기법 적용 시 두 영역 측정방법의 신호대 잡음비 측정 조건에 따라 T1, T2 강조영상을 각각 30번씩 획득하였으며 Image J를 사용하여 각 영상의 동일한 위치에서 ROI 크기를 10 mm2으로 하여 신호대 잡음비를 측정하였다.
결 과 : T1 강조영상의 경우 AAPM에서 제안한 방법이 가장 균일한 신호대 잡음비를 나타내었으며 transmit receive head coil을 사용한 두 영역 측정방법과 NEMA는 10% 내외의 상대 표준 편차를 가짐으로써 균질한 값을 보였다. 하지만 다중 채널 코일과 병렬 영상 기법을 적용한 두 영역 측정방법의 경우 20% 이상의 상대 표준 편차를 보여 각 실험마다 신호대 잡음비의 큰 차이를 나타내었고 NEMA와 transmit receive head coil을 사용한 두 영역 측정방법에 비해 신호대 잡음비를 측정한 각각의 영역에서 차이를 나타내었다. T2 강조영상의 경우 transmit receive head coil을 사용한 두 영역 측정방법, AAPM, NEMA, Philips 모두 10% 내외의 상대 표준 편차를 가져 균일한 SNR을 나타내었지만 다중채널코일과 병렬영상기법을 적용한 두 영역측정방법의 경우 20% 이상의 상대 표준 편차를 보여 신호대 잡음비의 차이를 나타내었다.
결 론 : 다중 채널 코일과 병렬 영상 기법 적용 시 잡음의 공간적, 통계적 분포에 영향을 미치기 때문에 두 영역 측정방법으로 산출한 신호대 잡음비는 정확성이 감소하게 된다. 따라서 다중 채널 코일과 병렬 영상 기법을 적용한 영상에서 좀 더 정확한 신호대 잡음비를 산출하기 위해 AAPM, NEMA, Philips에서 제안되는 방법을 이용해야 한다.
본 논문에서는 새로운 비중첩 영역 분할 기법을 바탕으로 한 병렬해석의 정확도 분석이 수행된다. Tak 등(2013)에 의해 제안된 이 방법에서 분할된 하위도메인들은 서로 중첩되지 않으며 계면요소(interfacial element)라 불리는 가상연결유한요소를 통해 서로 간의 관계가 결정된다. 이 접근법의 주요 장점은 영역 분할시 floating 도메인에서 발생할 수 있는 특이강성행렬(singular stiffness matrix)을 계면요소의 결합을 이용하여 가역행렬(invertible matrix)로 변환할 수 있다는 것과 기존의 FETI법에 비하여 해석시간과 스토리지(storage) 사용을 줄일 수 있다는 것이다. 반면에 3개 이상의 하위도메인들이 한 점에서 연결되는 경우를 의미하는 cross point에서는 해석의 정확도가 저하되는 경향이 나타났다. 따라서 본 논문에서는 새로운 비중첩 영역 분할기법에 대해 다양한 영역분할의 경우에 따라 발생하는 하나의 cross point에 접촉하는 하위도메인의 개수에 따른 정확도 분석이 수행되고 정확도가 저하되는 원인분석 및 대책이 논의된다.
GPU는 메모리 대역폭이 연산 속도를 결정하는 병목 지점이 된다. 즉, GPU 프로그래밍 시에는 불규칙적인 메모리 액세스나 다중 스레드들 사이에서의 서로 다른 명령 실행 분기가 발생하면 속도가 크게 저하되는 문제가 발생한다. 따라서 게임 엔진 충돌 처리용으로 사용되는 kd-tree와 같은 적응형 탐색(adaptive traverse) 기법은, 불규칙적인 메모리 액세스 및 서로 다른 명령 분기로 인해 지금까지 GPU 구조에 적합하지 않은 것으로 인식되어 왔다. 그러나 최근 NVIDIA의 Fermi 아키텍처의 등장과 함께 CPU에서처럼 GPU 다중 프로세서에도 캐시 메모리가 적용되고 있다. 본 논문에서는 이러한 새로운 GPU 아키텍처의 장점을 활용해서 충돌 처리 시간을 크게 줄일 수 있는 GPU 기반 kd-tree를 제안한다. 제안하는 GPU 기반 병렬 kd-tree는 체크 지점 65536 개에서 최근접 삼각형까지의 거리를 찾는 작업이 Fermi 아키텍처(캐시 적용) 기반에서 단일 코어 CPU 기반 kd-tree에 비해 평균 백 만 배 이상(1.0x106) 빨라졌으며, 이전 세대 Tesla 아키텍처(캐시 미적용) 기반 병렬 kd-tree에 비해서도 약 50 배 가까이 빠른 속도를 보였다.
This paper is concerned with finding the global optimal solutions for the redundancy optimization problems in series-parallel systems related with system safety. This study transforms the difficult problem, which is classified as a nonlinear integer problem, into a 0/1 IP(Integer Programming) by using binary integer variables. And the global optimal solution to this problem can be easily obtained by applying GAMS (General Algebraic Modeling System) to the transformed 0/1 IP. From computational results, we notice that GA(Genetic Algorithm) to this problem, which is, to our knowledge, known as a best algorithm, is poor in many cases.
본 논문에서는 안동댐 조정지에서 낙동강 하구 사이의 낙동강 구간에 대하여 4대강 사업에 의한 하도 준설과 보(수문) 건설이 낙동강 본류의 하류 측 홍수위에 미치는 영향을 분석하였다.
하도의 홍수추적 모형인 HEC-RAS(River Analysis System) 4.1.0 Version 부정류 알고리즘을 이용하여 하도준설 전·후에 대한 각각의 계산 모형을 구축하였고, 2011년 5월에서 7월 사이 홍수사상을 대상으로 각 보 및 주요 수위표 지점에서 관측수위와 수문완전개방(Full Open Gate) 상태의 홍수위를 비교하여 검증하였다.
하도준설 후 모형에서는 HEC-RAS 모형 내의 Rule Operation 기법을 적용하여 보의 상류 및 상류 수위표의 수위에 따른 가동보 수문을 개방하는 4가지 운영방안을 제시하였고 주요 지점별 수문운영 조건에 따른 수위수문곡선 그리고 계획홍수위, 관리수위, 운영조건, 수문완전개방 상태를 비교한 수위곡선 마지막으로 낙동강 전 구간에 대한 수문운영 및 수문완전개방 그리고 수문운영 및 계획홍수위의 홍수위를 비교하였다.
In this study, an optimization technique was developed from the application of allocation rule. The results obtained from the water supply analysis and reliability indices analysis of Andong dam and Imha dam which are consist of parallel reservoir system are summarized as the followings;
Allocation rule(C) is effective technique at the parallel reservoir system because results of the water supply analysis, storage analysis and reliability indices analysis is calculated reasonable results. Also, reliability indices analysis results are not sufficient occurrence based reliability or quantity based reliability. Thus reliability indices analysis are need as occurrence based reliability, quantity based reliability vulnerability, resilience, average water supply deficits and average storage. And water supply condition is better varying water supply condition than constant water supply condition.