GPU는 메모리 대역폭이 연산 속도를 결정하는 병목 지점이 된다. 즉, GPU 프로그래밍 시에는 불규칙적인 메모리 액세스나 다중 스레드들 사이에서의 서로 다른 명령 실행 분기가 발생하면 속도가 크게 저하되는 문제가 발생한다. 따라서 게임 엔진 충돌 처리용으로 사용되는 kd-tree와 같은 적응형 탐색(adaptive traverse) 기법은, 불규칙적인 메모리 액세스 및 서로 다른 명령 분기로 인해 지금까지 GPU 구조에 적합하지 않은 것으로 인식되어 왔다. 그러나 최근 NVIDIA의 Fermi 아키텍처의 등장과 함께 CPU에서처럼 GPU 다중 프로세서에도 캐시 메모리가 적용되고 있다. 본 논문에서는 이러한 새로운 GPU 아키텍처의 장점을 활용해서 충돌 처리 시간을 크게 줄일 수 있는 GPU 기반 kd-tree를 제안한다. 제안하는 GPU 기반 병렬 kd-tree는 체크 지점 65536 개에서 최근접 삼각형까지의 거리를 찾는 작업이 Fermi 아키텍처(캐시 적용) 기반에서 단일 코어 CPU 기반 kd-tree에 비해 평균 백 만 배 이상(1.0x106) 빨라졌으며, 이전 세대 Tesla 아키텍처(캐시 미적용) 기반 병렬 kd-tree에 비해서도 약 50 배 가까이 빠른 속도를 보였다.
구조물이 점점 더 커짐에 따라 그들을 분석하고 설계하는 것이 더 복잡해지고 더 많은 시간이 요구된다. 현재 사용되는 단일 프로세서를 가진 컴퓨터는 그와 같은 구조물을 해석하기에 효율적이지 못하다고 여겨진다. 이 논문에서는 거대규모의 구조물을 분석하기 위하여 컴포넌트 모우드법(CMM)과 메시지전달 시스템(MPI)을 이용함으로써 표준 병렬기법과 고도로 효율적이고 이식성 있는 프로그램을 새로 개발하였다. 이 연구에서는 구조물의 동적 해석을 위해 병렬처리기법을 지닌 컴퓨터 프로그램이 제시되고 새로 개발된 프로그램이 신뢰도를 갖고 있다는 것이 입증된다. 또한 이 프로그램은 상업용 프로그램보다 훨씬 처리속도가 빠르고 병렬처리 컴퓨터에서도 사용될 수 있다는 것을 보여준다.
지금까지 분포형 모형은 개념적 모형에 비해 운동역학적인 이론에 근거하여 물의 흐름을 수치해석으로 추적해 나가기 때문에 많은 컴퓨터 메모리용량이 요구되고 계산수행시간이 상대적으로 오래 걸리는 단점이 있었다. 그래서 분포형모형의 적용은 주로 소유역에 국한되어 적용되어왔으며, 대유역에 적용하기 위해서는 격자의 해상도를 낮추거나 소유역 적용과 동일한 해상도에서는 계산 시간이 많이 소요되어 실무적용을 어렵게 하는 요인이 되어왔다. 이에 대해 본 연구에서는 MPI
본 논문에서는 최근 경향의 3D 그래픽 프로세서 아키텍처를 분석하여 모바일 환경에 적합한 프로세서 및 명령어 형식을 제시한다. 또한 모바일 환경에서의 3D 그래픽스 표준안인 OpenGL ES 2.0 명세에 따르는 컴파일 방식을 바탕으로 온/오프라인 방식의 세이더 프로그램 컴파일 구조 및 방법을 제시하고, 모바일 환경에 적합성을 고려한 다중 명령어 기반의 코드 생성 방법과 새로운 ILP(Instruction-Level Parallelism) 최적화 기법을 제시한다. 본 논문에서 제시하는 컴파일 구조 및 기법을 통하여 생성된 세이더 명령어는 동일한 코어 클럭을 가지는 프로세서에서 단일 명령어 기반 코드보다 약 1.5~2배 빠른 연산 처리결과를 보여준다.