검색결과

검색조건
좁혀보기
검색필터
결과 내 재검색

간행물

    분야

      발행연도

      -

        검색결과 11

        1.
        2017.09 KCI 등재 구독 인증기관 무료, 개인회원 유료
        This paper suggests a visual debugging plaftorm based on the game engine, Unity3D for massive parallel processing routines implemented in CUDA. In general, it is tiresome to debug or check the accuracy of numerical geometry information results calculated in a parallel way by GPU; usually, developers would pick and check each numerical value by rummaging overwhelming lines of seemingly meaningless numbers. This manual process is less productive and time-consuming. Also, it is not easy to produce some continuous movements of geometry information to check the validity of implemented CUDA codes for realtime geometry processing applications. To solve those problems, this paper presents a way to use Unity3D game engine to visually and interactively debug CUDA implementations. Also, some practical test results are presented with discussions on limitations of Unity3D as a CUDA debugging platform.
        4,000원
        2.
        2014.09 KCI 등재 구독 인증기관 무료, 개인회원 유료
        This paper presents a parallel kd-tree traversal algorithm based on the parallel binary radix tree construction scheme proposed by Tero Karras in 2012. In his paper, Tero Karras proposed parallel tree construction algorithm which can maximize the utilization of GPU threads, but implementation and analysis of kd-tree are not fully discussed. This paper aims to fill the gap for the specific kd-tree cases. As an application for the kd-tree traversal method proposed in this paper, the proposed method has been implemented with NVIDIA’s CUDA framework and tested on NVIDIA’s realtime raytracing library, OptiX. As a result, the proposed method can construct tree structures within the requirement for realtime process, but still needs specialized spatial caching data structure like the “primitive tree” for highly detailed meshes to handle spatial queries as fast as to visualize implicit surfaces under OptiX framework. However, the proposed method can be applied to dynamic collision detection and manage scene and object information for game applications thanks to its fast tree construction process. Also, realtime raytracing can be applied to game applications based on this study.
        4,000원
        3.
        2012.06 KCI 등재 구독 인증기관 무료, 개인회원 유료
        GPU는 메모리 대역폭이 연산 속도를 결정하는 병목 지점이 된다. 즉, GPU 프로그래밍 시에는 불규칙적인 메모리 액세스나 다중 스레드들 사이에서의 서로 다른 명령 실행 분기가 발생하면 속도가 크게 저하되는 문제가 발생한다. 따라서 게임 엔진 충돌 처리용으로 사용되는 kd-tree와 같은 적응형 탐색(adaptive traverse) 기법은, 불규칙적인 메모리 액세스 및 서로 다른 명령 분기로 인해 지금까지 GPU 구조에 적합하지 않은 것으로 인식되어 왔다. 그러나 최근 NVIDIA의 Fermi 아키텍처의 등장과 함께 CPU에서처럼 GPU 다중 프로세서에도 캐시 메모리가 적용되고 있다. 본 논문에서는 이러한 새로운 GPU 아키텍처의 장점을 활용해서 충돌 처리 시간을 크게 줄일 수 있는 GPU 기반 kd-tree를 제안한다. 제안하는 GPU 기반 병렬 kd-tree는 체크 지점 65536 개에서 최근접 삼각형까지의 거리를 찾는 작업이 Fermi 아키텍처(캐시 적용) 기반에서 단일 코어 CPU 기반 kd-tree에 비해 평균 백 만 배 이상(1.0x106) 빨라졌으며, 이전 세대 Tesla 아키텍처(캐시 미적용) 기반 병렬 kd-tree에 비해서도 약 50 배 가까이 빠른 속도를 보였다.
        4,000원
        4.
        2007.06 KCI 등재 구독 인증기관 무료, 개인회원 유료
        다분야통합해석에 기반한 설계문제는 일반적으로 전체 설계과정에서 매우 큰 계산시간을 요구하며, 이러한 계산시간을 단축하기 위해 병렬처리시스템을 도입하는 것이 필수적이다. 그러나 다분야통합해석에 기존의 병렬처리기법을 적용하기 위해서는 해석에 필요한 모든 CAE 소프트웨어들이 병렬처리시스템의 모든 서버에 설치되어 있어야 하며, 이는 매우 큰 CAE 소프트웨어의 비용을 필요로 한다. 본 논문에서는 이러한 문제점을 해결하기 위해 가중치 기반 멀티큐 부하분산 알고리즘을 제안하였다. 제안된 알고리즘은 서버들의 성능과 설치된 CAE 소프트웨어들의 종류가 각기 다른 이종 병렬처리시스템을 고려하였으며 성능검증을 위해 선입선출(First Come First Servre) 알고리즘을 적용한 경우와 비교한 전산실험을 수행하였다.
        4,000원
        5.
        2001.06 KCI 등재 구독 인증기관 무료, 개인회원 유료
        구조물이 점점 더 커짐에 따라 그들을 분석하고 설계하는 것이 더 복잡해지고 더 많은 시간이 요구된다. 현재 사용되는 단일 프로세서를 가진 컴퓨터는 그와 같은 구조물을 해석하기에 효율적이지 못하다고 여겨진다. 이 논문에서는 거대규모의 구조물을 분석하기 위하여 컴포넌트 모우드법(CMM)과 메시지전달 시스템(MPI)을 이용함으로써 표준 병렬기법과 고도로 효율적이고 이식성 있는 프로그램을 새로 개발하였다. 이 연구에서는 구조물의 동적 해석을 위해 병렬처리기법을 지닌 컴퓨터 프로그램이 제시되고 새로 개발된 프로그램이 신뢰도를 갖고 있다는 것이 입증된다. 또한 이 프로그램은 상업용 프로그램보다 훨씬 처리속도가 빠르고 병렬처리 컴퓨터에서도 사용될 수 있다는 것을 보여준다.
        4,000원
        6.
        1999.06 KCI 등재 구독 인증기관 무료, 개인회원 유료
        본 연구는 개별 메모리를 갖는 소결합 구조의 MIMD형 병렬컴퓨터인 트랜스퓨터시스템 하에서 구조최적화를 위한 병렬처리 과정을 보이고 시험모델에 적용하여 타당성 및 효율성을 검증한다. 전체 최적화과정의 대부분을 차지하는 해석 및 민감도 알고리즘은 영역단위의 병렬성을 갖는 부구조화에 근거하고 하드웨어 구성에 맞춰 변환 재구성한다. 각 노드간 통신은 정적응축과 설계도함수에 한정, 그 횟수를 최소화하고 그들을 동기화하므로써 개별메모리형 연산모델의 약점인 통신비용의 문제를 해소한다. PC를 호스트로 한 수치실험은 고속화 효율성 면에서 고무적인 결과를 보여주고 있으며, 이런 점에서 시스템의 확장성을 함께 고려한다면 트랜스퓨터 시스템에 기초한 병렬처리는 공학 환경의 변화와 요구에 부응하는 좋은 대안이 될 수 있다.
        4,000원
        7.
        1995.08 KCI 등재 구독 인증기관 무료, 개인회원 유료
        제어전용 마이크로 프로세서와 PC간에, 본 연구에서 제안하는 이중 포트 램을 이용한 병렬처리 방식으로 하드웨어를 설계 제작하고, 제어응답실험을 행한 결과 기존의 범용 A/D & D/AC 카드로 수행하기 어려웠던 2개 이상의 제어 대상을 제어하고 모니터링 하는 작업을 원활히 수행할 수 있음을 확인하였다
        4,000원
        8.
        2010.10 KCI 등재 서비스 종료(열람 제한)
        논문은 GPU를 이용한 무리 짓기에 대한 병렬 알고리즘을 제안한다. 이를 위하여 GPU의 병렬처리 구조로 CUDA를 사용하였으며, 그것의 특성 및 제한 요소들을 분석하였다. 이의 특성 및 제한 요소를 기초로 무리 짓기에서 가장 많은 비용을 요구하는 이웃 에이전트들을 찾는 것을 병렬화 함으로써 성능을 개선하였다. 제안된 알고리즘을 GTX 285상에서 구현하였고, 그것의 성능을 실험적으로 기존의 공간분할 알고리즘과 비교하였다. 비교의 결과는 제안된 알고리즘이 실행 시간 관점에서 최대 9배 정도 우수하다는 것을 보였다.
        9.
        2010.08 KCI 등재 서비스 종료(열람 제한)
        지금까지 분포형 모형은 개념적 모형에 비해 운동역학적인 이론에 근거하여 물의 흐름을 수치해석으로 추적해 나가기 때문에 많은 컴퓨터 메모리용량이 요구되고 계산수행시간이 상대적으로 오래 걸리는 단점이 있었다. 그래서 분포형모형의 적용은 주로 소유역에 국한되어 적용되어왔으며, 대유역에 적용하기 위해서는 격자의 해상도를 낮추거나 소유역 적용과 동일한 해상도에서는 계산 시간이 많이 소요되어 실무적용을 어렵게 하는 요인이 되어왔다. 이에 대해 본 연구에서는 MPI
        10.
        2009.04 KCI 등재 서비스 종료(열람 제한)
        메쉬 평탄화는 메쉬 표면의 잡음을 제거하는 것으로써 일반적으로 평탄화 필터를 적용하여 수행한다. 하지만 전체 과정이 CPU에서 수행되기 때문에 많은 실행 시간이 걸리는 문제점을 가진다. GPU는 부동소수점 연산에 특화되어 CPU에 비해 빠른 연산이 가능하기 때문에 복잡한 연산을 실시간으로 처리하는 것이 가능하다. 특히 메쉬 평탄화 과정은 메쉬의 각 정점이나 삼각형을 기반으로 같은 연산을 반복하기 때문에 GPU의 병렬 처리에 적합하다. 본 논문에서는 양방향 필터링에 GPU의 병렬 처리를 이용함으로써 메쉬 평탄화의 수행 시간을 줄이는 방법을 제안한다. 먼저 양방향 필터링을 위해 메쉬의 각 정점에 인접하는 삼각형들을 찾고 이들의 법선 벡터의 평균을 계산하여 정점들의 법선 벡터를 구한다. 양방향 필터링으로 각 정점의 새 위치를 계산하고 앞의 과정을 다시 수행하여 정점들의 새 법선 벡터를 계산한다.
        11.
        2008.05 KCI 등재 서비스 종료(열람 제한)
        본 논문에서는 최근 경향의 3D 그래픽 프로세서 아키텍처를 분석하여 모바일 환경에 적합한 프로세서 및 명령어 형식을 제시한다. 또한 모바일 환경에서의 3D 그래픽스 표준안인 OpenGL ES 2.0 명세에 따르는 컴파일 방식을 바탕으로 온/오프라인 방식의 세이더 프로그램 컴파일 구조 및 방법을 제시하고, 모바일 환경에 적합성을 고려한 다중 명령어 기반의 코드 생성 방법과 새로운 ILP(Instruction-Level Parallelism) 최적화 기법을 제시한다. 본 논문에서 제시하는 컴파일 구조 및 기법을 통하여 생성된 세이더 명령어는 동일한 코어 클럭을 가지는 프로세서에서 단일 명령어 기반 코드보다 약 1.5~2배 빠른 연산 처리결과를 보여준다.