논문 상세보기

심층 강화 학습을 활용한 게임 기능 테스트 자동화에 관한 사전 연구 KCI 등재

An Exploratory Study On Deep Reinforcement Learning-Based Automated Functional Game Testing

  • 언어KOR
  • URLhttps://db.koreascholar.com/Article/Detail/449691
구독 기관 인증 시 무료 이용이 가능합니다. 4,300원
한국컴퓨터게임학회 논문지 (Journal of The Korean Society for Computer Game)
한국컴퓨터게임학회 (Korean Society for Computer Game)
초록

게임 콘텐츠가 점점 복잡해짐에 따라 기존의 수동 테스트 및 스크립트 기반 테스트 방법 은 비용과 테스트 범위 측면에서 한계를 보이고 있다. 본 연구에서는 픽셀 수준의 시각 정 보만을 사용하여 게임의 그래픽 사용자 인터페이스(GUI)와 상호작용하는 딥 강화학습(DRL) 기반 자동 게임 테스트 에이전트를 제안한다. 제안된 에이전트는 ResNet18 기반 시각 인식 모듈과 Proximal Policy Optimization(PPO) 알고리즘을 결합하여, 게임에 대한 어떠한 선 해 정보 없이도 게임 내 장애물을 만났을 때 점프, 웅크리기, 벽 오르기와 같은 회피 방법 을 효과적으로 선택할 수 있다. 실험 결과, 제안된 에이전트는 다양한 장애물 구성 환경에 서 무작위 기준 모델 대비 더 높은 과제 성공률과 안정적인 학습 성능을 보였으며, 이를 통해 블랙박스 게임 환경에서 DRL 기반 자동 테스트의 실현 가능성을 입증하였다.

As game content becomes more complex, conventional manual and script-based testing methods face limitations in cost and coverage. This study presents a Deep Reinforcement Learning (DRL)–based automated game testing agent that interacts with a game’s graphical user interface (GUI) using only pixel-level visual inputs. By combining a ResNet18-based visual perception module with the Proximal Policy Optimization (PPO) algorithm, the agent handles in-game obstacles such as jumping, crouching, and wall-climbing without access to internal game code. Experimental results show that the proposed agent outperforms a random baseline in task success rate and learning stability across diverse obstacle configurations, demonstrating the feasibility of DRL-based automated testing in black-box game environments.

목차
ABSTRACT
요약
1. 서론
2. 관련 연구
    2.1 심층 강화학습 기반 자동화 테스트 연구 동향
    2.2 Black-Box, White-Box, Grey-Box 접근법 비교 분석
3. 장애물 극복 및 상호작용 에이전트
    3.1 PPO(Proximal Policy Optimization)와 ResNet18을 이용한 시각 기반 행동 결정
    3.2 프레임 스태킹 (Frame Stacking)
    3.3 다중 바이너리 공간
    3.4 보상(Reward) 설계
4. 실험 설계 및 평가 지표
    4.1 표준 실험 환경 구축 방안
    4.2 성능 평가 지표
    4.3 분석 결과
5. 결론
Acknowledgement
참고문헌

저자
  • 유승한(Department of Computer Engineering, Chosun University, Gwangju, Korea) | Seung Han Yu
  • 김동환(Department of Computer Engineering, Chosun University, Gwangju, Korea) | DongHwan Kim
  • 나민수(Department of Computer Engineering, Chosun University, Gwangju, Korea) | MinSoo Na
  • 김성기(Department of Computer Engineering, Chosun University, Gwangju, Korea) | SeongKi Kim Corresponding author