논문 상세보기

Urban Landscape Game Scene Sketch Generation Framework with Stable Diffusion KCI 등재

안정적 확산모델에 기반한 예술적 게임 배경도시 스케치 생성 프레임워크

  • 언어ENG
  • URLhttps://db.koreascholar.com/Article/Detail/430365
구독 기관 인증 시 무료 이용이 가능합니다. 4,000원
한국컴퓨터게임학회 논문지 (Journal of The Korean Society for Computer Game)
한국컴퓨터게임학회 (Korean Society for Computer Game)
초록

본 연구에서는Stable Diffusion 프레임워크를 활용하여 게임 스타일의 스케치, 특히 도시 장면을 생성하는 방법 을 소개한다. 확산 기반의 모델인Stable Diffusion은 쉬운 접근성과 뛰어난 성능으로 많은 연구자와 일반인들에 게 선호되며, 텍스트-스케치, 이미지-스케치의 생성이 가능하다. Stable Diffusion의 몇 가지 문제는 이미지의 국 소성 보존 문제 및 미세 조정인데, 이를ControlNet과DreamBooth를 사용하여 해결한다. 결과적으로, 본 연구를 통 해 게임 제작에 사용될 수 있는 텍스트-스케치, 이미지-스케치 생성이 가능하며, 더 나아가 아티스트를 돕는 툴 로도 활용될 수 있다.

Games are a vital part of our culture, leading the generation of tools such as Adobe Photoshop and Unity for game developers. Although sketches are a fundamental form that can be stylized in various ways, there is a scarcity of tools capable of generating images into sketch. To bridge this gap in the artistic sketch domain of gaming and the field of deep generative models, we propose a multimodal sketch generation framework with Stable Diffusion, focusing especially on urban scenes. Stable Diffusion, a model within the diffusion-based category, has gained notable attention in the open-source community and is user-friendly. Thus, we have chosen to utilize Stable Diffusion in our approach. This model processes input prompts and images through the CLIP encoder and effectively generates images. However, Stable Diffusion faces challenges such as a losing locality of input image and difficulties in fine-tuning. To overcome these issues, we incorporate ControlNet and DreamBooth into our framework. We conclude with a demonstration of promising results, urban landscape sketch, in both text-to-sketch and image-to-sketch generation.

목차
1. .Introduction
    1.1 GAN-Based Image Generation Methods
    1.2 Diffusion Model-Based Approach
2. Method
    2.1 Overview
    2.2 DreamBooth Fine-tuning
    2.3 Text-to-sketch
    2.4 Image-to-sketch
3. Conclusion
Reference
저자
  • Junho KIM(Dept. of Computer Science, Sangmyung Univ., 20, Hongjimun 2-gil, Jongno-gu, Seoul, Republic of Korea) | 김준호
  • Heekyung YANG(Dept. of Software, Sangmyung Univ., 31, Sangmyeongdae-gil, Dongnam-gu, Cheonan 31066, Republic of Korea) | 양희경 Corresponding author
  • Kyungha MIN(Dept. of Computer Science, Sangmyung Univ., 20, Hongjimun 2-gil, Jongno-gu, Seoul, Republic of Korea) | 민경하