인공지능(AI)은 20년 이상 게임 분야에 널리 적용되어 왔다. 그러나 협동(coordination) 게임에서의 AI 에이전트, 특히 경주 게임에서 협동에 대한 연구는 상대적으로 적은 주목을 받아왔다. 이러한 관심의 부족은 불완전한 파트너를 충분히 보완하면서 사용자의 게임 플레이 경험 과 수행 능력 을 저해하지 않아야 하는 복잡성에서 부분적으로 기인한다. 우리는 경주 게임에서 협동 에이전트 의 잠재력을 탐구하고 밝히기 위해, 자동차 컨트롤을 두 개의 서로 다른 에이전트로 나눔으로써 협동 환경을 갖춘 자동차 경주 게임을 개발하였다. 이어서 실험을 통해 다양한 훈련 방법과 파트 너의 정보를 활용하여 에이전트와 파트너의 협동을 평가하였다. 특히, 학습 시 서브-옵티멀 파트 너와 함께하는 것과 에이전트를 해당 파트너에게 맞게 개인화하는 것의 영향을 조사하였다. 연구 결과, 불완전한 파트너와 훈련했을 때 성능이 2%에서 7%까지 향상되었으며, 파트너에게 맞게 개 인화했을 때는 모든 파트너에게 일반화한 경우보다 최대 3점(6.7%)까지 성능이 향상하였다. 본 연구를 통해, AI 에이전트를 개인화하는 것의 잠재력을 보여주었고, 에이전트가 파트너의 불완전 함을 인지하는 것의 장점을 확인하였다. 본 연구가 협 동 게임에서 개인화된 에이전트 연구에 이 바지하기를 기대한다.
실시간 전략 시뮬레이션 게임에서 각각의 팀은 다수의 에이전트로 구성하고 상태 팀을 이기기 위한 전략을 수행한다. 전략은 팀에 속한 에이전트들의 협력을 필요로 하며 이를 위해서는 다중 에이전트 시스템이 필요하다. 다중 에이전트 시스템의 의사 결정방법 중에서 중앙 집중적인 의사 결정 방법은 조정 에이전트를 사용해서 팀을 위한 작업을 선택한다. 비 중앙 집중적인 의사 결정 방법은 에이전트가 각각 주체가 되어서 다른 에이전트와 의사소통을 하기 때문에 비용이 많이 든다. 본 논문에서는 조정 에이전트를 사용할 때 다수의 에이전트를 그룹으로 관리하는 방법, 경매 시스템을 사용해서 에이전트에게 작업을 할당하는 방법 그리고 할당한 작업 중에서 수행에 실패한 작업은 다른 에이전트에게 다시 할당방법을 제안한다. 실험에서는 스타크래프트 게임에서 제안한 시스템을 적용할 때 공격력과 방어력이 향상되는 것을 볼 수 있었다. 제안한 방법을 사용한 에이전트의 팀 승리 비율은 8대 2로 높아졌다.
게임과 같은 실시간이며 복잡한 다중 에이전트 환경에서는 시스템의 효율성을 극대화하기 위해 반복적으로 작업 할당이 수행된다. 본 논문에서는 실시간 다중 에이전트 구조에 적합하며 최적화된 작업 할당이 가능한 방안으로 A* 알고리즘을 적용한 조정 에이전트를 제안한다. 제안하는 조정 에이전트는 수행 가능한 에이전트와 할당 가능한 작업으로 정제된 모든 에이전트와 작업의 조합으로 상태 그래프를 생성하고, A* 알고리즘을 이용한 평가함수를 적용하여 최적화된 작업 할당을 수행한다. 또한 실시간 재 할당에 따른 지연을 방지하기 위해 그리디 방식을 선택적으로 사용함으로써 재할당 요구에 대한 빠른 처리가 가능하다. 마지막으로 모의실험을 통해 조정 에이전트를 통한 최적화된 작업 할당 결과가 그리디 방식의 작업 할당보다 성능이 25%향상되었음을 입증한다.