대형 데이터셋을 활용한 대규모 실시간 생존 게임의 협업 네트워크 분석
본 논문에서는 대규모 실시간 매칭의 생존 게임에서 플레이를 위한 유저들의 소셜 관계에 대해 연구한다. 특 히 “사전 팀 구성”을 통한 자의적인 팀 구성이 어떤 방식으로 유저들을 연결하는 지 연구하고자 한다. 다수 의 사람 간 집단 역학에서 나타나는 특성이나 패턴에 대한 조사를 중심으로 하였으며, 개인의 특성은 보조적 인 수단으로만 사용된다. 이번 연구에서는 게임을 플레이하는 유저들의 익명화 된 대규모 데이터를 활용하며 이에 대한 간소화된 집계 방법을 제안한다. 데이터 세트에는 사전 팀 구성에 관한 11,259만 줄의 속성이 포 함되어 있으며, 데이터에서 우리는 250만개의 노드와 1,182만개의 무방향 에지가 있는 협업 네트워크를 구성 하여 대규모 게임 내 협동 네트워크를 만듭니다. 연결 정도, 경로 길이, 클러스터링 및 소속 하위 컴포넌트의 크기 등 네트워크에 관한 수치를 통해 게임내 소셜 활동에 대한 이해를 높이고자 한다. 본 논문에서는 다음 의 두가지 특성을 중심으로 결론을 제시한다. 첫째, 네트워크 내에는 대규모로 연결된 2개(전체의 44% 및 2%)와 나머지의 파편화된 하위 컴포넌트로 구성 되어있다. 이 대규모 컴포넌트 중 작은 쪽은 한국 유저로만 구성되어 있다. 둘째, 컴포넌트 크기 별 평균 연결 거리와 군집화 계수, k-core를 확인함으로써 기타 다른 네 트워크 대비 이웃 간 연결이 강하면서 전체적으로는 비교적 멀리 떨어져 있음을 확인한다.
In this study, the social relationships of users in large-scale, real-time matching survival games are investigated. Specifically, the study explores how voluntary team-ups through 'pre-made formation' facilitate connections among users. The primary focus is on the characteristics and patterns emerging from group dynamics among multiple individuals, using personal characteristics only as supplementary data. We employ anonymized, large-scale user data from these games and propose a simplified method for aggregating this data. Our dataset comprises 112.59 million rows of attributes related to 'pre-made teams'. From this data, we construct a network with 2.5 million nodes and 11.82 million undirected edges, representing a substantial in-game collaboration network. By analyzing network-related measures such as connection degree, path length, clustering, and the size of belonging subcomponents, we deepen the understanding of social activities within the game. This paper presents findings centered around two main observations: First, the network consists of two large-scale connected components (accounting for 44% and 2% of the total, respectively) and numerous fragmented subcomponents, with the smaller large-scale component predominantly comprising Korean users. Second, we observe that while connections between neighboring nodes are as strong as those in other collaboration networks, they are relatively more distant compared to other social networks.