최근 소규모 창업을 위한 상권분석, 지역 산업 수요 조사 등에 잠재적 서비스 인구 통계에 대한 수요가 점차 증가하고 있다. 하지만 센서스 조사와 같이 장기적 시간 간격을 두고 수행되는 방식으로는 현시성 있는 잠재적 서비스 수요를 파악하는데 한계가 있다. 개인의 모바일폰으로 수집되는 이동통신 빅데이터는 센서스 조사의 이러한 단점을 극복할 수 있으며, 실시간으로 변하는 지역 인구 분포와 유동성을 잘 보여줄 수 있다. 본 연구는 이동통신 빅데이터와 공간통계 기법을 이용하여 지역의 잠재적 서비스 수요인 현주인구를 추정하고자 한다. 이를 위해 먼저, 대구광역시를 사례로 한 민간 이동통신사가 제공하는 '서비스인구'의 성별, 연령별, 시간대별 분포 특성을 살펴보았고, 지역의 인구, 사회, 경제적 특성 변수에 기반한 일반회귀모델(OLS)과 공간회귀모델(SEM, SLM)을 이용하여 집계구별 현주인구를 추정하였다. 사례 분석 결과, 지역 특성을 반영하는 여러 통계 자료를 활용하여 해당 지역의 잠재적 서비스 수요 인구를 유의미하게 추정할 수 있었다. 또한 인구의 공간적 의존성을 명시적으로 반영하는 공간회귀모델이 현주인구를 추정하는데 가장 적합한 모델인 것으로 나타났다. 집계구 수준의 공간 단위에서 추정 오차도 유의미하게 작았으며, 연령별 현주인구의 추정값이 성별, 시간대별 현주인구에 비해 정확하게 산출되었다. 오차의 공간적 분포는 대체로 도심부에서 과대 추정이, 외곽 지역은 과소 추정이 나타났다. 이는 지역간 모바일폰 사용 행태와 이동성의 차이가 추정 정확성에 영향을 미칠 수 있음을 시사한다.
Recently, demand for statistics of the potential service population is increasing for the analysis of trade area for small business establishment and the investigation of regional industrial demands. The census is not appropriate for estimating a timely potential service population because the census survey is usually implemented at a regular long interval. Mobile telecommunications big data collected from individual’s mobile phone enables to overcome the shortcomings of the census and presents the real-time dynamics of regional population distribution and flow. This research attempts to estimate a de facto population as potential service demand of the region using a mobile telecommunications big data and spatial statistics. For doing this, we first examined the distribution of the ‘service population’ of Daegu metropolitan city in terms of gender, age, and temporal periods, which is provided by a commercial mobile telecom company. Then, we estimated a de facto population by census output area using OLS and spatial regression models based on a number of explanatory variables regarding population, social, and economic characteristics of the region. The empirical results show that a potential service population can be significantly estimated using regional statistical data and the spatial regression model with an explicit consideration of spatial dependency of population is the best fit for de facto population estimation. The estimation error is smallest in the level of the census output area and de facto population by age group is more accurately estimated than other population categories. For the spatial distribution of the estimation error, over-estimation has often occurred in central areas of the city and under-estimation has appeared in outer areas of the city. This might be led by the regional differentiation of mobile-phone usage and mobility.