PURPOSES : This study aimed to predict the number of future COVID-19 confirmed cases more accurately using public and transportation big data and suggested priorities for introducing major policies by region. METHODS : Prediction analysis was performed using a long short-term memory (LSTM) model with excellent prediction accuracy for time-series data. Random forest (RF) classification analysis was used to derive regional priorities and major influencing factors. RESULTS : Based on the daily number of COVID-19 confirmed cases from January 26 to December 12, 2020, as well as the daily number of confirmed cases in Gyeonggi Province, which was expected to occur on December 24 and 25, depending on social distancing, the accuracy of the LSTM artificial neural network was approximately 95.8%. In addition, as a result of deriving the major influencing factors of COVID-19 through random forest classification analysis, according to the number of people, social distancing stages, and masks worn, Bucheon, Yongin, and Pyeongtaek were identified as regions expected to be at high risk in the future. CONCLUSIONS : The results of this study can help predict pandemics such as COVID-19.
PURPOSES : We propose a framework to evaluate the reliability of integrating homogeneous or heterogeneous mobility data to produce the various data required for greenhouse gas emission estimation. METHODS : The mobility data used in the framework were collected at a fixed time from a specific point and were based on raster data. In general, the traffic volume for all traffic measurement points over 24 h can be considered raster data. In the future, the proposed framework can be applied to specific road points or road sections, depending on the presence or absence of raster data. RESULTS : The activity data required to calculate greenhouse gas emissions were derived from the mobility data analysis. With recent developments in information, communication, and artificial intelligence technologies, mobility data collected from different sources with the same collection purpose can be integrated to increase the reliability and accuracy of previously unknown or inaccurate information. CONCLUSIONS : This study will help assess the reliability of mobility data fusion as it is collected on the road, and will ultimately lead to more accurate estimates of greenhouse gas emissions.
최근 3차원 공간정보와 행정정보를 융합하여 다양한 도시문제의 과학적 해결을 지원하는 디지털트윈이 공공분야의 스마트시티와 공간정보 행정업무에 도입되고 있다. 이 연구의 목적은 공공분야에 디지털트윈을 확산하기 위해 필요한 공간정보의 정책방향을 제시하는데 있다. 먼저, 이론적 고찰을 통해 디지털트윈에 대한 개념을 검토하였고, 언론보도 등에 나타난 디지털트윈에 대한 주요 키워드를 도출하였다. 두 번째, 디지털트윈 국가정책과 디지털트윈국토 지자체 시범사업, 공공기관의 디지털트윈 사업 특성을 고찰하였다. 세 번째, 정책 및 제도적 관점, 사업적 관점, 활용성의 관점에서 공공분야 디지털트윈이 어떠한 이슈와 문제점을 가지고 있는지 도출하였고, 이를 해결하기 위한 정책방향을 제안하였다. 이 연구의 결과는 향후 공공분야 디지털트윈 확산을 위한 정책적 시사점을 제공할 것이다.
This study examines the concept of Korean ethnicity by looking into how the Choseonjok, ethnic return migrants from China, are perceived in online news comments. Data were collected from 3,109 comments, which were written in response to 28 news articles regarding the Choseonjok, and analyzed using a Python-based text-mining technique and critical discourse analysis. The findings show that the commenters perceived the Choseonjok negatively, including as potential criminals or social vice. They not only placed the Choseonjok in an inferior position to pure Koreans but also excluded them from the category of compatriots, arguing that speaking the same language and sharing a similar appearance were not enough to make the ethnic return migrants Korean compatriots. This study critically demonstrates how a group of ethnic return migrants is depicted in online public discourses and how this portrayal can shed light on the conceptualization of Korean ethnicity in this era of multiculturalism.
빅데이터 분석을 통한 기업 경영환경에 대한 이해와 통찰을 구하고자 하는 요구가 산업 및 기업 경영 전반에 증가하고 있다. 이러한 사회적 요구에 따라 산업의 이해와 기업 경영의 이해를 위하여 기업의 경영실적 및 향후 계획을 포괄적으로 담고 있는 기업공시정보를 활용한 연구가 주목을 받고 있다. 이러한 기업공시정보는 대표적인 비정형 데이터로써 텍스트마이닝 방법론을 적용하여 그 범위와 수준에 대한 다양한 접근을 통하여 산업 수준 및 기업 수준에서 다양한 활용이 가능하다. 그러나 아직은 이러한 기업공시자료를 활용한 산업 및 기업 레벨에서 적용가능한 수준의 분석모델이 부족한 것으로 파악된다. 따라서 본 연구에서는 실제 활용 가능한 공개데이터를 활용한 산업 및 기업 수준의 분석모델을 제안하고자 한다. 미국상장기업의 공시자료인 미국 SEC EDGAR 자료를 기반으로 텍스트마이닝 알고리즘을 적용하여 산업 및 기업 수준의 경영주제(토픽)에 대한 추이분석이 가능한 모델을 제안하고자한다.
SEC EDGAR의 10-K 문서를 대상으로 LDA 토픽 모델링을 통하여 산업 수준에서 전체 산업의 주제분야 분류를 파악하였고, 산업간 비교 측면에서 소프트웨어 산업과 하드웨어 산업 분야의 사례를 통해 최근 20년간의 토픽추이를 비교분석 하였다. 또한 최근 20년간의 기업의 경영주제 변화를 소프트웨어 산업에 속한 2개 기업을 중심으로 살펴보았다. 이를 통해 산업 및 기업 수준에서의 경영주제의 추이 변화를 파악하여 쇠퇴 및 성장 추세에 있는 경영주제를 확인 할 수 있었다. 한편 word2vec 워드 임베딩 모델과 주성분분석을 통한 차원 축약을 통해 소프트웨어 산업분야의 기업 및 특정 제품(혹은 서비스)에 대한 매핑을 통해 유사한 경영주제(토픽)를 가지는 기업 및 제품(서비스)을 사례를 통해 파악하였으며, 이를 시간적 흐름에 따른 변화 양상도 관찰할 수 있었다.
본 연구의 목적이 공개데이터를 활용한 산업 및 기업 수준의 분석모델을 개발하기 위한 방법론을 제안한 측면에서, 해외 데이터를 사용하여 산업의 경영주제 변화 추이, 기업의 경영주제 변화 추이를 거시적으로 조망할 수 있는 실무적인 방법론의 제안에서 의의가 있을 수 있다. 한편 기업의 기술경영전략 측면에서 기업의 경영토픽의 잦은 변화, 경영주제의 변화의 속도 등 다양한 변화 양상의 차이에 따른 기업의 매출 등의 경영성과와의 연관성 분석, 실제 기업의 제품포트폴리오의 구성에 따른 기업 간의 경쟁상황 등을 파악하는 미시적 모델 제안을 위한 추가 연구가 요구된다.
목적 : 본 연구는 국가치매관리사업과 관련된 공공데이터를 수집하여 치매안심센터에서 시행되는 작업치료 의 비용편익분석을 통해 미래의 국가치매관리사업의 효율화 방안을 모색하고자 한다. 연구방법 : 2016년 1월부터 12월까지의 국가치매관리사업 관련 공공데이터를 정보공개 창구를 이용하여 수집하였다. 수집된 자료를 토대로 작업치료 비용편익분석을 위한 각종 변수를 정의하고, 빈도분석 및 산술계산으로 변수의 값을 산출했다. 결과 : 우리나라에서 서울은 모든 자치구에서 치매관리사업을 시행하고 있고, 사업수행인원 전원이 전담인력으로 배치되어 있다. 특히 작업치료 전담인력을 치매안심센터의 96.0%에 배치하여 치매안심센터 서비스에서 작업치료를 제공하고 있다. 치매안심센터에서 시행되는 작업치료의 순 편익은 작업치료 전담인력이 배치된 경우 서울에서 약 73억 원으로 산출되었다. 결론 : 서울과 같은 형태로 국가치매관리사업 사업을 확대하고, 작업치료 전담인력을 통한 프로그램 시행으로 치매관리비용을 절감하는 효과가 있을 것으로 기대된다. 치매 국가책임제 추진으로 치매관리사업이 국가 단위의 보건사업으로 발돋움하고 있는 지금 한정된 보건의료자원을 효율적으로 사용하기 위해서는 치매안심센터에서 작업치료의 확대가 필요할 것으로 보인다.
본 연구에서는 국가연구개발사업의 성과물로서 창출되는 특허정보의 거시적ㆍ미시적 분석을 통해 기술혁신 특성을 파악하고자 하였다. 특허성과의 기술군별 비중을 분석한 결과 국가연구개발사업이 IT계열 기술군으로 편중된 것으로 나타났다. 기술군별 상대적인용도지수(RCI)의 분석은 향후 BT계열 기술군이 부상할 것임을 시사하였다. 또한 상대적시장확보지수(RFI)는 BT계열 및 IT계열과 같은 기술적 파급이 큰 기술군에서 높은 것으로 나타났다. 기술 융ㆍ복합화, 연구개발 주체 간의 협력-개방 관계에 대한 신규지표를 설계하고, 네트워크 분석 기법을 활용하여 기술군 사이의 흡수-파생 관계, 연구개발주체 간의 협력-개방 관계를 분석하였다. 이종기술간 기술 융ㆍ복합화가 증가하고 있으며, 상이한 연구개발주체들 사이의 연구개발 협력성과가 급증하고 있는 것으로 나타났다.
최근 GIS는 특정 소프트웨어를 사용하던 환경에서 오픈소스 환경으로 변화하고 있다. 특히 포털사이트의 지도 API는 인터넷 연결만 가능하다면 누구나 사용할 수 있기 때문에 널리 활용되고 있다. 지도API는 단순히 매쉬업(mash-up)하여 사용하는 사례가 많았으나, 최근 다양한 시각화 기능을 제공하는 방향으로 발전하면서 데이터를 분석할 수 있는 가능성이 제기되고 있다. 본 연구는 구글API를 이용하여 공공데이터를 지리적으로 시각화하는 방법을 모색하고자 한다. 이를 위하여 서울시 1인가구를 주제로 관련 공공데이터를 수집하고 구글의 맵, 차트, 퓨전테이블 API를 이용하여 지리적 시각화를 웹에서 구현하였다. 본 연구는 오픈 API를 활용하여 매쉬업에 그치지 않고 데이터를 지리적으로 시각화하고 탐색적으로 데이터의 의미를 찾아보는 탐색적 데이터 분석이 가능하도록 하였다는 점에서 의의가 있다. 오픈 API와 클라우드 환경을 이용한 데이터의 지리적 시각화는 일반 대중이나 컴퓨터 환경이 좋지 않은 학교 등에서 공공데이터를 활용할 수 있는 방안을 제시하였다는 점에서 의미를 지닌다.
This study had two main objectives. We first investigated which weather phenomena people were most concerned about in the context of climate change or global warming. Then, we conducted content analysis to find which words were more commonly used with climate change or global warming. For this, we collected web data from Twitter, Naver, and Daum from April to October 2019 in the Republic of Korea. The results suggested that people were more concerned about air quality, followed by typhoons and heat waves. Because this study only considered one warm period in the year of 2019, winter-related weather phenomena such as cold wave and snowfall were not well captured. From Twitter, we were able to find wider range of terminologies and thoughts/opinions than Naver and Daum. Also, more life-relevant weather events such as typhoons and heat waves in Twitter were commonly mentioned compared to Naver and Daum. On the other hand, the comments from Naver and Daum showed relatively narrower and limited terms and thoughts/ opinions. Especially, most of the comments were influenced by headlines of articles. We found many comments about air quality and energy/economic policy. We hope this paper could provide background information about how to promote the climate change education and public awareness and how to efficiently interact with general audiences.
최근 공공시설물의 노후화에 따른 사회문제가 빈번하게 발생하고 있으며, 이에 따라 시설물에 대한 국민의 불안감도 증가 하고 있다. 향후 10년 내에 급증하게 되는 시설물 노후화 문제의 효과적인 대응을 위해 현재의 사후적인 유지관리에서 예측을 통한 선제적 유지관리로의 패러다임 전환이 시급한 실정이다. 본 연구에서는 빅데이터 시범분석을 통해서 교량, 터널, 공공건축물 일부에 대해 FMS 축적된 유지관리 데이터를 활용하여 지역별·환경별·공용년수별 취약요소를 도출하였고, Social Media의 비정형 데이터 분석을 통해 국민이 체감하는 불안/불편요소를 도출하였다. 또한 교량 취약요소의 손상발생패턴 분석을 통해 향후 선제적으로 관리해야 하는 유지관리 항목 및 추가적으로 확보해야 하는 디지털 정보 등을 제안하였다.
최근 세계 최고 수준의 도시화율과 OECD 국가중 최고의 자살율, 주기적으로 발생하는 인적재난으로 인한 사회적·인적 손실 등 이미 통계자료나 언론을 통해 우리 생활 주변에 직간접적으로 영향을 주고 있는 안전수준 및 위험수위는 날로 심화되고 있다. 이에 현 정부 들어 「범죄로부터 안전한 사회구현」, 「재난재해 예방 및 체계적 관리」 등이 주요 국정과제 현안으로 추진되는 등 국민안전을 위한 노력을 기울이고 있다. 그 일환으로서 국민안전처 국립재난안전연구원에서는 모바일과 IT 환경에서 다양한 부처에서 분산 관리되고 있는 각종 재난안전정보를 수집, 통합적으로 연계하여 DB화하고, 국민의 생활안전의식 제고, 생활안전 환경 개선 및 예방능력 강화 등을 위한 생활안전과 관련된 다양한 컨텐츠를 지도 기반으로 대국민들에게 공개하여 서비스하는 생활안전지도를 구축하고 있다. 생활안전지도 구축사업은 「정부 3.0」의 기본방향에 따라 재난안전 관련 부처와 지자체의 협업기반을 구축하여 재난안전 정보 공유를 촉진하고 재난안전 대민서비스 창구를 일원화하여 ‘공급자’위주에서 ‘국민중심’의 서비스로 발전시키고자 추진되고 있다.
본 연구에서는 지도기반 생활밀착형 안전정보 제공을 위하여 생활 주변의 위해요소와 밀접한 관련이 있는 4개 분야(교통, 재난, 치안, 맞춤안전) 공공데이터를 DB로 구축한 후, GIS 분석을 통하여 주변의 안전수준을 진단·분석하고 그 위험수준을 지도 위에 표시하여 인터넷이나 모바일 환경에서 국민들에게 제공하는 지도서비스 플랫폼 형태로 구축하였다. 지자체 재난안전관련 부서에서는 이러한 재난안전 공간서비스를 활용하여 개선이 필요한 지역에 대해 적절한 정책 수립과 예산 배정, 행정력 실행 등 개선노력을 통해 점진적·선순환적으로 주민들의 안전을 확충하는 데 활용할 수 있다. 또한, 지가 하락, 지역간 위화감 조성 등 안전지도 서비스로 인한 우려와 부작용을 최소화하기 위하여 기술적·정책적 방안도 함께 마련할 계획이다. 향후 신규분야(시설, 산업, 보건식품, 사고안전)에 대한 서비스 컨테츠도 확대 구축하여 지자체의 효율적인 안전취약지역 개선 활동 및 국민들의 안전한 사회를 구현하는데 기여 할 수 있을 것으로 기대된다.