Recently, the importance of impact-based forecasting has increased along with the socio-economic impact of severe weather have emerged. As news articles contain unconstructed information closely related to the people’s life, this study developed and evaluated a binary classification algorithm about snowfall damage information by using media articles text mining. We collected news articles during 2009 to 2021 which containing ‘heavy snow’ in its body context and labelled whether each article correspond to specific damage fields such as car accident. To develop a classifier, we proposed a probability-based classifier based on the ratio of the two conditional probabilities, which is defined as I/O Ratio in this study. During the construction process, we also adopted the n-gram approach to consider contextual meaning of each keyword. The accuracy of the classifier was 75%, supporting the possibility of application of news big data to the impact-based forecasting. We expect the performance of the classifier will be improve in the further research as the various training data is accumulated. The result of this study can be readily expanded by applying the same methodology to other disasters in the future. Furthermore, the result of this study can reduce social and economic damage of high impact weather by supporting the establishment of an integrated meteorological decision support system.
이 연구는 토픽 모델링의 LDA(Latent Dirichlet Allocation) 기법을 적용해 언론에 보도된 테러리즘 관련 뉴스 기사의 주요 토픽(topic)을 분석하였다. 이를 위해 지난 2014년 6월부터 2019년 5월 중, 미디어에 보도된 뉴스 중에서 테러리즘을 소재로 다룬 36,436건을 대상으로 토픽 을 추출하고, 주요 흐름을 시기별(모술탈환 이전, 모술탈환 과정, 모술탈 환 이후)로 구분하여 분석하였다. 이 연구에서 모술탈환 작전을 주요 분 석 시점으로 정한 것은 국제 테러리즘의 확산과 파급력이라는 측면에서 중요한 키워드가 ISIS(이슬람국가)이고, ISIS 세력의 확장, 축소, 다변화 등과 관련된 주요 사건이 모술탈환 작전이라고 여겼기 때문이다. 연구 방법적으로는 테러리즘과 관련한 방대한 양의 기사 내용을 정량 적으로 분석할 수 있고, 내용적으로는 주요 토픽을 파악함으로써 테러리 즘 기사의 이슈와 정책 이슈와의 관련성을 논의할 수 있는 토픽 모델링 분석을 실시하였다. 이상의 결과는 테러리즘에 대한 주제를 단어 중심으 로 범주화함으로써 관련 연구의 분석 기준을 마련할 수 있으며, 정책적 으로는 관련 이슈에 대한 언론 보도 토픽의 경향성을 파악함으로써 국제 테러리즘 발생에 대한 이해를 기반으로 정책 수립의 방향성을 제시할 수 있을 것이다. 이 연구는 선행연구에서 주요하게 다루지 않았던 테러리즘의 양상과 관련된 뉴스 기사의 주제적 특징을 객관적으로 도출함으로써, 시기별로 중심 주제가 어떻게 변화되고 있는지를 분석하였으며, 이를 통해 우리 사회에서 바라보고 있는 테러리즘 실태와 동향을 살펴보고자 하였다. 이 를 토대로 테러리즘 관련 언론보도의 주요 토픽과 테러리즘 관련 언론보 도 기사에서 모술작전 전후 시기별로 주요 토픽은 어떠한 변화 추이를 보이고 있는지에 대한 함의점을 도출할 수 있었다.
이 연구는 뉴스 미디어 환경 변화에 대응하기 위해 연합뉴스가 빅데이터 저널리즘을 어떠한 방식으로 활용해야 하는지에 관하여 심층 분석하였다. 이를 위해 연합뉴스 기자들과 빅데이터 저널리즘 전문가들을 대상으로 뉴스 미디어 환경 변화, 변화하는 연합뉴스의 위상과 전략, 빅데이터 저널리즘의 필요성과 활용방안에 관한 심층인터뷰를 실시하였다. 연구결과, 미디어 환경의 변화는 소비자들이 뉴스 생산에 적극적으로 참여할 수 있는 토대를 마련해 주었지만 불확실한 뉴스 유통이나 선정적 기사 양산, 언론의 신뢰도 하락 등 심각한 부작용을 초래하고 있었다. 연합뉴스는 언론사들을 대상으로 하는 도매상 역할과 일반 독자들과 만나는 소매상 역할을 동시에 맡게 되었고, 이에 따라 속보 외에도 일반 독자들의 요구에 맞춘 새로운 기사의 형식과 내용을 시도하는 전략 수정이 요구되고 있다. 저널리즘의 신뢰성과 공정성을 회복하기 위한 혁신 방안 중 하나로 제시된 빅데이터 저널리즘은 탐사보도, 지역보도 등에 활용될 수 있을 것으로 분석되었고 이를 위한 선결 과제로 전담 부서와 인력 확충, 기자 교육 프로그램 마련, 공공 데이터 확보 등이 실무적 차원으로 제시되었다.