한국게임학회 논문지 제18권 제5호 (p.113-122)

|자연어처리/게임감성사전구축|
게임 도메인 웹 코퍼스를 이용한 감성사전 구축 및 평가

Construction and Evaluation of a Sentiment Dictionary Using a Web Corpus Collected from Game Domain
키워드 :
Game corpus,게임 말뭉치,NLP,자연어 처리,Sentiment analysis,감성 분석,Sentiment dictionary,감성 사전,Senti-word Net,SWN

목차

요 약
ABSTRACT
1. 서 론
2. 기존 연구
  2.1 자연어 처리
  2.2 감성 분석(Sentiment Analysis)
  2.3 감성 사전
  2.4 게임 내 감성분석
3. 감성 사전 설계 및 구축
  3.1 감성 사전 생성
  3.2 감성 사전 분석
4. 감성 사전 평가
4. 결론 및 향후 연구
REFERENCES

초록

본 논문은 게임 도메인에서 웹 코퍼스를 이용하여 감성사전을 구축하는 방법과 구축한 감성사전의 평가 결과를 기술한다. 감성사전 구축을 위해 먼저 트위터 형태소 분석기를 이용해 국내 한 포털 사이트의 게임 관련 웹 문서를 기반으로 어휘를 수집하여 감성 사전 어휘 목록을 만들었고, 목록에 있는 단어들 중 동사와 형용사 품사의 단어들에 대해 감성 사전을 구축하였다. 구축된 감성 사전의 평가를 위해 영어 기반의 Senti-word Net(SWN)을 한글로 번역한 한국어 SWN을 이용하여 정밀도와 재현율 값을 계산하였다. 평가 결과 긍정과 부정 감성의 F-1값에 대한 평균이 형용사의 경우 0.85, 동사에 대해 0.77을 각각 보여 주었다.
This paper describes an approach to building and evaluating a sentiment dictionary using a Web corpus in the game domain. To build a sentiment dictionary, we collected vocabulary based on game-related web documents from a domestic portal site, using the Twitter Korean Processor. From the collected vocabulary, we selected the words whose POS are tagged as either verbs or adjectives, and assigned sentiment score for each selected word. To evaluate the constructed sentiment dictionary, we calculated F1 score with precision and recall, using Korean-SWN that is based on English Senti-word Net(SWN). The evaluation results show that average F1 scores are 0.85 for adjectives and 0.77 for verbs, respectively.