논문 상세보기

Hi, KIA! 기계 학습을 이용한 기동어 기반 감성 분류 KCI 등재

Hi, KIA! Classifying Emotional States from Wake-up Words Using Machine Learning

  • 언어KOR
  • URLhttps://db.koreascholar.com/Article/Detail/406570
구독 기관 인증 시 무료 이용이 가능합니다. 4,600원
감성과학 (Korean Journal of the science of Emotion & sensibility)
한국감성과학회 (The Korean Society For Emotion & Sensibility)
초록

본 연구에서는 승용차에서 사람들이 기기를 사용하기 위해 사용하는 기동어인 “Hi, KIA!”의 감성을 기계학습을 기반으로 분류가 가능한가에 대해 탐색하였다. 감성 분류를 위해 신남, 화남, 절망, 보통 총 4가지 감정별로 3가지 시나리오를 작성하여, 자동차 운전 상황에서 발생할 수 있는 12가지의 사용자 감정 시나리오를 제작하였다. 시각화 자료를 기반으로 총 9명의 대학생을 대상으로 녹음을 진행하였다. 수집된 녹음 파일의 전체 문장에서 기동어 부분만 별도로 추출하는 과정을 거쳐, 전체 문장 파일, 기동어 파일 총 두 개의 데이터 세트로 정리되었다. 음성 분석에서는 음향 특성을 추출하고 추출된 데이터를 svmRadial 방법을 이용하여 기계 학습 기반의 알고리즘을 제작해, 제작된 알고리즘의 감정 예측 정확성 및 가능성을 파악하였다. 9명의 참여자와 4개의 감정 카테고리를 통틀어 기동어의 정확성(60.19%: 22~81%)과 전체 문장의 정확성(41.51%)을 비교했다. 또한, 참여자 개별로 정확도와 민감도를 확인하였을 때, 성능을 보임을 확인하였으며, 각 사용자 별 기계 학습을 위해 선정된 피쳐들이 유사함을 확인하였다. 본 연구는 기동어만으로도 사용자의 감정 추출과 보이스 인터페이스 개발 시 기동어 감정 파악 기술이 잠재적으로 적용 가능한데 대한 실험적 증거를 제공할 수 있을 것으로 기대한다.

This study explored users’ emotional states identified from the wake-up words —“Hi, KIA!”—using a machine learning algorithm considering the user interface of passenger cars’ voice. We targeted four emotional states, namely, excited, angry, desperate, and neutral, and created a total of 12 emotional scenarios in the context of car driving. Nine college students participated and recorded sentences as guided in the visualized scenario. The wake-up words were extracted from whole sentences, resulting in two data sets. We used the soundgen package and svmRadial method of caret package in open source-based R code to collect acoustic features of the recorded voices and performed machine learning-based analysis to determine the predictability of the modeled algorithm. We compared the accuracy of wake-up words (60.19%: 22%~81%) with that of whole sentences (41.51%) for all nine participants in relation to the four emotional categories. Accuracy and sensitivity performance of individual differences were noticeable, while the selected features were relatively constant. This study provides empirical evidence regarding the potential application of the wake-up words in the practice of emotion-driven user experience in communication between users and the artificial intelligence system.

목차
Abstract
요 약
1. 서론
2. 연구 방법
    2.1. 다양한 감성이 내포된 “Hi, KIA!” 시나리오 구성
    2.2. 실험 방법
    2.3. 기동어 음향 속성 기반 학습 데이터 구성 수집
    2.4. 분석 데이터 처리
    2.5. 기계 학습 기반 데이터 분석
3. 연구 결과
    3.1. 기동어 학습 기반 기동어 감성 분류 과정의 피쳐중요도 분석
    3.2. 기계 학습 기반 기동어 감성 분류 결과
    3.3. 기동어와 문장 전체 감성 예측 비교
4. 논의
    4.1. 주요 발견점
    4.2. 기동어 감성 분류에 따른 차량 내 시스템 연동
    4.3. 연구 한계점 및 후속 연구
5. 결론
REFERENCES
저자
  • 김태수(KAIST 산업디자인학과) | Taesu Kim
  • 김영우(KAIST 산업디자인학과) | Yeongwoo Kim
  • 김근형(KAIST 문화과학기술대학원) | Keunhyeong Kim
  • 김철민(KAIST 원자력및양자공학과) | Chul Min Kim
  • 전형석(현대자동차 기아디자인센터 기아내장디자인실) | Hyung Seok Jun
  • 석현정(KAIST 산업디자인학과) | Hyeon-Jeong Suk 교신저자