논문 상세보기

특수 목적 관광 중국어의 어휘리스트 코퍼스 구축 - AI-Hub 구어체 병렬 말뭉치 데이터를 기반으로 KCI 등재

Building a Vocabulary List Corpus of Chinese for Special Purpose Tourism : Based on AI-Hub colloquial corpus data

  • 언어KOR
  • URLhttps://db.koreascholar.com/Article/Detail/435799
구독 기관 인증 시 무료 이용이 가능합니다. 5,700원
中國學 (중국학)
대한중국학회 (Korean Association For Chinese Studies)
초록

본 연구는 관광 관련 서비스 분야에 필요한 특수 목적 중국어(CSP) 교육과정 개 발을 위한 첫 단계로 AI 데이터 기반으로 구축된 구어체 병렬 코퍼스에서 CSP 어휘 리스트를 선정하여 용어색인과 어휘다발(n-gram)등을 분석하였다. 어휘리스트 어휘 규모는 토큰 수 총 304, 228개와 타입 수 17, 286개로 나타났으며, 어휘 누적 증가율 을 분석하면 2-Gram과 3-Gram의 어휘다발이 가장 많았고, 실무 현장에서 가장 많 이 활용되고 있음을 알 수 있었다. 본 연구에서 구축된 특수 목적 관광 중국어 어휘 리스트는 실제 교육 자료로 제공하여 관광 중국어 학습자와 교수자에게 실용적으로 사용될 수 있을 것이라 기대한다.

This study selected and analyzed a CSP vocabulary list from a colloquial parallel corpus built based on AI data as the first step in developing a special purpose Chinese (CSP) curriculum required for tourism-related services. The vocabulary size of the vocabulary list was found to be a total of 304, 228 tokens and 17, 286 types, and when analyzing the cumulative growth rate of vocabulary, it was found that 2-gram and 3-gram vocabulary bundles were the most common, and they were used the most in the field. As a characteristic of the special purpose tourism Chinese vocabulary list, first, the interrogative pronouns appeared as the top word. Second, nouns, verbs, and auxiliary verbs representing special purposes appeared frequently. Third, verb 买 were combined with various measures, and noun 衣服 were frequently combined with 把 to form a ba construction. Finally, we analyzed how the Chinese actually expand and use the vocabulary bundles in 2-Gram and 3-Gram. The 给我 is extended to the 请给我, and the 几 点 is extended to the 飞机几点 and 几点登机. The 告诉我 appeared in patterns such as 能告诉我. If the curriculum is designed by reflecting this extended pattern in the field scenario, it will help understand tourism Chinese learning.

목차
1. 서론
2. 이론적 배경
    1) 특수 목적 중국어
    2) 코퍼스와 AI-Hub
3. 연구 범위
    1) 연구 범위
    2) 연구 문제
4. 연구 분석 및 결과
    1) 어휘규모
    2) 워드 리스트(Word list)
    3) 용어색인(Concordance)
    4) N-Gram
5. 결론
【참고문헌】
【논문초록】
저자
  • 이소현(부산외국어대학교 외국어연구소 학술연구교수) | Lee So-Hyun
같은 권호 다른 논문