漢字漢文敎育 Vol. 46 (p.177-202)

코퍼스에 기반한 교육용 한자․한자계 어휘 위계화 연구(2) - 한자계 어휘 학습용 한자어 및 한자의 선정 방안과 결과 검토 -

A Study of Using Various Corpus on Set Grade Basic Han-characters and Sino-Korean Words for Korean Learning(2) - Review on Selection Method and Results
키워드 :
코퍼스,한자교육,한문교육,한자,어휘,Han-character,Words by Han-character,Vocabulary set for education,Basic vocabulary,Level

목차

국문초록
Ⅰ. 서론
Ⅱ. 연구 설계의 기초
Ⅲ. 연구 결과
Ⅳ. 결론
參考文獻 Reference
Abstract

초록

본 연구는 한국어 학습자의 한자계 어휘 습득을 교육내용으로 설정하고, 이에 필요한 학습용 어휘와 한자를 다양한 언어자료(코퍼스)를 활용하여 추출하여 선정한 후, 이를 다시 학습 단계별로 위계화하려는 목표 아래 진행된 두 번째 연구성과물이다.
첫 번째 연구에서 기존 한문교육용 기초한자의 문제점을 제기하였다. 현재의 한문교육용 기초한자는 한문고전적 독해는 물론, 한자계 어휘 습득의 목표에도 부적절하다는 점을 실례를 통하여 확인할수 있었다. 후속 연구인 본 단계에서는 한자계 어휘 습득을 위한 한자어와 한자를 선정하는 이론과 실제를 제시하고, 다양한 코퍼스 자료를 분석하여 추출하였다. 세 번째 단계의 연구에서는 한문고전을 독해 학습에 필요한 한자를 선정하고, 마지막으로 한자의 학습층위별 위계화를 제시하고자 한다.  
이와 같은 목표 아래 진행된 본 연구는 연구의 대상을 ‘한자계 어휘 습득’으로 설정하고, 이에 따라 현실 언어 생활에 사용되는 한자어와 이를 구성하는 한자를 추출하기 위해 다양한 코퍼스를 이용하였다. 관련 통계 프로그램을 별도로 설계 제작하였으며, 한국어에 사용되는 다양한 언어 자료에서 높은 빈도를 가진 어휘와 한자를 추출하였다. 추출한 한자어는 모두 3732개(사용된 한자 1794개), 개별 한자는 2600개이다. 이는 순수하게 한국어 언어 생활에 활용되는 한자어와 한자를 추출한 것이므로, 기존의 한문교육용 기초한자와는 그 대상이나 목적이 다르다.
본 연구를 통해 다음과 같은 사실을 다시 확인할 수 있다.
첫째, 한자와 어휘 선정은 교육의 대상과 그 목적을 분명히 해야 한다. 이에 따라 추출 및 선정 어휘와 결과가 달라지기 때문이다.
둘째, 연구 방법에 있어 코퍼스의 특성과 언어의 특성 등을 모두 고려한 별도의 오픈소스 프로그램 개발이 필요하다.
셋째, 연구 대상 자료는 사회적 합의를 기초로 객관적이며 대표적 자료를 수집해야 한다.
넷째, 본 연구 결과물과 같은 소논문 형태로는 그 연구의 합리성을 대표하기 어려우므로 관련 연구자들을 중심으로 별도의 연구 프로젝트 플랫폼을 구성하고 공동 개발해야 한다.
다섯째, 한 개인의 연구가 아닌 집단 연구의 결과물로 이용될 수 있도록 저작권을 지닌 공개자료로 제공되어야 한다.
This study is the second item under the goal of setting up the goal of acquiring study Sino-Korean words, selecting the required Sino-Korean words and Han-characters using various language corpus data, and stratifying them set grade by step.
In the first study, it was pointed out that “1800 characters set for education” were many problems not only in reading classical works but also in learning Sino-Korean words. In the second step, the theory and practice of selecting Han-characters and Sino-Korean words for the acquisition of learning, analyzed and extracted from various Corpus data. In the third phase of the study, the Han-characters needed for learning are selected by reading the classic works, and finally, the set grade system of Han-characters by learning.
So, this study, which was conducted under this objective, used various language corpus to select Han-characters used in real language life. A new program was designed and produced to select words and characters with high frequency from various language materials used in the Korean language. A total of 3,732 Sino-Korean words were selected (used 1,794 characters), also selected 2,600 individual characters. This set is a purely used in Korean language life, so the subject and purpose are different from that of the existing other set.
Through this study the following facts have to re-consider:
1. selecting characters and vocabulary should clarify the object of education and its purpose.
2. it is necessary to develop a separate open source program that takes into account both the characteristics of the corpus and the characteristics of the language, etc. in the research.
3. the data to be studied should be objective and representative on the basis of social consensus.
4. since it is difficult to represent the rationality of the research in the form of small papers such as this study paper, separate research project platform should be constructed and co-developed with the relevant researchers at the center.
5. should be provided as a copyrighted public material for use as a result of collective research, not as a single individual's research.