본 연구는 한국어 학습자의 한자계 어휘 습득을 교육내용으로 설정하고, 이에 필요한 학습용 어휘와 한자를 다양한 언어자료(코퍼스)를 활용하여 추출하여 선정한 후, 이를 다시 학습 단계별로 위계화하려는 목표 아래 진행된 두 번째 연구성과물이다.
첫 번째 연구에서 기존 한문교육용 기초한자의 문제점을 제기하였다. 현재의 한문교육용 기초한자는 한문고전적 독해는 물론, 한자계 어휘 습득의 목표에도 부적절하다는 점을 실례를 통하여 확인할수 있었다. 후속 연구인 본 단계에서는 한자계 어휘 습득을 위한 한자어와 한자를 선정하는 이론과 실제를 제시하고, 다양한 코퍼스 자료를 분석하여 추출하였다. 세 번째 단계의 연구에서는 한문고전을 독해 학습에 필요한 한자를 선정하고, 마지막으로 한자의 학습층위별 위계화를 제시하고자 한다.
이와 같은 목표 아래 진행된 본 연구는 연구의 대상을 ‘한자계 어휘 습득’으로 설정하고, 이에 따라 현실 언어 생활에 사용되는 한자어와 이를 구성하는 한자를 추출하기 위해 다양한 코퍼스를 이용하였다. 관련 통계 프로그램을 별도로 설계 제작하였으며, 한국어에 사용되는 다양한 언어 자료에서 높은 빈도를 가진 어휘와 한자를 추출하였다. 추출한 한자어는 모두 3732개(사용된 한자 1794개), 개별 한자는 2600개이다. 이는 순수하게 한국어 언어 생활에 활용되는 한자어와 한자를 추출한 것이므로, 기존의 한문교육용 기초한자와는 그 대상이나 목적이 다르다.
본 연구를 통해 다음과 같은 사실을 다시 확인할 수 있다.
첫째, 한자와 어휘 선정은 교육의 대상과 그 목적을 분명히 해야 한다. 이에 따라 추출 및 선정 어휘와 결과가 달라지기 때문이다.
둘째, 연구 방법에 있어 코퍼스의 특성과 언어의 특성 등을 모두 고려한 별도의 오픈소스 프로그램 개발이 필요하다.
셋째, 연구 대상 자료는 사회적 합의를 기초로 객관적이며 대표적 자료를 수집해야 한다.
넷째, 본 연구 결과물과 같은 소논문 형태로는 그 연구의 합리성을 대표하기 어려우므로 관련 연구자들을 중심으로 별도의 연구 프로젝트 플랫폼을 구성하고 공동 개발해야 한다.
다섯째, 한 개인의 연구가 아닌 집단 연구의 결과물로 이용될 수 있도록 저작권을 지닌 공개자료로 제공되어야 한다.
This study mainly explores the research themes and topics of corpus-based studies published in English Teaching in an attempt to provide future directions and pedagogical implications in this research domain. For the purposes of the study, a total of 42 corpus-based research articles published in English Teaching were reviewed and analyzed in terms of research topics, methodology, and characteristics of the corpora employed in the studies. The thematic and topical analysis of the corpus-based studies showed that much research, i.e., 64%, has focused on the analysis ofvocabulary items. Further, the analysis of the research methods revealed that corpus-based studies published in English Teaching mainly employed quantitative methods to describe frequency and distribution information of the target linguistic items. It also provided the description of the characteristics of the corpora adopted in the corpus-based research. Interestingly, many corpus-based studies published in English Teaching focused on the analysis of the learner corpus data. The paper discusses the future research directions and pedagogical implications for corpus-based studies on TEFL.
Kim, Hyesook. 2014. Corpus-based Study on Gender Differences in the Functions of English Tag Questions. The Sociolinguistic Journal of Korea 22(3). This study examines gender differences, focusing on the functions of English tag questions using three social variables: age, education, and private/public situations. This research is a corpus-based study which used 753 tag questions extracted from the British component of International Corpus of English (ICE-GB). This paper is the sequel to Kim Hye-Sook(2010), which examined gender differences in the frequency of tag usage. In this present study attention was turned to functions of tag questions to examine whether the gender differences in the tag usage were related to different tag functions. The four functions considered in the study were informational, facilitating, softening and challenging(cf., Holmes 1995; Tottie & Hoffmann 2006). The 753 tags were categorized into those four functions by a native speaker of British English. The tags used by the British men and women in the ICE-GB corpus had no significant gender differences in the functions of tag questions. The tags were used consistently in the order of informational, facilitating, challenging, and softening by both men and women regardless of age, education and private/public situations.
본 연구는 한국 대학생 134명을 대상으로 구두 인터뷰를 통해 수집한 영어 말하기 코퍼스에 대해 코퍼스 기반 분석을 적용하여 학생들의 말하기에 나타난 특징을 규명하고 일반적인 오류와 연어 사용 오류에 대해 탐구하였다. 오류 분석은 질적 연구 도구와 절차를 적용하여 오류를 추출한 후 분류 하고 분석하였다. 연구 결과, 한국 대학생들의 말하기 코퍼스에 사용된 총 어휘 수는 33,306으로 나타났으며 유형이 다른 어휘는 총 2,308개였다. 유형이 다른 개별 어휘군을 분석한 결과 영어 원어민이 가장 빈번하게 사용하는 1,000 어휘군의 90% 범위에 해당하는 것으로 보아 한국 학생들은 원어민이 빈도 높게 사용하는 쉬운 일상 단어를 반복적으로 사용하는 것으로 보인다. 오류 분석 결과, 가장 빈번하게 나타난 오류 유형은 생략(omission)과 비문(misformation)으로 규명되었으며, 세부적으로는 정관사, 전치사, 시제 불일치, 단수/복수형 오류가 빈번하였다. 연어 오류 분석 결과, G8-D(동사+전치사+목적어) 유형의 문법적 연어 오류가 가장 빈번하였으며, 어휘적 연어 오류에서는 L1(동사+명사/대명사) 유형이 가장 흔하게 나타났다. 한국 대학생들이 영어 말하기에서 흔하게 범하는 이러한 오류들은 다른 언어 기능 사용 측면에도 지장을 줄 수 있으므로 향후 한국 학생들을 위한 영어 교재 개발과 교수·학습 활동 개발과 적용 시에 이러한 특징과 양상을 반영하여 이를 해결할 방안을 모색할 필요 가 있다.
Hyeree Kim. 2016. A Corpus-Based Study in the Diachronic Change of the Adjective/Participle+V-ing Construction. Studies in Modern Grammar 90, 1-30. In the Present-Day English adjectives and participles are often followed by a preposition plus V-ing (hereafter called PG construction). However, some adjectives and participles can be immediately followed by V-ing without an intermediate preposition (hereafter NG). Therefore, such adjectives/participles can have both NG and PG constructions. This article investigates 13 such predicates (happy, comfortable, bored, tired, fed up; busy, engaged, occupied; late, quick, slow, done, finished) in the Corpus of Historical American English (COHA) and examines the frequency changes of their NG vs PG structures in American English from 1820 to 2009. The findings of this study are as follows: (i) NG is a more recent structure than PG, (ii) the frequency of NG has gradually increased over time with most predicates, (iii) except engaged, the percentage of NG to PG was higher in the late 1900 than the early 1800, and with some predicates NG is more preferred than PG in the Present-Day English, (iv) as shown by the fact that some predicates were more resistant to the change, a linguistic innovation does not apply simultaneously but spread gradually across the relevant lexical items/structures.
In the Present-Day English adjectives and participles are often followed by a preposition plus V-ing (hereafter called PG construction). However, some adjectives and participles can be immediately followed by V-ing without an intermediate preposition (hereafter NG). Therefore, such adjectives/participles can have both NG and PG constructions. This article investigates 13 such predicates (happy, comfortable, bored, tired, fed up; busy, engaged, occupied; late, quick, slow, done, finished) in the Corpus of Historical American English (COHA) and examines the frequency changes of their NG vs PG structures in American English from 1820 to 2009. The findings of this study are as follows: (i) NG is a more recent structure than PG, (ii) the frequency of NG has gradually increased over time with most predicates, (iii) except engaged, the percentage of NG to PG was higher in the late 1900 than the early 1800, and with some predicates NG is more preferred than PG in the Present-Day English, (iv) as shown by the fact that some predicates were more resistant to the change, a linguistic innovation does not apply simultaneously but spread gradually across the relevant lexical items/structures.
The goal of this study is to investigate the use of the two English synonymous adjectives difficult and hard through BNC, and to examine Korean college students’knowledge of difficult/hard+noun expressions. The main findings of this paper are as follows. First, The adjective difficult is mainly (83.33%) used to mean ‘not easy to do or deal with’, while hard is mainly (60%) used as idiomatic expressions. Second, both adjectives have different meanings according to the nouns which they are combined with (hard rock/life, difficult decision/concept), and sometimes they have a radically different meaning even when they are combined with the same noun (difficult man, hard man). Third, The average score of the subjects was as low as 54.50%. Fourth, The average score by type is in the order of hard+noun (77.19%), difficult+noun (45.46%) and difficult-hard+noun(38.34%), which shows that the subjects’ overall knowledge of difficult/hard+noun combinations is considerably poor and unbalanced. This result implies that Korean learners of English need to study English, not just memorizing individual words, but with a focus on chunks.