This study examines Kule-based reactive expressions, which remain relatively underdescribed in Korean as a Foreign Language (KFL) education. It adopts a mixed methodology combining spoken corpus analysis, a Discourse Completion Task (DCT) administered to KFL learners, and a survey of native-speaking KFL teachers. The corpus analysis reveals that some frequent expressions are absent from or only marginally addressed in existing works, raising questions about current lexicographic practices. The DCT results show inconsistent learner responses, indicating limited awareness of distinctions among these expressions and a strong reliance on implicit auditory input. Teacher survey data further point to the absence of a shared pedagogical framework regarding instructional timing and methods. Overall, the findings suggest that despite their key role in managing reactions in spoken Korean interaction, Kule-based formulas remain peripheral in KFL classrooms. This research therefore highlights the need for context-sensitive descriptions, multimodal teaching and learning materials, and empirically grounded pedagogical resources.
This study investigates the framing patterns and content of news coverage surrounding the construction of the Islamic mosque in Daehyeon-dong, Buk-gu, Daegu. A total of 433 articles containing the keywords “Daegu” and “Islam” were collected from Naver News between 2021 and 2024 and coded according to the frames proposed by Bowe and Makki (2016). Subsequently, a corpus linguistic analysis was conducted for each frame to examine the keywords, collocations, and framing devices quantitatively and qualitatively. The findings revealed that, in the early stages of the event, the major frames appeared relatively balanced; however, over time, the reporting became fragmented, emphasizing either conflict or condemnation of hate. Furthermore, the distribution of keywords and collocations within each frame demonstrated that the same lexical items served different semantic roles depending on the frame. The use of framing devices also enabled a more detailed observation of how frames were constructed at the textual level. This study is significant in that it adopts an interdisciplinary approach combining framing analysis and corpus linguistics to provide a multidimensional understanding of how real social conflicts in multicultural contexts are constructed within news discourse.
본 논문은 법정스님의 수필집 『무소유』를 전통적인 수행론이나 심리치 료 모델로 사용되던 고집멸도를 ‘텍스트 분석틀’로 사용하는, 코퍼스 (Corpus) 접근방법에 의거해서 『무소유』에 내재된 고통의 진단과 치유의 과정을 체계적으로 밝힌다. ‘고(苦), 고통의 경험’ 단계에서 『무소유』에 ‘신체적’, ‘정서적’, ‘관계 적’, ‘실존적’ 고통이 생생하게 묘사되어 있음을 보여준다. 특히 출가자의 특성상 개인적 ‘애착’의 고통보다는 급격한 사회 변화와 물질문명에 대한 ‘비판적 고뇌’가 두드러진다. ‘집(集), 고통의 원인’ 분석에서 코퍼스의 ‘계량적 텍스트 분석’을 통해 고통의 원인으로 남방불교의 ‘갈애(taṇhā)’ 개념은 발견되지 않는 반면, 북방불교의 ‘삼독심(三毒心)’ 개념이 빈번하 게 사용됨을 확인한다. 특히 탐욕(4회), 성냄(16회)에 비해 ‘어리석음(무 지, 오해, 고정관념)’(32회)이 압도적으로 많이 언급된 점에 주목하며, 『무소유』가 진단하는 고통의 심층적 뿌리는 ‘실상을 바로 보지 못하는 무 지(無知)’임을 논증한다. 즉, ‘어리석음’이 집착을 낳고, ‘집착’이 ‘소유’의 문제로 발현된다고 본다. 멸(滅), 고통의 소멸’ 단계에서는 핵심 키워드 용례를 분석하는 코퍼스 접근법을 활용해서 ‘어리석음’을 벗어나는 마음치유의 과정으로 ‘마음 돌 리기(回心)’, ‘과거의 허물과 직면하기’, ‘있는 그대로 경험하기’, ‘자비와 용서’라는 네 가지 명상심리적 기제를 도출한다. 마지막으로 ‘도(道), 새 로운 삶의 실천’ 단계에서는 이러한 깨달음이 팔정도와 육바라밀의 실천 으로 이어짐을 논증한다. 결국 『무소유』의 핵심된 메시지를, ‘소유하지 말라’는 권유나 ‘마음비 움’의 미학이 아니라, 삶의 진짜 모습을 ‘똑바로 바로 보라.’는 깊은 통찰 을 요구하는 것으로 본다. 나아가 필자는 이를 바탕으로 『무소유』를 텍스 트로 활용하는 구체적인 ‘무소유 명상 프로그램’을 제안하며, 고전으로서 의 가치를 넘어 현대인을 위한 실질적인 명상 지침서가 될 수 있음을 시 사한다.
본 연구는 AI-Hub 한국어–중국어 구어체 병렬 말뭉치를 기반으로 중국어 촉각어 ‘热’의 한국어 의미 확장을 개념적 은유・환유 관점에서 분석하였다. ‘热’는 물리적 온 도 의미를 넘어 정서, 사회적 반응, 분위기 등 다양한 추상적 개념으로 확장되었으며, 이 과정에서 VITALITY IS HEAT, EMOTION IS HEAT 등 은유 구조와 환유・은 환유가 복합적으로 작동하였다. 중-한 비교에서는 직접 대응, 문화적 조정, 구조적 전환의 세 층위가 나타나 두 언어의 개념화 방식과 문화적 차이를 보여주었다. 본 연구는 구어체 자료를 통한 실증 분석으로 기존 문어 중심 감각어 연구의 한계를 보 완하고, 언어 간 개념 체계 비교의 방법론적 가능성을 제시하였다.
This study analyzes the usage of “Haeyo(-이에요/예요, -이에요/예요?, -아/어 요, -아/어요?)” and “Hapsyo(-입니다, -입니까?, -ㅂ/습니다, -ㅂ/습니까?)” styles based on gender using the “Electronic Everyday Dialogue Corpus”. First, a question is posed regarding the appropriateness of the Korean language textbook “できる韓国語初級Ⅰ (Chapter 3: 그건 뭐예요?)”, which states that “-예요/이에요” is frequently used by women and men from Seoul, whereas “-입니다” is more commonly used by men. The findings reveal that both men and women generally prefer the “Haeyo” style, with women showing stronger inclination. Additionally, regardless of the region, both genders use the “Haeyo” style more frequently than the “Hapsyo” style. To summarize, the results of the study suggest that whereas women predominantly use the “Haeyo” style, men use both “Haeyo” and “Hapsyo” styles. This shows that Korean textbooks should provide more accurate descriptions of language use that reflect contemporary sociolinguistic trends.
본고는 대화코퍼스 수집 및 분석을 통해 개별적 연구에 국한되어 있던 ‘X是’구조 응답표지들의 기능 및 특징들을 정리 및 개괄함으로써 ‘是’가 출현하는 응답표지들의 담화적가치를 재고하고자 시도하였다. 우선, 선행발화문과 ‘X是’응답문을 하나의 인 접쌍으로 인식하여 담화기능을 세분류하였다. 또한, 대화코퍼스의 통계를 통해 응답 표지 ‘也是’, ‘那是’, ‘才是’, ‘我是’의 응답기능이 갖는 특징을 비교분석하고 자주출현하 는 문형인 중복과 대구문형의 특징을 살펴보았다. 응답문의 ‘X是’는 자신 고유의 문 법적 의미보다는 응답표지로서의 기능에 무게를 두고 있으며, 중복문형과 대구문형 은 ‘강조’라는 공통적인 특징을 갖는 동시에 강조의 초점대상에서는 상이한 양상을 보였다.
본 연구는 AI-Hub의 ‘방송콘텐츠 한국어-중국어 번역 말뭉치’ 데이터를 활용하여 네이버 파파고의 번역 품질을 평가하고 이를 시각화하는 것을 목표로 한다. 먼저 BL EU 점수를 통해 파파고 번역 품질을 정량적으로 분석하고, 다양한 시각화 기법을 활용하여 번역 품질의 패턴을 파악하였다. 연구 결과에 따르면, 파파고 번역은 짧고 단순한 문장에서 높은 성능을 보였으나, 문장이 길고 복잡해질수록 번역 품질이 저 하되는 경향이 나타났다. 특히, 구어체 표현이나 문화적 맥락이 필요한 표현에서는 번역 오류가 두드러지게 나타났다. 본 연구는 데이터 시각화를 통해 번역 품질 평가 의 이해를 돕고, 파파고 번역의 강점과 약점을 명확히 제시하였다. 향후 연구에서는 다양한 평가 지표와 데이터셋을 활용하여 번역 품질을 더욱 다각적으로 평가하고, 파파고 번역의 한계점을 개선 방안을 제시할 예정이다.
This study explores the development of English textbooks in North Korea through corpus-based analysis aimed at illuminating the differences between materials produced during the Kim Jong-il and Kim Jong-un regimes. In the context of educational reforms and changing political ideology, this study investigates BNC/COCA-based lexical coverage and the key lexical features of North Korean middle school English textbooks, highlighting the complexity, vocabulary, and readability of the learning materials. The findings revealed that the Kim Jong-un regime had implemented reforms to improve English language education, with increased lexical diversity, textual complexity, and vocabulary exposure. Although no significant differences were found between the two regimes regarding the lexical coverage of textbooks, the Kim Jong-un regime’s textbooks exhibited improvements in diversity, readability, and complexity. This study contributes to a broader understanding of the interplay between political ideology and English language education in North Korea, offering insights that have implications beyond the North Korean context and encouraging reflection on the nation-driven educational reform.
본 연구는 관광 관련 서비스 분야에 필요한 특수 목적 중국어(CSP) 교육과정 개 발을 위한 첫 단계로 AI 데이터 기반으로 구축된 구어체 병렬 코퍼스에서 CSP 어휘 리스트를 선정하여 용어색인과 어휘다발(n-gram)등을 분석하였다. 어휘리스트 어휘 규모는 토큰 수 총 304, 228개와 타입 수 17, 286개로 나타났으며, 어휘 누적 증가율 을 분석하면 2-Gram과 3-Gram의 어휘다발이 가장 많았고, 실무 현장에서 가장 많 이 활용되고 있음을 알 수 있었다. 본 연구에서 구축된 특수 목적 관광 중국어 어휘 리스트는 실제 교육 자료로 제공하여 관광 중국어 학습자와 교수자에게 실용적으로 사용될 수 있을 것이라 기대한다.
The physiological functions of the ovary and development of the corpus luteum occur through the activation of endocrine hormones. In this process, estrogen, a reproductive hormone, is secreted in the ovarian follicle and corpus luteum and affects corpus luteum formation and regression. Estrogen controls the synthesis of reproductive hormones by binding to estrogen receptor–α and –β. Estradiol–17β, synthesized in the ovary, regulates the physiological function of the corpus luteum and the angiogenesis signaling pathway. Estrogen controls progesterone synthesis, which is regulated by StAR-transported cholesterol, P450scc-converted pregnenolone in mitochondria, and 3β-HSD-synthesized progesterone in the smooth endoplasmic reticulum. Estrogen secretion is also stimulated by kisspeptin and regulated by gonadotropin-releasing hormone, follicle-stimulating hormone, and luteinizing hormone. Moreover, the formation of the corpus luteum is closely regulated by angiogenesis. VEGF is an important factor in angiogenesis and plays a role in the survival, proliferation, and migration of endothelial cells. Especially, VEGF–A is a key factor in the physiological functions of endothelial cells. VEGF binds VEGFR–2 and affects the signaling pathways of PI3K, Akt, MAPK, and ERK. Also, VEGF binds to HIF–1α, inducing VEGF secretion. Estrogen promotes the activation of HIF–1α, while the activation of mTOR and Akt stimulates VEGF secretion. Therefore, estrogen is a major reproductive hormone in physiological function and the synthesis and secretion of endocrine hormones in the ovary and corpus luteum.
This paper explores the standards for selecting language materials during the study of the diachronic grammar of Classical Chinese. The accuracy of language materials is crucial for ensuring the scientific validity of research conclusions. Due to previous limitations in research on the language materials of the Spring and Autumn period, such as posteriority and singularity, this paper argues that the increasing availability of excavated documents, especially ancient literary texts, provides a reliable research foundation for describing the grammar of Classical Chinese during this period. Therefore, this paper attempts to answer the following questions: 1) Which language materials should be used for the study of the grammar of Classical Chinese during the Spring and Autumn period? 2) Why should these language materials be selected? 3) What are the standards for selecting language materials during this period? The purpose of this study is to provide a reference for the diachronic study of Classical Chinese grammar.
본고는 BCC 코퍼스를 활용한 중국어 미각어 용례 연구로 미각어 ‘甜’과 ‘苦’에 후 행하는 품사를 중심으로 살펴보고자 한다. 이에 BCC 코퍼스를 활용한 미각어 ‘甜’과 ‘苦’ 각각의 연구 방법과 비교 분석을 통해 연구하고자 한다. 본고는 기존 미각어 연 구에서 볼 수 없었던 방대한 데이터를 활용하여 BCC 코퍼스 내의 코퍼스 분석 도구 를 활용하여 보다 객관적이고 과학적으로 양적인 면에서의 미각어 ‘甜’과 ‘苦’에 후행 하는 용례를 고찰하고자 한다.
본 연구에서는 BCC에서 2000년 이후의 ‘最+前面’ 예문을 376개 선별하여 현실 언 어생활에서의 사용 추이와 그 특징을 살펴본 결과, 다음과 같은 사실들을 발견할 수 있었다. 첫째, ‘最+前面’ 구문의 연도별 사용 추이를 분석해본 결과, 2000년 초반에 급격히 증가하다 감소하고 2016년부터 다시 증가세를 보이는 N자형의 추이를 보였 다. 둘째, ‘最+前面’ 구문의 다수가 ‘V+在+最前面’ 형식을 취하였고 문법상 공기하는 동사는 ‘冲>走>排>跑>站>放>挤>在, 坐> 处, 派, 是>摆, 挡, 行进>游, 抢, 带, 位于’ 의 순서로 고빈도를 보였다. 셋째, ‘最+前面’ 구문의 전후로 어휘 의미상 결합하는 명 사는 [+사람], [+사물], [+동물], [+상태], [+처소], [+시간], [+순서], [+범위], [+개념]의 유형인 것으로 나타났다. 넷째, ‘最+前面’ 구문은 문장 성분상 개사 빈어나 주어 등으 로 충당된다. 다섯째, ‘最+前面’은 ‘的’를 첨가하여 명사화 특징도 보였다.
본고는 언중들이 사용하고 있는 구어와 문어를 전사한 말뭉치에 나타 난 ‘-겠-’의 분포 양상을 기술하고 구어 말뭉치와 문어 말뭉치에서 분포 양상의 차이점을 제시하는 데 목적이 있다. 본고는 21세기 세종 계획의 결과물들 중 590만 어절 구어 말뭉치에서 선어말어미 ‘-겠-’이 나타나 는 200개의 텍스트, 4313개의 문장과 2364만 어절 문어 말뭉치에서 선어말어미 ‘-겠-’이 나타나는 200개의 텍스트, 13083개의 문장을 연 구 대상으로 삼았다. 연구 방법으로는 선어말어미 ‘-겠-’이 사용되는 문장을 통해 어떤 용언 뒤에 분포하는지를 면밀하게 살펴서 첫째, 구어 말뭉치와 문어 말뭉치에서 ‘-겠-’과 결합하는 빈도수가 가장 많은 용언 10개를 뽑았으며 둘째, 문장에서 ‘-겠-’이 어떤 선어말어미 뒤에 가장 많이 분포하는지를 하나씩 조사하며 셋째, 선어말어미 ‘-겠-’ 뒤에 어 떤 어말어미가 많이 결합하는지를 찾아내고자 한다. 본고는 구어 말뭉 치와 문어 말뭉치에 나타난 ‘-겠-’의 분포 양상을 정리하고 두 말뭉치에 서 나타난 차이점을 밝혔으며, 이 연구가 한국어 교육 현장에 기초 자료 로 활용될 수 있다는 점에 의의가 있다.
Cho, Eun & Oh, Sun-Young. (2023). “Representation of Native English Teachers and Korean English Teachers in Korean English Newspapers: A Corpus-based Critical Discourse Analysis”. The Sociolinguistic Journal of Korea, 31(2). 95-123. Native-speakerism, a pervasive issue in the field of English Language Teaching, is observed globally and prevalent in Korea. This ideology negatively affects both Native English Teachers (NETs) and Non-native English teachers like Korean English Teachers (KETs) for some reasons. This study utilizes corpus-based critical discourse analysis to examine the linguistic patterns and referential expressions used in Korean English newspapers to represent NETs and KETs. The analysis reveals significant disparities in their positions and authority within Korean English classrooms. Specifically, NETs are labeled as “assistants,” implying a subordinate role with limited authority, while KETs are referred to as “co-teachers,” signifying a more secure status. Moreover, the study highlights the challenges faced by KETs in demonstrating their English proficiency and sheds light on the discrimination faced by NETs who possess commodified linguistic capital and are of Caucasian descent. These findings emphasize the importance of raising awareness of native-speakerism in Korean newspapers.
In recent years, an array of studies has focused on ‘translationese’ (i.e., unique features that manifest in translated texts, causing second language (L2) writings to be similar to translated texts but different from native language (L1) writings). This intriguing linguistic pattern has motivated scholars to investigate potential markers for predicting the divergence of L1 and L2 texts. This study builds on this work, evaluating the feature importance ranking of specific translationese markers, including standardized type-token ratio (STTR), mean sentence length, bottom-frequency words, connectives, and n-grams. A random forest model was used to compare these markers in L1 and L2 academic journal article abstracts, providing a robust quantitative analysis. We further examined the consistency of these markers across different academic disciplines. Our results indicate that bottom-frequency words are the most reliable markers across disciplines, whereas connectives show the least consistency. Interestingly, we identified three-word lexical bundles as discipline-specific markers. These findings present several implications and open new avenues for future research into translationese in L2 writing.
The study aims to investigate Korean English learners' usage of pragmatic discourse markers in their impromptu speech. Korean English Learners' Spoken Corpus, abbreviated as KELSC, is the main data source for analysis(Jung, 2021). To analyze the features of pragmatic discourse markers in KELSC, three focal pragmatic discourse markers(PDM) okay, like, and so are selected and analyzed by using WordSmith 7.0(Scott, M. 2016) and Lancsbox 6.0(Brezina et al., 2021). The findings indicate that three focal PDMs okay, like, so are not appearing more frequently in the higher levels of learners, unlike previous studies. Instead, the intermediate levels of B1 and C1 used two focal PDMs, okay and like the most, respectively. However, the lowest A1 learners rarely used the focal PDMs in their speech. Two PDMs okay and so are used as a co-occurring pattern in level C while so and they have a shared collocate in level A.
국제 중국어 교재에 초과 한자와 초과 어휘가 존재한다는 것은 객관적인 사실이다. 이는 학생 이 텍스트를 이해하는데 영향을 주며, 교사가 수업을 진행하는데 있어서도 피하기 힘든 문제이 다. 본고는 《국제 중국어 교육 중국어 수준 등급 표준》를 기준으로, 『發展漢語』 고급 종합 교재에 포함되어 있는 초과 한자와 초과 어휘를 연구 대상으로 삼았다. 코퍼스 기술을 바탕으로 빠른 식별과 태깅을 진행하여, 『發展漢語』 고급 종합 단계 교재에 나타난 초과 한자와 초과 어휘 현황을 분석하였다. 또한, 초과 한자를 기준으로 真性과 假性으로 구분하고 글자 단위의 의미와 어휘 단위의 의미의 연관성을 근거로 교육 방법을 제안하였다. 한자와 연결되는 동사를 함께 가르치고, 한자와 어휘를 연결하여 학습시키는 방안은 학생의 중국어 학습 능력을 향상시킬 것이다.
Despite the massive impact of COVID-19 on society, beyond the numbers of confirmed cases and deaths, there remains a lack of large-scale data depicting the effects of the virus on the society of the Republic of Korea. To fill this gap, we collected 1.822 million news articles with more than 1 billion morphemes from January 2020 to June 2022, creating a Korean version of the Coronavirus Corpus. This corpus is introduced in the current study. In addition, to demonstrate how such massive corpus can be utilized, we conducted information theoretical analyses to see how the stance of the press media on topics such as vaccines and social distancing affected the COVID-19 situation in the Republic of Korea. Specifically, we utilized several computational linguistic skills including concordance building and sentiment analysis through both traditional and machine learning techniques and measured the transfer entropy to estimate the impact with information theory. The results suggest that the overall impact of the press media on the society was minimal to non-existent.
To clarify the concepts of dialects, vernacular and regional languages used with similar meanings, this study attempted to reveal the usage patterns and concepts of these expressions based on written corpus. The written corpus of printed newspaper articles from the online Naver News Library that archived newspaper articles from 1920 to 1999 and the news article corpus crawled by the online Naver News portal from January 1, 2004 to December 31, 2021 were extracted and analyzed. In particular, this paper analyzed the relationship between collates and keywords based on the corpus linguistic research methodology of the news article corpus for the past eighteen years and how they were being used in official records and press documents by corresponding with the 'dialects, vernacular, and regional languages' in socio-linguistic terms of modern Korean. The results are summarized as follows. First, the concept of linguistic norms that a dialects have terms corresponding to the words or standard languages was established after the 1930s. Second, in the library of newspaper articles published in the 20th century, dialects or vernaculars were perceived as negative objects to be removed in preparation for standard language. Third, it can be seen that the positive value judgment on 'vernacular' has increased in the corpus of news articles over the past decade. Fourth, dialects and vernacular, regional language, and standard language were used to be compatible with each other, and it can been seen that dialects were mainly used in academic contexts and vernacular were mainly used in everyday contexts. Fifth, it can be confirmed that the positive perception of standard language has been maintained in the 20th-century newspaper article corpus and the 21st-century news article corpus for the last eighteen years after the recognition of standard language.