This study examine the manner by
which media characteristics are reflected in text formation by-, focusing on book
advertising on Instagram. By analyzing book advertising, i.e., a type of advertising text on
Instagram, from a text-linguistic perspective, this study examines the textual
characteristics of Instagram advertising texts and compares them with book
advertisements in other media to identify the unique media characteristics of Instagram.
Book advertising on Instagram can be categorized into three types: traditional, hide, and
fan page. Differences in the structural characteristics and composition of linguistic and
visual symbols are observed in each type. Compared with book advertisements in print
and video media, the reversal technique due to page-type image exposure, direct exposure
to the advertisement target, and intuitive advertisement-content organization can be
regarded as examples that reflect the characteristics of Instagram as a medium. In
particular, the structure of book advertisements comprising [thumbnail > text >
conclusion] reveals the characteristics of the medium the most significantly. Additionally,
various aspects such as the linear organization of verbal and visual symbols and
hierarchical and complementary relationships, are observed, which are regarded as the
characteristics of book advertisements on Instagram.
This study aims to collect and analyze Common European Framework of Reference for Languages (CEFR)-related research in Korean language education to identify emerging trends. It examines 28 academic articles published in Korea from 2020 to 2024, using text mining and language network analysis methods. Term Frequency (TF) and Term Frequency-Inverse Document Frequency (TF-IDF) analyses revealed that studies on curriculum design and application in Korean language education appeared with high frequency. Semantic network analysis identified key research directions, such as comparing proficiency level systems in Korean curricula, proposing “mediation” activities based on CEFR, and evaluating CEFR as an assessment tool. Latent Dirichlet Allocation (LDA) topic modeling categorized the studies into three groups: (1) research directly analyzing CEFR, (2) research applying CEFR to overseas Korean language curriculum design, and (3) research comparing existing Korean curricula with CEFR. This study is significant as the first to analyze CEFR-related research trends in Korean language education. By employing objective data analysis tools such as text mining, it enhances the reliability of findings and provides valuable insights into recent research trends.
This study attempted to examine the relationship between traditional architecture and its corresponding modern architecture by using the dynamic characteristics of text linguistics. The study assumed that past and present buildings, which maintain some kind of relationship, were a single text, and explored its internal structure that generated continuous textuality. As a case study, the buildings by Wang Shu and Kuma Kengo was reinterpreted using the techniques of cohesive structure to analyze their continuity with each tradition. The results showed that both architects used a variety of strategies to inherit tradition, but there were also differences in applying expressive and semantic aspects. Wang Shu attempted a modern reinterpretation of its architectural expressions at various levels, while Kuma actively borrowed traditional materials, structures, and patterns allowing various alteration in their meanings. We found that some concepts of text linguistics could be applicable as a meaningful perspective for analyzing and evaluating modern architecture that inherits tradition. We hope that our approach will develop into a comprehensive methodology for architectural analysis through more diverse attempts in the future.
This study used text mining to analyze public interest and research trends related to the Nakdong River. We examined news articles (1990~2024) and academic publications (1960~2024) to understand the evolving relationship between societal concerns and scientific research. Main findings reveal growing public interest towards the Nakdong River, with initial focus on pollution related to the industrial development shifting to large-scale river modification projects and water quality issues. This increased awareness mirrored trends in research, where early emphasis on classic ecology and water quality expanded to include sociocultural, educational aspects and advanced methodologies. The study highlights a dynamic interplay between public discourse and scientific inquiry, with research priorities aligning with societal concerns like water pollution, algal blooms, and biodiversity loss, underscoring the need for integrated, multidisciplinary research that addresses emerging environmental challenges and promotes sustainable management of the Nakdong River ecosystem under climate change and other societal shifts.
본 연구의 목적은 그동안 한국 불교가 다문화 사회에서 이주민을 수용 하는 데에 어떠한 역할과 방향성을 제시하였는지에 대해서 연구적 성과 를 통해서 살펴보는 것이다. 이를 위하여 RISS에서 ‘불교’와 ‘다문화’를 키워드로 검색하여 국내 학술지에 등재된 연구 논문의 국문초록을 수집 하고 명사를 추출한 후 텍스트 마이닝 분석 방법 중 키워드 분석 방법과 언어 네트워크 분석을 실시하였다. 분석 결과, 불교와 다문화 관련 연구 들은 종교적 관점보다는 전통 한국 문화의 일부로서 불교적 요소를 기반 으로 하여, 이주민의 한국사회 통합을 모색하고자 하는 경향을 보였다. 특히 한국으로 유입한 이주민을 불교의 상생과 화합으로 포용하고자 하 는 것이 한국적 다문화를 실현하는 것으로 보았다. 이러한 연구적 성과 에도 불구하고, 한국 불교가 종교적 경계를 넘어서서, 한국사회문화 측면 에서 불교의 상생과 화합이 어떻게 구체화하여 실천할 것인지에 대한 논 의는 여전히 부족한 실정이었다. 따라서 향후 한국적 다문화를 실현하기 위한 학문적 논의가 구체적으로 진행될 필요가 있다.
The purpose of this study was to analyze English subject-specific descriptions through text mining, examine their alignment to the curriculum achievement standards, and ultimately support students’ educational growth. We collected English subject-specific descriptions for 1,030 tenth-graders from general high schools in City A, and keywords and contexts were extracted using TF, TF-IDF, phi coefficient analysis, and trigram analysis. The results revealed that the subject-specific descriptions frequently neglected the following aspects of learning and instruction in curriculum achievement standards: familiar and general themes, conversation and listening skills, language use across different types of information, and proper email writing. Although descriptions are intended to reflect students’ actual achievement levels, those for lower achievement levels (i.e., D and E) were often overstated. Improvements are necessary to ensure closer alignment between the descriptions and the curriculum achievement standards, with particular emphasis on the accurate representation of lower achievement levels. Based on the findings, we discussed potential improvement strategies for educational authorities to consider and implement.
현재 존재하는 인공지능 기반 음악 생성에 관한 여러 모델과 연구는 수동 텍스트(Text) 기반 음악 생성에 대해 다루고 있다. 본 논문은 사용자의 편의성을 높이고, 창의적인 음악 생성 과정 을 더욱 원활하게 할 수 있도록 텍스트(TEXT) 프롬프트(Prompt) 자동화를 통한 음악 생성시 스템 방안을 제안한다. 그 방안으로 음원 파일을 통해 수집한 음악 분석 및 데이터화와 가사 정보에서 추출한 키워드를 기반한 장르, 가수, 앨범 등의 정보가 포함된 데이터셋(Dataset)을 구축 후, 파이썬(Python)의 자연어 처리 방법인 Konlpy를 사용하여 가사 데이터를 토큰화하고, TF-IDF(Term Frequency-Inverse Document Frequency) 벡터화를 통해 중요한 단어를 추 출한다. 또한, MFCC, 템포 등의 특징 데이터셋을 통하여 모델을 통한 감정을 예측하고, CNN 모델 및 Chatgpt를 활용한 텍스트 프롬프트를 자동생성하는 방법을 구현하여, MusicGen 모델 을 사용한 자동화 생성 프롬프트 기반 음악을 생성한다. 본 텍스트 프롬프트 자동 생성 화를 통한 음악 생성 연구의 결과는 음악 데이터 분석 및 생성 분야에 기여될 것으로 기대한다.
The increase in the global sugar-free trend and interest in sugar-free products has resulted in most consumers becoming more interested in products with low or no sugar content. This study explored consumer perceptions of sugar-free products through text network analysis using big data. After collecting the texts, 50 key words were extracted through frequency analysis and TF-IDF analysis. Subsequently, they were categorized into four clusters using degree centrality analysis, social network analysis, and CONCOR analysis, to arrive at the implications. The limitations of the study were then listed.
이 연구는 텍스트마이닝 방법을 활용하여 팡팡의 우한일기 텍스트를 해체, 조합 하고 페어클로프의 비판적 담론 분석(Critical Discourse Analysis) 모형을 적용, 우 한일기의 담론 구조와 양상을 분석하였다. 분석 결과, 우한일기 ‘제목+본문’ 구조 에서 정보성 담론과 의견과 주장 담론을 선택적 배치하였다. ‘武汉’, ‘疫情’ 등 단어와 ‘愤怒, ‘武汉人’, ‘医生朋友’, ‘极左’ 등 단어가 핵심어로 선정되었다. 담론적 실천은 1. ‘우한 봉쇄 상황’ 정보성 담론, 2.‘우한 지역의 코로나 상황’ 정보성 담론, 3.‘대응 실패 책임론’ 의견, 주장의 담론, 4.‘봉쇄된 시민의 일상과 비극’ 정보와 주장 혼합 담론, 5. ‘반대 의견자의 공격’ 상호텍스트성 담론이 도출되었다. 반대 의견의 ‘极左’ 담론은 텍스트 밖에서 ‘증오와 갈등’ 담론으로 탈·접합되었다.
황해는 지정학적으로 한국, 중국, 북한 사이 해역에 위치하고 있으며, 최근 해양공간 이용이 확대되어 사회적·경제적 가치가 증가하고 있다. 또한 기후변화로 인한 해양환경 변화, 대기오염물질 이동 등 한·중 공동 대응 및 협력의 필요성이 증가되고 있다. 본 연구 에서는 황해(Yellow Sea) 키워드의 연구논문을 대상으로 핵심주제(Topic)을 도출하고, 저자 네트워크 분석을 수행하여 연구동향을 탐색하 였다. 연구대상으로 1984년부터 2021년 사이에 게재된 Web of Science DataBase의 황해 관련 연구논문을 추출하고, 한중 어업협정, 해양환 경공동조사 등 한국과 중국의 주요 이벤트를 중심으로 4개의 시기로 구분하였다. 연구방법으로 텍스트 마이닝(Text Mining)의 일종인 토픽 모델링(Topic Modeling)을 활용하여 Topic을 도출하였다. 또한 저자 네트워크를 분석하여 해당 분야의 주요 연구 그룹(Community)과 연구자 및 연구기관의 영향력을 파악하고 시사점을 제시하였다. 분석결과 황해 연구논문의 핵심주제는 1기 퇴적물, 해양생물, 2기 산성화, 미세먼 지, 3기 수산양식, 지진, 4기 탄소요인, 해양생태계 등으로 변화하였고, 시기별로 핵심 연구자를 중심의 연구자 그룹이 증가하였다. 연구결 과를 토대로 황해 관련 연구 동향과 주요 연구자 및 연구기관을 파악함으로써 향후 한국과 중국 간의 황해 연구협력에 기여하고자 한다.
To investigate the national science and technology policy direction in the field of construction machinery, an analysis was conducted on projects selected as national research and development (R&D) initiatives by the government. Assuming that the project titles contain key keywords, text mining was employed to substantiate this assumption. Project information data spanning nine years from 2014 to 2022 was collected through the National Science & Technology Information Service (NTIS). To observe changes over time, the years were divided into three-year sections. To analyze research trends efficiently, keywords were categorized into groups: ‘equipment,’ ‘smart,’ and ‘eco-friendly.’ Based on the collected data, keyword frequency analysis, N-gram analysis, and topic modeling were performed. The research findings indicate that domestic government R&D in the construction machinery field primarily focuses on smart-related research and development. Specifically, investments in monitoring systems and autonomous operation technologies are increasing. This study holds significance in analyzing objective research trends through the utilization of big data analysis techniques and is expected to contribute to future research and development planning, strategic formulation, and project management.
본 연구는 국내 해양스포츠의 사회적 인식이 어떻게 형성되었는지를 알아보고자 수행되었다. 이를 위해 해양스포츠의 대표적 종목인 요트, 조정, 카누와 관련된 최근 10년간 국내 언론 보도기사의 키워드 및 토픽을 활용하여 빅데이터 분석 방법 중 텍스트 마이닝 분석을 실시하였으며, 도출된 결과는 다음과 같다. 첫째, TF 분석과 워드 클라우드 분석 결과 해양, 대회, 체험, 관광, 세계, 요트, 카누, 레 저, 참여등이 상위 키워드로 나타났다. 둘째, 의미연결망 분석 결과 요트는 해양, 산업, 대회, 레저, 관광, 보트, 시설, 사업 등과 상관관계가 나타났고, 조정은 대회, 충주 등과, 카누는 해양, 대회, 체험, 레저, 관광 등과 상관관계가 나타났다. 셋째, 토픽모델링 분석 결과 요트, 조 정, 카누가 엘리트 체육과 해양레저스포츠로서 인식이 형성된 것을 알 수 있었으나 시간의 변화에 따라 사회전반적인 쟁점과 의견의 흐 름 및 사회적 변화는 미미한 것으로 나타났다. 이상의 결과를 종합하면 요트와 카누는 엘리트 체육이라는 인식에서 해양레저스포츠로 점차 인식이 형성되어 해양레저산업에 중요한 요소로 활용되고 있다는 것을 알 수 있었으며, 조정은 엘리트 체육 중심의 사회적 인식이 크게 변하지 않아 해양레저스포츠로서 대중화가 아직은 미미한 것으로 사료된다.
Based on conceptual metaphor theory and speech act, this study aims to examine the communicative functions of language use by analyzing texts used in Seoul’s urban design. Considering that life in a modern society is based on the ecosystem of its cities, the importance of urban design in increasingly felt by modern individuals who share limited space and move along predetermined routes. According to El-Khoury and Robbins (2004), urban design is both an abstract and relative concept, and the purpose of a city can be interpreted differently according to differences in experience and perspective. Conceptual metaphorical language expressions not only have a communicative function but also provide the hearer with a certain perspective by concretizing the events or phenomena indicated by the speaker. Metaphorical language expressions based on metaphors created by the speaker perform speech acts by serving as an effective means of persuasion and communication (Searle 1979). We examine the linguistic aspects based on the metaphor of the development of illocutionary forces in Seoul’s urban design texts.
This study conducted a big data analysis targeting the concept of "Ruralism," which is important in rural development, and the keywords "Rurality" and "Rural-amenity," which are similarly used. Keyword frequency analysis, key keyword analysis, network analysis, and emotional analysis were conducted by applying text mining techniques, which are methods of analyzing unstructured data online, to present basic data on the establishment of the concept of Ruralism for rural space maintenance. As a result of the study, conservation for Ruralism was the most important in the case of keyword frequency analysis, and differences between the Rurality and Rural-amenity keywords, which were used similarly to Ruralism, were identified through major keywords, indicating that Ruralism is a concept that has a more comprehensive range of rural areas than other concepts. In the case of the network, the network shown in Ruralism was prominent in improving the quality of life of invisible residents, and the last emotional analysis showed that it was necessary to prepare standards to overcome the possibility of preserving Ruralism and difficult policy directions. This study is meaningful in that it identifies online perceptions and looks at them from a macro perspective so as not to be confused by looking at keywords used similarly to Ruralism at a time when setting mid- to long-term policy directions is important.
목적 : 본 연구에서는 텍스트 마이닝을 활용하여 치매 보조기기에 대한 국외 연구의 대상자, 적용 환경, 활 용된 보조기기 및 연구 목적에 대한 핵심 키워드를 추출 및 분석하여 치매 보조기기 관련 연구의 동향 을 파악하였다.
연구방법 : 국외 연구데이터베이스에서 1,126건의 연구를 수집하였으며, KH coder 3 프로그램을 이용하 여 11,366개의 단어를 추출하였다. 연구자가 추출된 단어를 검토하여 연구의 대상자, 보조기기가 적용 된 환경, 활용된 보조기기, 연구 목적과 관련된 키워드들을 추출 및 분류하였다. 이후, 추출된 키워드에 대하여 빈도분석을 실시하였으며, 동시출현단어 분석을 통해 연관어 네트워크를 생성하였다.
결과 : 빈도분석 결과, 가장 많이 연구된 대상자, 환경, 적용된 보조기기, 연구 목적 유형은 보호자, 집, 프 로그램/앱, 사회참여 및 상호작용 보조였다. 연관어 네트워크 생성 결과, 보호자는 정서 및 심리지지와 돌봄과 연관성을 보였으며 돌봄은 보조기기 유형 중 원격의료와 연관성을 보였다. 사회참여를 목적으로 하는 경우에는 프로그램/앱과 로봇과 연관성을 보였다.
결론 : 본 연구의 결과를 통해 치매 보조기기에 대한 국외 연구의 주 연구 대상자와 환경 및 활용 보조기 기, 연구 목적을 확인하였으며, 각 영역 간의 관계성을 확인하였다. 본 연구의 결과는 치매 보조기기 선 택에 대한 정보제공과 치매 보조기기 지원 정책에 대한 방향성을 제시해 줄 수 있을 것으로 기대된다.
본 연구의 목적은 텍스트 마이닝과 소셜 네트워크 분석을 활용한 소비자 맞음새 평가의 주요 특징을 규명하는 것이다. 이를 위해 SNS에서 수집된 소비자의 2,000여건의 의복 맞음새 평가 후기로부터 의복 맞음새 관련된 텍스트 데이터를 추출하고 의미연결망 분석과 CONCOR 분석을 수행하였다. 연구 결과, '팬츠'와 '스커트'가 많은 맞음새평가 어를 공유하며 다양한 형태로 평가되는 것을 확인하였고 의복의 길이가 가장 많이 평가되었다. 인체부위 중 '허리'는 다양한 의복의 맞음새를 평가하는 가장 중요한 부분이며 의복 맞음새평가어 중 '넓은', '큰', '와이드한', '긴' 등이 가장 많이 사용되는 것으로 나타났다. 본 연구는 소비자 맞음새 평가에 사용된 언어의 구조적 관계와 의미를 구체적으로 규명하고 의복 맞음새의 향상을 위한 실증적 기초 자료를 제공하는데 의의가 있다.
지능형 컴퓨팅의 등장으로 빅데이터를 활용한 패션 브랜드 의미 마이닝과 가치 홍보에 초점을 맞춘 새로운 연구 트렌드가 등장하였다. 본 연구의 목적은 인기 여성복 브랜드 5개를 대상으로 다양한 종류의 의류에 대한 소비자 감성 트렌드를 조사하는 것이다. 유니클로, 에이치스타일, 베로모다, 피스버드, 온리. 이를 위해 총 93,550건의 소비자 평가를 수집하고, 키스멧 감성 분석 엔진을 활용하여 의류 유형별 감성 극성도를 분석하였 다. 그 결과, 브랜드에 따라 감정 극성이 크게 다르다는 것을 알 수 있었으며, HSTYLE 후드티, ONLY 니트웨 어, 피스버드 순면, 유니클로 니트가 각각 소비자들에게 가장 강한 긍정적 감정을 불러일으켰다. 또한 이번 연 구에서는 각 브랜드에서 가장 인기 있는 의류 유형과 착용 효과를 밝혀 패션 기업이 효과적인 마케팅 전략을 수립하고 제품 제공을 강화하는 데 중요한 인사이트를 제공했다. 이러한 연구 결과를 바탕으로 게임 업계에서 는 감성 분석을 적용하여 다양한 게임 브랜드, 장르, 게임 플레이에 대한 플레이어의 감정 반응을 이해하고 게임 프로모션 전략과 제품 디자인 개발에 도움을 줄 수 있다. 전반적으로 이 연구 결과는 디자인 분야에서 빅데이터의 잠재력을 입증하고 업계에서 경쟁 우위를 확보하기 위해 빅데이터를 활용하는 것이 중요하다는 점을 강조할 수 있다.
Advertisement allows for multimodal access to sounds, colors, picture animations, and diverse symbols. Little research has reported the interrelationship among multimodality, discursive practice, and media effects in English language education. This study aims to conduct a multimodal approach to discourse analysis on the Test of English for International Communication (TOEIC) in TV advertisements and to explore the unique significance of the research methodology. The multimodality in three TV Ads (A, B, C) was investigated by referring to Halliday's systemic functional grammar, social semiotics’ visual grammar, and typography’s distinctive features. Royce’s intersemiotic complementarity was also employed as an analytic framework for the collected multimodal data from three domains (representational, interpersonal, and textual/compositional) of meaning-making schemes. It was found that different modes (language, typography, visual image) acted complementarily and efficiently to deliver the message of TOEIC: problem-solving ‘skill’ in A, financial 'support and return’ in B, and ‘AI database’ in C. Further research is also discussed, especially with regard to ‘critical’ approaches to multimodal discourse studies.
This study applied the text frequency method to analyze the crops prevalent during the Chosunwangjoshilrok dynasty, and categorized the results by each king. Contemporary perception of grains was observed by examining the staple crop types. Staple species were examined using the word cloud and semantic network analysis. Totally, 101,842 types of crop consumption were recorded during the Chosunwangjoshilrok period. Of these, 51,337 (50.4%) were grains, 50,407 (49.5%) were beans, and 98 (0.1%) were seeds. Rice was the most frequently consumed grain (37.1%), followed by pii (11.9%), millet (11.3%), barley (4.5%), proso (0.8%), wheat (0.6%), buckwheat (0.1%), and adlay (0.05%). Grain chronological frequency in the Choseon dynasty was determined to be 15,520 cases in the 15th century (30.2%), 11,201 cases in the 18th century (21.8%), 9,421 cases in the 17th century (18.4%), 9,113 cases in the 16th century (17.8%), and 6,082 cases in the 19th century (11.8%). Interest in grain amongst the 27 kings of Choseon was evaluated based on the frequency of records. The 15th century King Sejong recorded the maximum interest with 13,363 cases (13.1%), followed by King Jungjo (8,501 cases in the 18th century; 8.4%), King Sungjong (7,776 cases in the 15th century; 7.6%).
In this study, text mining was conducted on the product names of skirts, pants, shirts/ blouses, and dresses to analyze the characteristics of keywords appearing in online shopping product names. As a result of frequency analysis, the number of keywords that appeared 0.5% or more for each item was around 30, and the number of keywords that appeared 0.1% or more was around 150. The cumulative distribution rate of 150 terms was around 80%. Accordingly, information on 150 key terms was analyzed, from which item, clothing composition, and material information were the found to be the most important types of information (ranking in the top five of all items). In addition, fit and style information for skirts and pants and length information for skirts and dresses were also considered important information. Keywords representing clothing composition information were: banding, high waist, and split for skirts and pants; and V-neck, tie, long sleeves, and puff for shirts/blouses and dresses. It was possible to identify the current design characteristics preferred by consumers from this information. However, there were also problems with terminology that hindered the connection between sellers and consumers. The most common problems were the use of various terms with the same meaning and irregular use of Korean and English terms. However, as a result of using co-appearance frequency analysis, it can be interpreted that there is little intention for product exposure, so it is recommended to avoid it.