본 연구는 웹툰 IP 기반의 게임의 성공과 실폐 사례를 분석하고 안정적인 웹툰의 게임화를 위 해 웹툰 장르별 특성에 맞는 텍스트 기반 게임 유형을 제안한다. 로맨스, 판타지, 액션, 스릴러, 드라마, 코미디 등 다양한 웹툰 장르와 인터랙티브 소설, RPG, 턴제 전투게임, 텍스트 어드벤처 등 게임 장르를 매칭하여 각 장르의 핵심 요소를 게임 메커니즘으로 전환하는 방안을 제시한 다. 또한 텍스트 기반 게임의 장점으로 상상력 자극, 깊이 있는 스토리텔링, 상호작용성 증대 등을 언급하며, 이를 통해 웹툰 IP의 확장과 팬 참여 촉진 가능성을 탐구한다.
현재 존재하는 인공지능 기반 음악 생성에 관한 여러 모델과 연구는 수동 텍스트(Text) 기반 음악 생성에 대해 다루고 있다. 본 논문은 사용자의 편의성을 높이고, 창의적인 음악 생성 과정 을 더욱 원활하게 할 수 있도록 텍스트(TEXT) 프롬프트(Prompt) 자동화를 통한 음악 생성시 스템 방안을 제안한다. 그 방안으로 음원 파일을 통해 수집한 음악 분석 및 데이터화와 가사 정보에서 추출한 키워드를 기반한 장르, 가수, 앨범 등의 정보가 포함된 데이터셋(Dataset)을 구축 후, 파이썬(Python)의 자연어 처리 방법인 Konlpy를 사용하여 가사 데이터를 토큰화하고, TF-IDF(Term Frequency-Inverse Document Frequency) 벡터화를 통해 중요한 단어를 추 출한다. 또한, MFCC, 템포 등의 특징 데이터셋을 통하여 모델을 통한 감정을 예측하고, CNN 모델 및 Chatgpt를 활용한 텍스트 프롬프트를 자동생성하는 방법을 구현하여, MusicGen 모델 을 사용한 자동화 생성 프롬프트 기반 음악을 생성한다. 본 텍스트 프롬프트 자동 생성 화를 통한 음악 생성 연구의 결과는 음악 데이터 분석 및 생성 분야에 기여될 것으로 기대한다.
디지털 전환(Digital Transformation) 시기에 인사 데이터를 활용한 전략적 인사 의사결정이 중요해졌 으며 이를 지원할 People Analytics(PA)에 대한 수요와 관심이 증가하고 있다. 본 논문은 PA를 수행하기 위해 필요한 역량이 무엇인지 텍스트 마이닝과 선행 연구를 통해 알아본다. 선행 연구에서는 반구조화 인터뷰와 문헌 연구를 통해 연역적 연구 방법으로 PA 필요 역량을 제시한 반면 본 연구에서는 텍스트마 이닝 기법을 적용하여 귀납적 방법을 활용했다. 이를 통해 선행 연구를 보완함으로써 일반화 가능성을 높이고자 했다. 링크드인(LinkedIn) PA 채용공고 데이터를 활용해 분석한 결과, 주요 역량이 다섯 가지가 도출되었다. 첫째, 비즈니스 및 인적 통찰력(Business and People Acumen), 둘째, 데이터 분석(Data Analysis), 셋째, 의사소통(Communication), 넷째, 문제 해결력(Problem Solving), 다섯째, 상호 작용 (Interpersonal)까지 다섯 가지 PA 필요 역량이다. 다섯 가지 역량은 기존 연역적 분석으로 도출된 결과를 지지 및 보완한다고 할 수 있다. 이를 통해 기존 연구에 방법론적인 새로움을 더한다고 할 수 있고, 동시 에 실무 측면에서는 채용과 육성 관점에서 어떤 역량을 주요하게 봐야 하는지를 제시했다고 볼 수 있다.
The changing media landscape has diversified how and what is discussed about fashion. This study aims to examine expert discussions about fashion shows on social media from the perspective of fashion criticism. To achieve this goal objectively, a text mining program, Leximancer, was used. In total, 58 videos were collected from the panel discussion section of Showstudio from S/S 21 to S/S 24, and the results of text mining on 24,080 collected texts after refinement are detailed here. First, the researchers examined the frequency of keywords by season. This revealed that in 2021–2022, digital transformation, diversity, and fashion films are now commonly used to promote fashion collections, often replacing traditional catwalk shows. From 2023, sustainability and virtuality appeared more frequently, and fashion brands focused on storytelling to communicate seasonal concepts. In S/S 2024, the rise of luxury brand keywords and an increased focus on consumption has been evident. This suggests that it is influenced by social and cultural phenomena. Second, the overall keywords were analyzed and categorized into five concepts: formal descriptions and explanations of the collection’s outfits, sociocultural evaluations of fashion shows and designers, assessments of the commerciality and sustainability of the current fashion industry, interpretations of fashion presentations, and discussions of the role of fashion shows in the future. The significance of this study lies in its identification of the specificity of contemporary fashion criticism and its objective approach to critical research.
This study utilized text mining analysis to identify keywords used in the research of gray mold (Botrytis cinerea), taking into account horticultural crops, environmental or physical treatments, and chemical or material factors. Data spanning from 1980 to 2021 was gathered from ScienceON and interpreted using word cloud visualization analysis following post-processing. Morphological analysis and coding were conducted using the text mining packages library tm provided by the R program. Our review of B. cinerea included and analyzed 7,342 papers. Among the extracted words, those related to crops and ranking in the top 10 were tomato, strawberry, grape, apple, cucumber, bean, kiwifruit, rose, pepper, and pear. roses were the only flower in the top 10 horticultural crops. Research has explored environmental or physical treatment factors such as storage, temperature, cold, seasons, humidity, heat/hot UV-C, sprays, films, and coatings. Chemical or material words included fungicide, chitosan, ethylene, oil, ROS, ABA, VOC, glucose, carbon, and ethanol.
이 연구는 텍스트마이닝 방법을 활용하여 팡팡의 우한일기 텍스트를 해체, 조합 하고 페어클로프의 비판적 담론 분석(Critical Discourse Analysis) 모형을 적용, 우 한일기의 담론 구조와 양상을 분석하였다. 분석 결과, 우한일기 ‘제목+본문’ 구조 에서 정보성 담론과 의견과 주장 담론을 선택적 배치하였다. ‘武汉’, ‘疫情’ 등 단어와 ‘愤怒, ‘武汉人’, ‘医生朋友’, ‘极左’ 등 단어가 핵심어로 선정되었다. 담론적 실천은 1. ‘우한 봉쇄 상황’ 정보성 담론, 2.‘우한 지역의 코로나 상황’ 정보성 담론, 3.‘대응 실패 책임론’ 의견, 주장의 담론, 4.‘봉쇄된 시민의 일상과 비극’ 정보와 주장 혼합 담론, 5. ‘반대 의견자의 공격’ 상호텍스트성 담론이 도출되었다. 반대 의견의 ‘极左’ 담론은 텍스트 밖에서 ‘증오와 갈등’ 담론으로 탈·접합되었다.
한국의 정원수는 2015년 7개에서 2022년 98개로 급격히 증가하였다. 늘어나는 정원 인프라의 수에 비해서 유지관리를 위한 지속적 정책과 연구는 미진한 상황이다. 본 연구는 효율 적인 정원 관리 정책을 도출하기 위해 주민들의 인식을 조사 하였다. 토픽 모델링, 감성 분석 등 텍스트 마이닝을 활용해 정원 참여 유형에 따른 주민 인식을 조사하였다. 주민 주도 정 원 그룹에서는 ‘정원정책’, 관 주도 정원 그룹에서는 ‘주민에 게 미치는 영향’이라는 주제에 의견이 집중되었다. 감성 분석 에서는 주민 주도 정원 그룹이 관 주도 정원 그룹보다 긍정어 점수가 더 높았다. 이러한 결과는 주민과 만족도 사이에 강한 사회적 연결이 있음을 나타낸다. 또한 주민 주도 정원 그룹에 서는 유지관리 업무를 맡은 주민들이 이를 자기계발의 한 형 태로 여기는 것으로 나타났다. 이러한 결과는 주민 주도 정원 관리 유형이 정원정책에 시사하는 바가 크며, 정원 내 일자리 와도 관련이 있음을 알 수 있다.
황해는 지정학적으로 한국, 중국, 북한 사이 해역에 위치하고 있으며, 최근 해양공간 이용이 확대되어 사회적·경제적 가치가 증가하고 있다. 또한 기후변화로 인한 해양환경 변화, 대기오염물질 이동 등 한·중 공동 대응 및 협력의 필요성이 증가되고 있다. 본 연구 에서는 황해(Yellow Sea) 키워드의 연구논문을 대상으로 핵심주제(Topic)을 도출하고, 저자 네트워크 분석을 수행하여 연구동향을 탐색하 였다. 연구대상으로 1984년부터 2021년 사이에 게재된 Web of Science DataBase의 황해 관련 연구논문을 추출하고, 한중 어업협정, 해양환 경공동조사 등 한국과 중국의 주요 이벤트를 중심으로 4개의 시기로 구분하였다. 연구방법으로 텍스트 마이닝(Text Mining)의 일종인 토픽 모델링(Topic Modeling)을 활용하여 Topic을 도출하였다. 또한 저자 네트워크를 분석하여 해당 분야의 주요 연구 그룹(Community)과 연구자 및 연구기관의 영향력을 파악하고 시사점을 제시하였다. 분석결과 황해 연구논문의 핵심주제는 1기 퇴적물, 해양생물, 2기 산성화, 미세먼 지, 3기 수산양식, 지진, 4기 탄소요인, 해양생태계 등으로 변화하였고, 시기별로 핵심 연구자를 중심의 연구자 그룹이 증가하였다. 연구결 과를 토대로 황해 관련 연구 동향과 주요 연구자 및 연구기관을 파악함으로써 향후 한국과 중국 간의 황해 연구협력에 기여하고자 한다.
Species distribution model (SDM) is used to preserve biodiversity and climate change impact. To evaluate biodiversity, various studies are being conducted to utilize and apply SDM. However, there is insufficient research to provide useful information by identifying the current status and recent trends of SDM research and discussing implications for future research. This study analyzed the trends and flow of academic papers, in the use of SDM, published in academic journals in South Korea and provides basic information that can be used for related research in the future. The current state and trends of SDM research were presented using philological methods and text-mining. The papers on SDM have been published 148 times between 1998 and 2023 with 115 (77.7%) papers published since 2015. MaxEnt model was the most widely used, and plant was the main target species. Most of the publications were related to species distribution and evaluation, and climate change. In text mining, the term ‘Climate change’ emerged as the most frequent keyword and most studies seem to consider biodiversity changes caused by climate change as a topic. In the future, the use of SDM requires several considerations such as selecting the models that are most suitable for various conditions, ensemble models, development of quantitative input variables, and improving the collection system of field survey data. Promoting these methods could help SDM serve as valuable scientific tools for addressing national policy issues like biodiversity conservation and climate change.
본 연구는 어촌다운 어촌 조성과 추후 어촌 개발 사업의 근거 및 방향을 제시하는 것을 목적으로 ‘어촌 다움’을 키워드로 텍스트마이닝 분석을 진행하였다. 텍스트마이닝은 온라인상의 비정형 데이터를 분 석하는 방법으로 키워드의 등장 횟수를 나타내는 키워드 빈도분석, 키워드 간의 관계를 시각화하여 나 타내는 N-gram 분석, 텍스트에 나타나는 사람들의 의견이나 성향을 분석하는 감성분석을 통해 다음과 같은 결론을 내렸다. 첫째, ‘어촌다움’ 키워드는 어촌뿐만 아니라 농촌, 산촌 등 타 촌락과의 연관성이 있으며, 상호 관계와 고유한 조건 속에서 특성이 나타나고 있음을 알 수 있었다. 둘째, ‘어촌다움은’ 크게 자연·역사 경관의 보전 및 회복과 주민들의 정주여건 및 환경개선 총 두 가지 방향으로 구분할 수 있었 다. 셋째, ‘어촌다움’ 키워드에 가장 연관이 있었던 어촌 개발 사업인 어촌뉴딜 사업은 감성분석 결과 긍정적인 역할을 했으나 ‘어촌다움’의 일부인 어촌 주민의 정주여건 개선 및 정주기반 구축은 아직 미 비하며, 개선이 필요함을 알 수 있었다. 본 연구는 ‘어촌다움’과 유사한 키워드인 ‘어촌스러움’, ‘어촌다 운’ 등의 키워드를 함께 분석하지 못한 한계점이 있으며, 향후 이러한 키워드와의 종합적인 분석과 어 촌지역 정주기반에 대한 세부적인 방향 제시가 필요할 것으로 판단한다.
EU taxonomy requires to solve problems for safe management of radioactive waste and disposal of spent fuel, which is a precondition for growing demand for nuclear power plant. Currently, Korea manages about 18,000 tons of high-level radioactive waste at temporary storage facilities in nuclear power plant sites, but such temporary storage facilities are expected to become saturated sequentially from 2031. Therefore, it is necessary to secure a permanent disposal facility to safely treat high-level radioactive waste. In accordance with the second basic plan for high-level radioactive waste management in 2021, it is necessary to establish requirements for regulatory compliance for the site selection and site acquisition, investigation and evaluation, and construction for the establishment of a deep geological disposal facility. In this study, we analyzed the regulatory policies and cases of leading foreign countries related to deep geological disposal facilities for high-level radioactive waste disposal waste such as IAEA, USA, Sweden, and Finland using data analysis methodology. To analyze a large amount of textbased document data, text mining is applied as a major technology and a verification standard that secures validity and safety based on the regulatory laws described so far is developed to establish a regulatory base suitable for domestic deep geological disposal status. Based on the collected data, preprocessing and analysis with Python were performed. Keywords and their frequency were extracted from the data through keyword analysis. Through the measured frequency values, the contents of the objects and elements to be regulated in the statutory items were grasped. And through the frequency values of words co-occurring among different sections through the analysis of related words, the association was obtained, and the overall interpretation of the data was performed. The results of analyzing regulations of major foreign countries using text mining are visualized in charts and graphs. Word cloud can intuitively grasp the contents by extracting the main keywords of the contents of the regulations. Through the network connection graph, the relationship between related words can be visually structured to interpret data and identify the causal relationship between words. Based on the result data, it is possible to compare and analyze the factors to be supplemented by analyzing domestic nuclear safety case and regulations.
To investigate the national science and technology policy direction in the field of construction machinery, an analysis was conducted on projects selected as national research and development (R&D) initiatives by the government. Assuming that the project titles contain key keywords, text mining was employed to substantiate this assumption. Project information data spanning nine years from 2014 to 2022 was collected through the National Science & Technology Information Service (NTIS). To observe changes over time, the years were divided into three-year sections. To analyze research trends efficiently, keywords were categorized into groups: ‘equipment,’ ‘smart,’ and ‘eco-friendly.’ Based on the collected data, keyword frequency analysis, N-gram analysis, and topic modeling were performed. The research findings indicate that domestic government R&D in the construction machinery field primarily focuses on smart-related research and development. Specifically, investments in monitoring systems and autonomous operation technologies are increasing. This study holds significance in analyzing objective research trends through the utilization of big data analysis techniques and is expected to contribute to future research and development planning, strategic formulation, and project management.
본 연구는 국내 해양스포츠의 사회적 인식이 어떻게 형성되었는지를 알아보고자 수행되었다. 이를 위해 해양스포츠의 대표적 종목인 요트, 조정, 카누와 관련된 최근 10년간 국내 언론 보도기사의 키워드 및 토픽을 활용하여 빅데이터 분석 방법 중 텍스트 마이닝 분석을 실시하였으며, 도출된 결과는 다음과 같다. 첫째, TF 분석과 워드 클라우드 분석 결과 해양, 대회, 체험, 관광, 세계, 요트, 카누, 레 저, 참여등이 상위 키워드로 나타났다. 둘째, 의미연결망 분석 결과 요트는 해양, 산업, 대회, 레저, 관광, 보트, 시설, 사업 등과 상관관계가 나타났고, 조정은 대회, 충주 등과, 카누는 해양, 대회, 체험, 레저, 관광 등과 상관관계가 나타났다. 셋째, 토픽모델링 분석 결과 요트, 조 정, 카누가 엘리트 체육과 해양레저스포츠로서 인식이 형성된 것을 알 수 있었으나 시간의 변화에 따라 사회전반적인 쟁점과 의견의 흐 름 및 사회적 변화는 미미한 것으로 나타났다. 이상의 결과를 종합하면 요트와 카누는 엘리트 체육이라는 인식에서 해양레저스포츠로 점차 인식이 형성되어 해양레저산업에 중요한 요소로 활용되고 있다는 것을 알 수 있었으며, 조정은 엘리트 체육 중심의 사회적 인식이 크게 변하지 않아 해양레저스포츠로서 대중화가 아직은 미미한 것으로 사료된다.
This study conducted a big data analysis targeting the concept of "Ruralism," which is important in rural development, and the keywords "Rurality" and "Rural-amenity," which are similarly used. Keyword frequency analysis, key keyword analysis, network analysis, and emotional analysis were conducted by applying text mining techniques, which are methods of analyzing unstructured data online, to present basic data on the establishment of the concept of Ruralism for rural space maintenance. As a result of the study, conservation for Ruralism was the most important in the case of keyword frequency analysis, and differences between the Rurality and Rural-amenity keywords, which were used similarly to Ruralism, were identified through major keywords, indicating that Ruralism is a concept that has a more comprehensive range of rural areas than other concepts. In the case of the network, the network shown in Ruralism was prominent in improving the quality of life of invisible residents, and the last emotional analysis showed that it was necessary to prepare standards to overcome the possibility of preserving Ruralism and difficult policy directions. This study is meaningful in that it identifies online perceptions and looks at them from a macro perspective so as not to be confused by looking at keywords used similarly to Ruralism at a time when setting mid- to long-term policy directions is important.
군사학은 급변하는 안보환경과 국제정세의 변화, 4차산업혁명시대의 무기체계 발전과 저출산에 따른 병역제도 등의 사회적 관심이 증대되 고 있다. 따라서 본 연구는 빅데이터를 활용한 텍스트마이닝 기법으로 군사학의 학술연구 동향과 사회적 인식을 분석하여 시사점을 제시하는 데 있다. 연구 결과 학술연구 동향은 주변국 관계, 무기체계, 방위산업, 인공지능 등이 중점을 이루었지만, 사회적 인식은 대학교와 군사학과, 장교 등의 관심으로 차이점을 보였다. 군사학 발전을 위해 연구 중심의 역량과 환경을 구축하고, 융·복합적 연구와 지역사회와 연계한 산학협 력 체계구축 및 국민 참여를 통한 학술 세미나 및 통합연구 등이 요구 되었다.
The problems of misinterpretation, lack of text, absence of text, derivation of text, reverse text and sentence reading errors in some of the texts inscribed in the opera tablets of the Ming Dynasty in the south of Shanxi are caused by many reasons, such as unclear grammar and style of writing, unclear cultural words, no recognition of homophone characters and similar characters, no recognition of different characters, or indistinct and vague characters in the topographic films. By checking the topology, combining the handed down documents and unearthed documents, correct the misword, supplement the missing text, correct the missing text, correct the derived text, correct the inverted text, correct the sentence reading, indicate the wrong cause, correct the explanation text, in order to provide more accurate and reliable text information for the academic research.
This study examines the performance of a penalized neural network and the replication of a customer engagement survey scale with text information in the hotel industry. Although the empirical analysis shows highly accurate model performance only in the training sample, the results also clarify the issues of the engagement scale.
This study explored dominant topics about the metaverse discussed in Twitter and the sentiments in each topic in the case of Decentraland using topic modeling and sentiment analysis. The appraisal theory of emotion and motivation theory were used to explain why positive or negative sentiments were expressed toward specific topics. The majority of topics were related to economic benefits such as coins, NFTs, tokens, estate, land, and spaces or socializing with others at specific events. Many of them included predominantly positive sentiments because consumers appraised them as motive consistent. This serves as an important implication for marketers and developers in the metaverse that they need to focus more on these features so that consumers can interact with the motive-consistent features and thus have positive emotions.
Fast-paced advancements in technology demand swift adaptation and presents new opportunities and challenges for the optimization of communication, especially for advertisers. Digitalization and new developments in ICT have brought significant changes to the ways in which information, especially promotional messages, is disseminated to consumers. Additionally, with explosive interests in anticipation of fully autonomous vehicles, this study identifies and addresses the potential to optimize communication in an under examined digital media environment – in-vehicle infotainment system. Therefore, this study proposes a text-image embedding method recommender system for the personalization of multimedia contents and advertisements for in-vehicle infotainment systems. Unlike most previous research, which focuses on textual-only or image-only analyses, the current study explores the understanding, development and application of text embedding models and image feature extraction methods simultaneously in the context of target advertisement research. Overall, this study highlights the need to adapt to the ever-evolving technological landscape to optimize communication in various digital media environments. With the proposed text-image embedding method, this study offers a unique approach to personalizing multimedia content and advertisements in the under-explored digital media environment of in-vehicle infotainment systems.
This research proposes a novel approach to tackle the challenge of categorizing unstructured customer complaints in the automotive industry. The goal is to identify potential vehicle defects based on the findings of our algorithm, which can assist automakers in mitigating significant losses and reputational damage caused by mass claims. To achieve this goal, our model uses the Word2Vec method to analyze large volumes of unstructured customer complaint data from the National Highway Traffic Safety Administration (NHTSA). By developing a score dictionary for eight pre-selected criteria, our algorithm can efficiently categorize complaints and detect potential vehicle defects. By calculating the score of each complaint, our algorithm can identify patterns and correlations that can indicate potential defects in the vehicle. One of the key benefits of this approach is its ability to handle a large volume of unstructured data, which can be challenging for traditional methods. By using machine learning techniques, we can extract meaningful insights from customer complaints, which can help automakers prioritize and address potential defects before they become widespread issues. In conclusion, this research provides a promising approach to categorize unstructured customer complaints in the automotive industry and identify potential vehicle defects. By leveraging the power of machine learning, we can help automakers improve the quality of their products and enhance customer satisfaction. Further studies can build upon this approach to explore other potential applications and expand its scope to other industries.