본고는 빅데이터 시대의 새로운 연구 방법론으로 부상한 AI 기반 토픽모델링 (BERTopic)을 고고학 연구동향 분석에 적용하고, 그 실체적 효용성과 한계를 규명하는 데 목적이 있다. 이를 위해 2006년부터 2013년까지 한국 청동기시대 석기 관련 연구 논 문 75편을 대상으로 텍스트 마이닝을 수행하였다. 기존의 빅데이터 기반 연구동향 분석이 거시적 경향성 파악에 치중하여 개별 연구의 논리적 맥락을 소거하는 한계를 극복하고자, 본고는 전문가의 정성적 검토가 가능한 규모로 데이터셋을 통제(Controlled Dataset)하여 AI 분석 결과의 미시적 정합성을 정밀하게 검증하였다. 이후 그 결과를 동일시기의 연구 성과를 정량·정성적으로 고찰한 연구사적 논문 결과(손준호 2013)와 직접 비교·분석을 진 행하였다. 텍스트 분석 결과, AI는 방대한 문헌 속에서 ‘형식·편년 중심’과 ‘생산·생계 중심’이라는 거시적 연구 지형을 신속하게 파악하고, 텍스트 이면에 잠재된 방법론적 맥락(자연과학적 분석 등)을 수치로 입증하는 데 탁월한 효용을 보였다. 그러나 미시적 분석 단계에서는 비 판적 논조를 파악하지 못하는 ‘문맥 소거’, 이질적인 시공간 데이터를 기계적으로 결합하 는 ‘사실 왜곡’, 그리고 연구의 질적 경중을 가리지 못하는 ‘가치 평가 부재’라는 결정적 한계를 드러냈다. 이에 필자는 AI의 연산 능력을 맹신하는 태도를 경계하고, 연구자의 경험적 통찰이 AI 의 기계적 객관성을 보완하는 ‘전문가 매개(Expert-Mediated) 통합 분석 모델’을 제안하 였다. 이는 AI에게 1차적인 데이터 처리와 지도 작성을 맡기되, 사실 검증(Fact Verification), 논리적 맥락의 복원(Contextual Calibration), 연구사적 가치 부여 (Qualitative Valuation)의 최종 권한은 인간 연구자가 수행해야 함을 의미한다. 결론적 으로 디지털 고고학의 미래는 데이터의 양적 팽창에 함몰되지 않고, 연구자의 전문적 식견 을 통해 데이터에 학술적 생명력을 불어넣는 방향으로 나아가야 함을 역설하였다.
Smart factory technology, a core component of the Fourth Industrial Revolution, demonstrates significant disparities in technological development across countries. To quantitatively assess these international technology gaps, this study proposes an integrated analytical framework that combines text mining-based topic modeling and social network analysis (SNA), using global smart factory-related patent data from 2017 to 2023. Approximately 4,300 patent documents (titles and abstracts) were collected through the GPASS system and preprocessed. Through Latent Dirichlet Allocation (LDA) modeling with optimized hyperparameters, major technology topics were identified. Semantic interpretation using ChatGPT and expert review enabled the assignment of precise topic labels, which were further mapped to CPC (Cooperative Patent Classification) codes to construct a standardized technology taxonomy. Subsequently, the network structures of topic and classification nodes were analyzed by country (China, the United States, and South Korea), and the relative importance of key technology areas was evaluated using centrality metrics such as degree, closeness, betweenness, and eigenvector centrality. The analysis revealed that, globally, the most central technology areas include manufacturing process management and control, IoT and data-driven decision making, and facility-based process optimization. At the national level, China showed a strategic focus on technologies related to product quality improvement and cost reduction, South Korea emphasized IoT-enabled technologies and equipment-level optimization, while the United States prioritized control systems and data-driven project management. By utilizing patent-based textual data, this study offers a novel methodology for quantitatively diagnosing structural differences in national technological capabilities. The proposed framework provides valuable insights for country-specific R&D planning and strategic decision-making in the field of smart manufacturing.
본 연구는 MTS가 피부개선에 미친 영향에 관한 기존 연구들을 분석하여, 근거 체계를 구축하고, 주요 키워드 간 관계와 역할 및 패턴 등을 구조적으로 분석하고자 텍스트마이닝과 토픽모델링 및 단어네트워크 분석을 실시하였다. 관련 선행연구들은 MTS와 관련된 핵심 키워드와 연관 키워드를 혼합하여 전자도서관에서 검색하였으 며, 결론 부분의 Text를 수집하여 분석에 사용하였다. 분석결과는 다음과 같다. 첫 째, '피부', '효과', '실험', '관리', '개선' 등의 어휘가 주요 개념으로 확인되었다. 둘째, TF-IDF 분석에서 높은 가중치의 키워드들은 MTS의 피부 개선 효과에 관한 과학적 실험 기반 논의를 시사했다. 셋째, LDA 분석 결과, ‘과학적 검증 중심’과 ‘피부 개선 효과 중심’의 토픽2개로 나뉘었다. 넷째, 단어 네트워크에서 '피부'를 중심으로 '주름', '효과', '실험' 등이 강하게 연결되었고, '여성'과 '모공' 노드는 MTS가 여성 안면 부위 에 주로 적용됨을 나타냈다. 본 텍스트마이닝 기법은 유사 의료 미용 시술 분석에도 적용 가능하며, 향후 시계열 분석과 감성 분석을 통해 MTS 효과의 변화와 대상자 반응을 심층 탐색할 필요가 있다.
본 연구는 빅데이터 분석을 활용하여 국내 한류 연구의 동향을 파악하고, 향후 연구 방향을 제시하는 것을 목적으로 한다. 이를 위해 2014년부터 2024년까지 학술연구정보서비스(RISS)에 발표된 KCI 등재 학술논문 중 ‘한 류’를 검색어로 1,793편의 데이터를 수집하였다. 분석대상은 논문명, 주제어, 초록 등이며, 분석도구로는 소프트웨어 R을 활용하였다. 연구결과는 다음과 같다. 첫째, 주요 한류 소비국가에서의 콘텐츠 소비와 한국어 학습과의 상호 작용을 분석하는 것이 필요하다. 둘째, 한류 콘텐츠의 디자인과 제작 방식이 주목받으며, 이에 대한 저작권 이용 사례가 증가하고 있으므로 글로벌 시장 에서의 디자인 및 제작 전략을 정교화하기 위한 연구가 필요하다. 셋째, 콘 텐츠의 창의성이 한류의 핵심 경쟁력임을 고려하고, 시청자의 적극적 참여를 유도하는 확산 전략을 모색해야 한다. 넷째, 한류가 국가 브랜드 형성에 미 치는 영향을 분석하고, 특히 관광 및 화장품과 같은 소비재 산업과의 연계를 강화할 필요가 있다. 또한 한류 연구가 콘텐츠 및 시장 중심의 담론에서 정 책적, 제도적 관점의 담론으로 진화하고 있음을 감안하여 한류의 지속가능성 을 위해서는 경제적 관점과 제도적 관점을 분리하기보다 서로 상호보완적이 며 다학제적으로 접근하는 것이 필요하다. 마지막으로 제도적 관점에서의 한 류 연구에서 연구 간 데이터 및 지표 활용과 같이 정보흐름이 더욱 강화되 어야 한다. 본 연구는 한류 연구의 동향과 주요 연구주제를 분석함으로써 한 류연구의 현재와 향후 방향성을 제시하였다는 점에서 의의를 가진다.
As the Fourth Industrial Revolution advances, smart factories have become a new manufacturing paradigm, integrating technologies such as Information and Communication Technology (ICT), the Internet of Things (IoT), Artificial Intelligence (AI), and big data analytics to overcome traditional manufacturing limitations and enhance global competitiveness. This study offers a comprehensive approach by evaluating both technological and economic performance of smart factory Research and Development (R&D) projects, addressing gaps in previous studies that focused narrowly on either aspect. The research combines Latent Dirichlet Allocation (LDA) topic modeling and Data Envelopment Analysis (DEA) to quantitatively compare the efficiency of various topics. This integrated approach not only identifies key research themes but also evaluates how effectively resources are utilized within each theme, supporting strategic decision-making for optimal resource allocation. Additionally, non-parametric statistical tests are applied to detect performance differences between topics, providing insights into areas of comparative advantage. Unlike traditional DEA methods, which face limitations in generalizing results, this study offers a more nuanced analysis by benchmarking efficiency across thematic areas. The findings highlight the superior performance of projects incorporating AI, IoT, and big data, as well as those led by the Ministry of Trade, Industry, and Energy (MOTIE) and small and medium-sized enterprises (SMEs). The regional analysis reveals significant contributions from non-metropolitan areas, emphasizing the need for balanced development. This research provides policymakers and industry leaders with strategic insights, guiding the efficient allocation of R&D resources and fostering the development of smart factories aligned with global trends and national goals.
본 연구는 키워드 네트워크 분석과 토픽모델링을 활용하여 국내 학술 지에 게재된 위기개입·상담 관련 연구동향을 분석하는 데 목적이 있다. 이를 위하여 국내 등재(후보) 학술지에 게재된 137편의 논문을 분석하였 다. 논문 분석을 위하여 넷마이너(NetMiner) 4.0 프로그램을 활용한 키 워드 네트워크 분석과 토픽모델링을 수행하였다. 키워드 네트워크 분석 을 통해 키워드 빈도분석, 키워드 동시출현빈도분석과 함께 연결중심성, 근접중심성, 매개중심성 등의 중심성 분석을 실시하였고, 토픽모델링분석 을 통해 논문에 잠재된 토픽과 키워드를 도출하였다. 키워드 네트워크 분석을 통한 키워드 빈도분석에서는 자살, 상담자, 전문가, 학교, 청소년 등이 주요 키워드로 나타났고, 토픽모델링 분석에서는 토픽-1(외상 스트 레스 위기상담), 토픽-2(취약계층 위기개입), 토픽-3(위기청소년 가족통합 서비스), 토픽-4(위기가정 개입), 토픽-5(자살집단 위기대응) 등 총 5개의 토픽이 등장하였다. 분석 결과를 토대로 위기개입·상담에 관한 연구는 다 양한 위기집단을 대상으로 위기 후 외상 스트레스에 대한 개입과 대응에 관한 연구들이 주로 이루어진 것을 확인하였다. 본 연구의 결과는 향후 위기개입·상담 연구를 위한 기초자료를 제공하고, 위기개입·상담에 필요 한 방안 마련에 기여할 것으로 보여진다.
This study analyzes the discourse of Korean internet users regarding patient clothing and identifies the changes to structure and content of clothing resulting from infectious disease outbreaks. The analysis draws on texts from Korean blogs, internet cafes, and news articles from 2011 to 2021 related to patient clothing. Using Ucinet 5 and NodeXL 1.0.1 programs, network density, centrality, and cluster analyses were conducted using the Wakita–Tsurumi algorithm. Additionally, Latent Dirichlet Allocation (LDA) topic modeling was applied using Python 3.7 to further explore thematic patterns within the discourse. Throughout the period of study, it was found that users consistently discussed the specific purpose and functionality of patient clothing. Following the outbreak of COVID-19, the distribution and influence of keywords related to the functional aspects of patient clothing, such as “hygiene and safety,” significantly increased. An increased focus was placed on elements such as functionality, activity, autonomy, hygiene, and safety during the pandemic as public health concerns grew. It can be seen that patients increasingly share their experiences online and hospitalization rates surge during health crises; this study provides valuable insights into how the design of patient clothing can be improved through various informatics techniques. It underscores the evolving perception of patient clothing as essential medical equipment during health emergencies. In addition, it offers practical guidance for enhancing designs that better reflect shifting societal concerns, particularly regarding health, safety, and patient comfort.
본 연구의 목적은 국내 학술지에 게재된 크리스천 코칭과 관련된 논문을 대 상으로 키워드 네트워크과 토픽을 분석하여 연구 동향을 살펴보는 것이다. 이를 위하여 KCI에서 2008년부터 2024년까지 한국연구재단 등재지와 등재후보지에 게재된 36건의 크리스천 코칭 관련 논문을 분석하였다. 키워드 네트워크와 토픽 모델링을 분석하기 위하여 넷마이너(NetMiner) 4.0 프로그램을 활용하였다. 키 워드 네트워크 분석은 빈도분석과 키워드 동시 출현분석, 중심성 분석(연결 중 심성, 근접 중심성, 매개 중심성)을 하였다. 토픽모델링 분석은 LDA 기법을 활 용하여 논문에 잠재된 토픽과 키워드를 추출하였다. 키워드 네트워크 분석 결과 ‘코칭’, ‘연구’, ‘크리스천’, ‘프로그램’, ‘교회’, ‘리더십’ 등이 주요 키워드로 나타났 다. 토픽모델링 분석 결과 Topic-1(상담활동), Topic-2(목회 활동), Topic-3(코 칭 활동), Topic-4 (크리스천 신앙), Topic-5(코칭 연구), Topic-6(연구 활동), Topic-7(교수 활동)으로, 총 7개의 토픽으로 구성되었다. 연구 결과 ‘코칭’, ‘연 구’, ‘교회’, ‘크리스천’ 등의 키워드가 높은 연결 중심성을 보였음이 확인되었다. ‘코칭’은 연결 중심성, 근접 중심성과 매개 중심성 모두에서 높은 값을 보여, 크 리스천 코칭 연구의 핵심적인 역할을 하고 있음이 나타났다. 본 연구의 결과는 크리스천 코칭 연구에 유용한 기초자료를 제공하고 크리스천과 교회 성장에 도 움을 줄 수 있는 방안 마련에 기여 할 것이다.
자율주행에 관한 관심은 전 세계적으로 증가하고 있으며, 글로벌 자동차 제조사들과 기술기업들이 자율주행 분야에 대한 투자를 늘 리고 있어 향후 자동차 산업과 교통체계 전반에 큰 변화가 전망된다. 이처럼 자율주행 관련 연구와 개발은 끊임없이 진보하고 있으며, 관련 연구 수행은 계속해서 이루어질 것으로 보인다. 연구 수행에 있어 동향 파악은 필수 요소이며, 본 연구에서는 국내 자율주행 연 구 동향을 분석하고자 한다. 연구 동향을 분석한 다양한 분야의 선행연구 검토 결과, 각각 연구 목적에 맞는 다양한 데이터베이스를 이용하여 데이터를 수집하였으며 연구 주제어 혹은 초록을 분석데이터로 활용하였음을 확인하였다. 자율주행 연구 동향에 대해 분석 한 선행연구 검토 결과, 기존 연구들은 분야를 구분하지 않고 연구를 수집·분석하였음을 확인하였다. 자율주행은 도로, 교통, 자동차, 기계, 컴퓨터, 전자, 전기 등 다양한 분야를 포함하고 있기에 분야별 연구 동향 분석이 필요하다. 이에 본 연구에서는 도로·교통 분야 의 동향 분석을 위해 최근 5년간(2019년~2023년) 국내 도로·교통 분야 등재 학술지에 게재된 학술 논문을 대상으로 연구 동향을 분석 하였으며, 보다 많은 텍스트 데이터를 활용하기 위해 주제어가 아닌 초록을 활용하였다. 키워드 출현 빈도 분석을 통해 주요 키워드를 도출하였으며, 토픽 모델링을 통해 주요 연구주제를 도출하였다. 본 연구에서 수행한 자율주행 연구 동향 파악은 도로·교통 분야에서 향후 수행될 자율주행 연구 방향 수립에 시사점을 제공할 것이라 기대된다.
The purpose of this study is to identify the major peacekeeping activities that the Korean armed forces has performed from the past to the present. To do this, we collected 692 press releases from the National Defense Daily over the past 20 years and performed topic modeling and social network analysis. As a result of topic modeling analysis, 112 major keywords and 8 topics were derived, and as a result of examining the Korean armed forces's peacekeeping activities based on the topics, 6 major activities and 2 related matters were identified. The six major activities were 'Northeast Asian defense cooperation', 'multinational force activities', 'civil operations', 'defense diplomacy', 'ceasefire monitoring group', and 'pro-Korean activities', and 'general troop deployment' related to troop deployment in general. Next, social network analysis was performed to examine the relationship between keywords and major keywords related to topic decision, and the keywords ‘overseas’, ‘dispatch’, and ‘high level’ were derived as key words in the network. This study is meaningful in that it first examined the topic of the Korean armed forces's peacekeeping activities over the past 20 years by applying big data techniques based on the National Defense Daily, an unstructured document. In addition, it is expected that the derived topics can be used as a basis for exploring the direction of development of Korea's peacekeeping activities in the future.
In this study, we propose a novel approach to analyze big data related to patents in the field of smart factories, utilizing the Latent Dirichlet Allocation (LDA) topic modeling method and the generative artificial intelligence technology, ChatGPT. Our method includes extracting valuable insights from a large data-set of associated patents using LDA to identify latent topics and their corresponding patent documents. Additionally, we validate the suitability of the topics generated using generative AI technology and review the results with domain experts. We also employ the powerful big data analysis tool, KNIME, to preprocess and visualize the patent data, facilitating a better understanding of the global patent landscape and enabling a comparative analysis with the domestic patent environment. In order to explore quantitative and qualitative comparative advantages at this juncture, we have selected six indicators for conducting a quantitative analysis. Consequently, our approach allows us to explore the distinctive characteristics and investment directions of individual countries in the context of research and development and commercialization, based on a global-scale patent analysis in the field of smart factories. We anticipate that our findings, based on the analysis of global patent data in the field of smart factories, will serve as vital guidance for determining individual countries' directions in research and development investment. Furthermore, we propose a novel utilization of GhatGPT as a tool for validating the suitability of selected topics for policy makers who must choose topics across various scientific and technological domains.
The advent of big data has brought about the need for analytics. Natural language processing (NLP), a field of big data, has received a lot of attention. Topic modeling among NLP is widely applied to identify key topics in various academic journals. The Korean Society of Industrial and Systems Engineering (KSIE) has published academic journals since 1978. To enhance its status, it is imperative to recognize the diversity of research domains. We have already discovered eight major research topics for papers published by KSIE from 1978 to 1999. As a follow-up study, we aim to identify major topics of research papers published in KSIE from 2000 to 2022. We performed topic modeling on 1,742 research papers during this period by using LDA and BERTopic which has recently attracted attention. BERTopic outperformed LDA by providing a set of coherent topic keywords that can effectively distinguish 36 topics found out this study. In terms of visualization techniques, pyLDAvis presented better two-dimensional scatter plots for the intertopic distance map than BERTopic. However, BERTopic provided much more diverse visualization methods to explore the relevance of 36 topics. BERTopic was also able to classify hot and cold topics by presenting ‘topic over time’ graphs that can identify topic trends over time.
This study compared research trends in universities general English program before and after the COVID-19 pandemic. After analyzing 248 articles from KCI using frequency analysis, centrality analysis, and topic modeling, this study found consistent keywords indicating a focus on learning objectives, effectiveness analysis, satisfaction surveys, and level-based learning before and after the COVID-19 pandemic. Centrality analysis revealed keywords like “teaching, research, analysis” before COVID-19 and “satisfaction, study, level, activity, effect” after COVID-19, indicating a shift towards learner satisfaction, level-based learning, and effectiveness analysis due to the transition to online learning. Topic modeling revealed shifts in research trends: Pre-COVID-19 focused on effective teaching methods, evaluation techniques, and cultural content, while Post-COVID-19 prioritized online teaching methods, web-based platforms, and selfdirected learning. Future research should address self-directed learning, attitudes and goal setting, closing learning gaps in online/blended learning, and developing effective online assessment tools and evaluation strategies. This study provides valuable insights and directions for further research in general English programs.
본 연구에서는 코로나 이후 색조화장품 시장의 소비자들의 온라인 관심 정보에 대한 자료 수집 을 통하여 색조화장품 정보 검색의 특성과 텍스트 마이닝 분석 결과에 나타난 코로나 이후 색조화장품 시 장의 주요 관심정보들을 분석하고자 하였다. 실증분석에서는 “색조화장품” 이라는 단어를 포함하는 뉴스, 블로그, 카페, 웹페이지 등의 모든 문서들을 분석 대상으로 텍스트 마이닝을 수행하였다. 분석 결과 코로나 이후 색조화장품에 대한 온라인 정보 검색은 주로 구매 정보와 피부와 마스크 관련 화장법 등에 관한 정보 와 관심 브랜드와 행사 정보 등의 주요 토픽이 주를 이루고 있었다. 결과적으로 코로나 이후 색조화장품 구매자들은 적극적인 온라인 정보 검색을 통하여 제품 가치와 안전성, 가격 혜택, 매장 정보 등의 구매 정 보에 더욱 민감하게 될 것이므로 이에 대한 대응전략이 요구된다.
Non-fungible tokens (NFTs) exploded onto the global digital landscape in 2020, spurred by pandemic-related lockdowns and government stimulus (Ossinger, 2021). An NFT is a unit of data stored on a blockchain that represents or authenticates digital or physical items (Nadini, 2021). Since it resides on a blockchain, NFTs carry the benefits of decentralization, anti-tampering, and traceability (Joy et al., 2022). Fashion brands quickly capitalized on these features, launching fashion NFT collections and garnering significant profits from the sale of fashion NFTs in 2021 (Zhao, 2021). For example, Nike’s December 2021 acquisition of RTFKT (pronounced “artifact”) resulted in USD 185 million in sales less than a year after their acquisition (Marr, 2022).
This study aims to analyze research trends regarding outdoor wear. For this purpose, the data-collection period was limited to January 2002–October 2022, and the collection consisted of titles of papers, academic names, abstracts, and publication years from the Research Information Sharing Service (RISS). Frequency analysis was conducted on 227 papers in total to check academic journals and annual trends, and LDA topic-modeling analysis was conducted using 20,964 tokens. Data pre-processing was performed prior to topic-modeling analysis; after that, topic-modeling analysis, core topic derivation, and visualization were performed using a Python algorithm. A total of eight topics were obtained from the comprehensive analysis: experiential marketing and lifestyle, property and evaluation of outdoor wear, design and patterns of outdoor wear, outdoor-wear purchase behavior, color, designs and materials of outdoor wear, promotional strategies for outdoor wear, purchase intention and satisfaction depending on the brand image of outdoor wear, differences in outdoor wear preferences by consumer group. The results of topic-modeling analysis revealed that the topic, which includes a study on the design and material of outdoor wear and the pattern of jackets related to the overall shape, was the highest at 30.9% of the total topics. The next highest topic was also the design and color of outdoor wear, indicating that design-related research was the main research topic in outdoor wear research. It is hoped that analyzing outdoor wear research will help comprehend the research conducted thus far and reveal future directions.
The forms and demands of language learning are changing in the pandemic era. Learners no longer rely solely on a formal language curriculum. Instead, they are using various informal language learning (ILL) channels. Although informal language learning has been in the spotlight and is growing, more research on ILL is needed. In this study, ILL taking place through an online community was analyzed. Articles from the Korean learning community (r/Korean in Reddit) were collected, and the topic modeling technique, Latent Dirichlet Allocation, was conducted on the collected data. As a result, seven major topics were selected. The most common topics in all posts were issues faced by beginner learners, followed by vocabulary and sentence meanings, interest in Chinese characters and applications of Korean language skills, culture and daily life, translation, online learning materials, and Korean phonics. Through this, the interests of ILL learners and the characteristics of learners could be identified. Due to the nature of ILL, in which a formal curriculum does not exist, it was found that questions about general strategies for learning and questions that could not be solved in formal language education were most prominent. In addition, the characteristics of ILL learners who actively sought learning content and materials were also found.
Topic modeling has been receiving much attention in academic disciplines in recent years. Topic modeling is one of the applications in machine learning and natural language processing. It is a statistical modeling procedure to discover topics in the collection of documents. Recently, there have been many attempts to find out topics in diverse fields of academic research. Although the first Department of Industrial Engineering (I.E.) was established in Hanyang university in 1958, Korean Institute of Industrial Engineers (KIIE) which is truly the most academic society was first founded to contribute to research for I.E. and promote industrial techniques in 1974. Korean Society of Industrial and Systems Engineering (KSIE) was established four years later. However, the research topics for KSIE journal have not been deeply examined up until now. Using topic modeling algorithms, we cautiously aim to detect the research topics of KSIE journal for the first half of the society history, from 1978 to 1999. We made use of titles and abstracts in research papers to find out topics in KSIE journal by conducting four algorithms, LSA, HDP, LDA, and LDA Mallet. Topic analysis results obtained by the algorithms were compared. We tried to show the whole procedure of topic analysis in detail for further practical use in future. We employed visualization techniques by using analysis result obtained from LDA. As a result of thorough analysis of topic modeling, eight major research topics were discovered including Production/Logistics/Inventory, Reliability, Quality, Probability/Statistics, Management Engineering/Industry, Engineering Economy, Human Factor/Safety/Computer/Information Technology, and Heuristics/Optimization.