기존 비디오 게임은 사전 정의된 스크립트와 정적인 캐릭터 관계 모델로 인해 상호작용 과 몰입감에 한계가 있다. 최근 대규모 언어 모델(LLM)이 대안으로 떠올랐으나, 생성된 서 사와 게임 내부 데이터가 단절되는 문제가 여전히 존재한다. 이에 본 연구는 Unity 엔진, LLM, 게임 서버 플랫폼을 통합하여 캐릭터 데이터가 서사를 생성하고, 그 결과가 다시 데 이터베이스에 반영되는 '순환형 동적 스토리텔링 시스템'을 제안한다. 실험 결과, 캐릭터 성 향에 따른 차별화된 서사 생성 및 관계도의 실시간 DB 동기화를 확인하였다. 본 시스템은 기존 스크립트의 경직성을 극복하고 무한히 확장 가능한 개인화된 게임 경험을 제공한다.
The application of machine learning in concrete technology has expanded rapidly, yet its reliability is often constrained by limited experimental data, heterogeneous testing conditions, and inconsistencies across published studies. This study investigates the integration of machine learning and synthetic data augmentation to predict the compressive strength of concrete incorporating biochar as a partial replacement for cement. An experimental dataset was compiled from peer-reviewed journal articles indexed in Web of Science, focusing on biochar-modified concrete mixtures. Input variables included cement content, fine and coarse aggregates, biochar dosage, water to binder ratio, superplasticizer content, and curing age, with compressive strength as the target variable. Extreme Gradient Boosting was adopted due to its strong performance on nonlinear tabular data. Model performance was evaluated using the mean absolute error (MAE), mean squared error (MSE), and coefficient of determination (R²), alongside five-fold cross-validation. Hyperparameter optimization was performed using Optuna. To address data scarcity, a synthetic dataset of 1000 samples was generated using ChatGPT. the large language model approach relied solely on natural language prompts. Only feature definitions and the target variable were provided, without exposing the original data or implementing data generation algorithms. Three modeling strategies were examined. First, model trained and tested solely on experimental data achieved a testing R² of approximately 0.91. Second, model trained on synthetic data and evaluated exclusively on experimental data showed reduced generalization, achieving a testing R² of about 0.42, indicating pronounced domain shift effects. Third, synthetic and experimental data were combined through data augmentation and jointly modeled, a testing R² of 0.93 was achieved. The result showed that the use of LLMs for augmentation improved the performance of the model.
This study develops a generative AI-based system for automatically generating scholarly topic descriptions within the OpenAlex database and evaluates its performance. Although OpenAlex provides concise topic descriptions, they lack contextual richness and informational coverage, limiting researchers’ ability to quickly grasp the semantic relevance of each topic. To address this issue, this study generated new descriptions for a total of 4,516 topics by utilizing metadata attributes—topic_id, topic_name, description, and keywords—and compared them with the original descriptions. Multiple large language models (LLMs), including GPT, LLaMA, and Mistral, were employed, and a consistent prompt-engineering scheme was designed to ensure the reproducibility of model comparison. A standardized evaluation framework integrating quantitative and qualitative indicators was proposed. Quantitative evaluation included keyword-based Precision, Recall, and F1 scores, ROUGE-L, Specter2 embedding-based cosine similarity, and BERTScore. Qualitative evaluation was conducted using LLM-based pairwise comparison, assessing Relevance, Coverage, and Clarity, with relative rankings determined through the Elo rating system. Furthermore, the Friedman test and Wilcoxon signed-rank test were applied to verify statistical significance. Experimental results revealed distinctive strengths and weaknesses across models, providing a benchmarking foundation for improving automated content generation in scholarly databases such as OpenAlex. The proposed evaluation framework also offers a reproducible and consistent basis for assessing various generative models, contributing to both academic research and practical system development.
모빌리티 예측은 단순한 통행 경로 예측을 넘어, 사회 전반의 효율성 및 안전성 향상을 위한 핵심 데이터를 제공한다는 점에서 중 요하다. 기존의 예측 기법은 시공간적 규칙성과 개인 이동 패턴의 통계적 특성 분석에 주로 의존하였으며, 최근 딥러닝 기반의 시공간 모델링을 통해 예측 성능이 향상되었다. 그러나 여전히 개인 통행의 단기·장기적 시공간 의존성 및 복잡한 패턴을 처리하는 데 한계가 존재한다. 이를 극복하기 위해, 본 연구는 대규모 사전 학습된 거대 언어 모델(Large Language Model; LLM)을 도입하여, 개인 속성뿐 만 아니라 실제 통행 데이터를 반영한 객체 단위 통행 생성 프레임워크를 제안한다. LLM 기반(ChatGPT-4o) 객체 단위 통행 생성 프레 임워크는 (1) 개인 모빌리티 패턴 학습, (2) 통행 생성의 두 단계로 이루어진다. 이후 한국교통연구원의 개인통행 실태조사(2021) 데이 터를 이용하여 프레임워크의 통행 생성 성능을 확인하였다. 통행 시작·출발 시간 분포, 출발·도착지 장소 유형, 통행목적, 이용 교통수 단의 정확도를 확인한 결과, 대부분 항목에서 70% 이상의 정확도를 보였다. 하지만 통행목적은 13개의 목적 중 하나를 예측해야 하기 에 정확도가 다른 항목에 비해 약 40%로 낮게 나타났다. 본 연구는 통행 생성 프레임워크를 설계하고, 이에 맞춰 입력 데이터를 가공 및 프롬프트 엔지니어링을 수행함으로써 LLM 기반 통행 생성 기술의 가능성을 확인하였다. 향후 프레임워크의 예측 성능 검증 및 개 선을 위한 추가 연구가 필요하며, 날씨, 대규모 행사 등과 같은 외부 요인들을 고려하면 더욱 정교하고 현실적인 통행일지를 생성할 수 있을 것이다.
최근 인공지능 분야에서 가장 활발히 연구되고 있는 거대 언어 모델은 교육에 대한 응용 가능성을 보 이며, 교육학의 거의 모든 분야에서 그 활용 방안이 연구되고 있다. 이러한 연구는 공학 교육에서도 주목 받고 있다. 그러나 구체적인 활용 분야와 방법에 대해서는 아직 많은 연구가 필요한 상황이다. 특히, 거대 언어 모델을 이용한 교육과정 설계와 개선에 대한 연구는 인공지능 공학과 교육학 두 분야에서 모두 중요한 연구 과제로 부각되고 있다. 이러한 응용 필요성에 대한 예시이자 전략으로써, 본 연구는 OpenAI에서 발표한 최신 거대 언어 모델인 ChatGPT-4o를 이용하여 한국과학기술원(KAIST) 공과대학 학부 전공 과 목과 S전자 DS부문(반도체사업부) 직무 사이의 연관성을 분석하고, 그 결과를 기반으로 대학과 기업체 양측에 반도체 산업 인력 양성과 채용에 대한 실질적인 응용 전략을 제안한다. 이를 위해 KAIST 공과대 학 학부과정에 개설된 모든 전공 과목과 S전자 DS부문(반도체사업부)의 직무기술서를 ChatGPT-4o에 학습시켜 각 과목이 특정 제품군, 직무와 가지는 연관성을 특정 범위와 기준에 의거하여 정량화된 점수로 평가했다. 또한, 각각의 직무, 전공, 과목별로 확보한 데이터를 기초적인 통계 분석을 통해 평가했으며, 구직자와 구인자의 활용 가능성에 초점을 두고 특정 전공의 각 직무별 연관성과 특정 직무의 각 전공별 연관성, 그리고 특정 직무 및 전공의 반도체 제품군별 연관성 등 다양한 조건에서 분석을 진행하였다. 또 한 본 전략에 대한 반도체 산업 실무자 견해를 수집하여 실제 전략으로의 활용 가능성을 검증하였다. 분 석 결과, 간단한 질문과 분석만으로도 전공, 교과목별로 유의미한 직무 연관성의 차이를 확인했다. 이러한 결과를 바탕으로 본 연구는 대학 교육과정의 개선과 기업 채용 및 양성 과정에서의 응용 전략을 제시한 다. 이 연구는 대학과 산업 간의 협력을 통해 인적자원 개발과 채용 효율성 증대에 기여할 것으로 기대한 다. 또한, 후속 연구로 구직자와 구인자, 교수자 등 본 연구의 효과를 확인할 수 있는 집단을 대상으로 한 대규모 설문조사 및 전문가그룹 대상 질적연구 등을 제안하여 실제 활용도와의 비교 분석 연구를 제안 한다. 결론적으로, 본 연구는 거대 언어 모델을 활용하여 필요한 인재를 양성하기 위한 교육 과정 설계의 구체적인 응용 가능성을 제시함으로써, 인공지능을 이용한 교육 분야에 대한 기여 방안을 모색한다.
This study introduces and experimentally validates a novel approach that combines Instruction fine-tuning and Low-Rank Adaptation (LoRA) fine-tuning to optimize the performance of Large Language Models (LLMs). These models have become revolutionary tools in natural language processing, showing remarkable performance across diverse application areas. However, optimizing their performance for specific domains necessitates fine-tuning of the base models (FMs), which is often limited by challenges such as data complexity and resource costs. The proposed approach aims to overcome these limitations by enhancing the performance of LLMs, particularly in the analysis precision and efficiency of national Research and Development (R&D) data. The study provides theoretical foundations and technical implementations of Instruction fine-tuning and LoRA fine-tuning. Through rigorous experimental validation, it is demonstrated that the proposed method significantly improves the precision and efficiency of data analysis, outperforming traditional fine-tuning methods. This enhancement is not only beneficial for national R&D data but also suggests potential applicability in various other data-centric domains, such as medical data analysis, financial forecasting, and educational assessments. The findings highlight the method's broad utility and significant contribution to advancing data analysis techniques in specialized knowledge domains, offering new possibilities for leveraging LLMs in complex and resource- intensive tasks. This research underscores the transformative potential of combining Instruction fine-tuning with LoRA fine-tuning to achieve superior performance in diverse applications, paving the way for more efficient and effective utilization of LLMs in both academic and industrial settings.