최근 건축 구조공학 분야에서도 대규모 언어 모델(LLM)을 활용한 인공지능(AI) 기술 도입이 증가하고 있지만, 한국형 구조설계 기준과 같은 지역 특화 규정을 반영하지 못하거나 잘못된 정보를 제공하는 환각 현상 등 여러 한계를 보인다. 이를 극복할 수 있는 유 망한 기술로서 검색-증강 생성(RAG)이 제시되고 있으며, 본 논문에서는 한국 건축 구조공학 도메인에 특화된 RAG 시스템인 StructCPT를 개발하여 그 성능을 평가하였다. StructCPT는 한국어 기반 구조공학 지식베이스에서 질의에 적합한 정보를 실시간으로 추출하는 도메인 특화 검색기이며, 대조학습 기반의 MAXIM(Maximum Similarity Retrieval) 임베딩 기법을 이용하여 질의와 문서 간 최대 의미적 유사도를 학습한다. 실험 결과 StructCPT는 BM25, Contriever, SPECTER와 같은 기존 범용 검색 기법들 대비 정량적 평 가 지표에서 일관되고 유의미한 성능 향상을 보여주었다. 특히 구조공학 전문 용어 처리와 복합적 질의에 대한 검색 정확도 및 재현율 에서 월등히 높은 성과를 나타냈으며, 실제 구조공학 문제 적용에서도 높은 정확도를 달성하였다. 또한 검색 속도와 메모리 사용 측면 에서도 실무 적용에 적합한 효율성을 입증하였다. 본 연구는 구조공학 분야에 특화된 최초의 RAG 시스템 개발 사례로서, 향후 도면・ 이미지 등 멀티모달 정보와 지식그래프 통합을 통한 추가 발전 방향을 제시하며, 안전하고 신뢰할 수 있는 AI 기반 구조공학 의사결 정 지원의 기초를 마련하였다.
본 연구는 한국 건축・구조공학 도메인에 특화된 SAFE(Safetyoriented AI Framework for Engineering) 지식베이스와 이를 활용한 검 색 증강 생성(RAG) 시스템을 제안한다. SAFE는 전문용어집, 설계 기준, 교과서, 프로젝트 보고서에서 추출한 37.7만개 스니펫을 통 합하여 국내 구조설계기준(KDS)과 최신 실무 사례를 포괄한다. SAFE 기반 파이프라인은 5개 대표 과업(MMLUStruct, Struct QAKO, SPED, StructMCQA, StructCaseY/N)으로 구성된 4,200문항 벤치마크에서 전체 정확도 89.1%를 기록하여, 체인오브생각(CoT) 방식 의 최고 성능 LLM 대비 3.87%p 향상 효과를 나타냈다 . 특히 국내 기준・실무 판정 과업인 StructCaseY/N에서 94.9%의 정확도를 달성 하였다 . 절편 분석 결과, 질의당 32개 스니펫을 투입할 때 정확도와 응답 지연 간 최적 균형점이 형성되며, 그 이상에서는 성능 개선 대 비 비용이 급격히 감소함을 확인하였다. 또한 질문 유형별로 최적 정보 출처가 상이함을 규명하여, 도메인 맞춤형 코퍼스 가중치 조정 의 필요성을 제시하였다. 본 연구는 국내 최초의 구조공학 RAG 평가 체계를 확립함으로써, 안전 중심 AI 의사결정 지원 도구의 실무 적용 가능성을 입증하고 향후 연구의 기반을 마련하였다.