A Study on A nalyzing T rend i n the Bronze A ge U sing BERTopic
본고에서는 2000년부터 2023년까지 게재된 고고학 분야 학술논문과 학위논문 1,307편을 대상으 로 제목, 주제어, 국문초록을 분석하여 청동기시대 연구동향을 살펴보았다. 분석 방법은 딥러닝 모델 을 활용한 토픽 모델링 기법인 버토픽(BERTopic) 분석을 이용하였다. 분석 결과 총 20개의 토픽이 도출되었으며, 추가적으로 계층적 클러스터링을 실시한 결과‘취락’,‘분묘’,‘편년’,‘유물’의 상위 4개 토픽으로 재군집되었다. 이를 활용하여 먼저 연도별 연구동향을 검토하였다. 전반적으로 상위 토픽이 포함된 연구논문의 수 량은 2010년대 중반까지 큰 폭으로 증가한다. 2000년대 이후 비약적으로 증가한 발굴조사로 인해 관 련 연구가 활발히 진행된 것으로 보인다. 그러나 하위 토픽이 포함된 연구논문의 수량은 시기별로 상 이하게 나타난다. 이와 관련하여 대규모 유적과 특정 유구ㆍ유물의 존재 여부, 자연과학분석 건수의 영향, 새로운 분석 방법의 도입 등을 원인으로 상정하였다. 다음으로 지역별 연구동향을 살펴보았다. 4개의 상위 토픽 중‘취락’은 호서,‘분묘’는 호남, ‘유물’은 영남,‘편년’은 중국의 자료가 주로 다루어졌는데, 특정 지역에 집중 분포하는 유구ㆍ유물 복합체의 존재 여부와 해당 지역 발굴조사 성과에 따른 결과로 이해하였다. 지역 간 비교는 주로 국내 자료를 대상으로 연구되었다. 세부적으로는 중부, 호서, 영남지역의 자료를 대상으로 한 논문이 다수 를 차지한 반면, 제주와 영동지역의 경우 소수에 불과하다. 국외 지역 중에서는 중국과 북한 자료가 상대적으로 다수 다루어지고 있음이 확인되었다. 청동기시대 연구동향에 대해 데이터 기반의 접근 방식을 이용하여 전반적인 흐름을 파악하였다. 빅 데이터로 전환되고 있는 청동기시대 자료의 관리 및 활용 측면에서 인공지능 기술의 적용 가능성을 검토하였다는 점에 의미를 두고 싶다.
This study analyzed titles, keywords, and abstracts of 1,307 academic papers and dissertations published from 2000 to 2023 to examine research trends in the Bronze Age. The analysis method was BERTopic, a topic modeling technique using deep learning models. A total of 20 topics were identified as a result of the analysis, and further hierarchical clustering was performed to regroup them into the top four topics of ‘Settlement’, ‘Tomb’, ‘Chronology’, and ‘Relics’. Using this, the research trends by year were reviewed, and the number of research papers containing top topics increased significantly until the mid-2010s. However, the number of papers with subtopics varies over time. This can be explained by the presence of large sites and specific relics, the impact of the number of natural science analyses, and the introduction of new analytical methods. Next, the research trends by region were examined. Among the four top topics, ‘Settlement’ was mainly dealt with i n H oseo, ‘ tomb’ w as i n H onam, ‘ relic’ w ere i n Y eongnam r egions, and ‘chronology’ was mainly dealt with in China. It was understood as the result of the existence of remains and relics complexes concentrated in a specific area and the results of excavation surveys in the area. Regional comparisons were mainly conducted on domestic data. Specifically, the majority of papers are based on data from the Central, Hoseo, and Yeongnam regions, while only a few were from Jeju and Yeongdong regions. It was confirmed that a relatively large number of Chinese and North Korean data are handled in overseas regions. This study is meaningful in that it examined the applicability of artificial intelligence technology in terms of management and utilization of Bronze Age data, which is being converted into big data.