본 연구의 목적은 초등 예비교사가 C hatGPT-4 o를 활용하여 과학 평가 문항을 개발하는 과정에서 나타난 사전 인식과 설계 경험의 특성을 탐색하는 데 있다. 이를 위해 비수도권 소재 A 교육대학교의 초등 예비교사 5명을 선정하 고, 2015 개정 초등과학 교육과정 ‘지구와 우주’ 영역을 중심으로 평가 문항을 생성·검토·수정하는 설계 활동을 수행하도록 하였다. 연구 자료는 사전 서면 응답, 문항 초안 및 최종본, ChatGPT 상호작용 로그와 프롬프트 입력 이유 기 록, 반성적 저널, 반구조화된 면담을 통해 수집되었다. 자료 분석은 두 단계로 이루어졌다. 첫째, 문항 생성 이전에 형 성된 인식은 사전 서면 응답을 중심으로 귀납적 내용 분석을 실시하였다. 둘째, 문항 검토·보완 단계에서의 설계 경험 은 사례 기반 과정 중심 질적 분석을 통해 AI Assessment Scale (AIAS) 틀을 참조하여 해석하였다. 분석 결과, 사전 인식은 (1) Gen AI를 설계 부담 완화와 사고 확장을 지원하는 도구로 기대하는 ‘역할 기대’와, (2) 생성 결과에 대한 신뢰와 불확실성이 공존하며 과학적·교육과정 타당성 검증과 최종 판단 책임은 교사에게 귀속된다는 ‘한계 인식 및 인 간 책임’의 두 축으로 구조화되었다. 또한 설계 경험 분석에서는 예비교사들이 Gen AI가 제시한 문항을 그대로 사용하 기보다 사고 구조의 재설계, 인지 수준 조정, 평가 기준 및 판단 책임, 문항 범위 및 표현 조정을 통해 인간 주도로 재 구성하는 양상이 나타났다. 이러한 활용은 전 사례에서 AIAS Level 4의 특성과 관련지어 해석될 수 있으며, Gen AI가 설계를 지원하더라도 핵심 판단과 책임은 예비교사에게 남아 있음을 보여준다. 본 연구는 사전 인식과 설계 경험을 구 분하여 분석함으로써, 초등 예비교사 교육에서 Gen AI 활용과 평가 전문성 논의를 확장하는 데 기초 자료를 제공한다.