In the era of big data, where massive volumes of information are collected at high velocity from various sources, data mining has become a crucial tool for organizations seeking competitive advantage. Among its core tasks, clustering plays a key role in uncovering hidden patterns within unlabeled data by grouping similar objects into distinct clusters. Widely used methods such as k-means and its robust counterpart PAM (Partitioning Around Medoids) require the number of clusters, k, to be predefined—a task that remains a major challenge despite extensive research. This study addresses the problem of selecting the optimal number of clusters by proposing three novel enhancements to the widely-used gap statistic method: the 1stDaccSEmax heuristic rule, the recursive gap strategy, and the two-way bootstrapping technique. Collectively termed the new gap, this approach aims to overcome the limitations of the original gap statistic, particularly in datasets with overlapping clusters, hierarchical structures, or large volumes. Extensive experiments on both synthetic and real-world datasets—including Iris, Breast Cancer, Seeds, and Khan gene expression datasets—demonstrate that the new gap method outperforms traditional techniques such as the elbow method, silhouette analysis, and the original gap statistic in both accuracy and computational efficiency. Although PAM was used throughout the experiments for its robustness, the proposed approach is algorithm-agnostic and can be integrated with other clustering methods that require the selection of k. The results suggest that the new gap method provides a more reliable and scalable solution for determining the number of clusters, thereby enhancing the effectiveness of clustering-based data analysis in real-world applications.
본 연구는 보건계열 대학생을 대상으로 학습동기조절전략의 유형을 분 류하고, 이러한 유형에 따른 대학생 성공 및 삶의 만족도의 차이를 분석 하고자 하였다. G시 소재 대학 보건계열 학과(간호학과, 응급구조학과, 치위생학과)에 재학 중인 대학생 250명을 대상으로 한국형 학습동기조절 전략 척도, 대학생 성공 척도, 삶의 만족도 척도를 사용하여 자료를 수집 하였다. 수집된 자료는 군집분석, 다변량분산분석, 일원분산분석 등을 통 해 분석되었다. 연구 결과, 학습동기조절전략에 따라 '소극적 조절집단 (25.6%)', '중간 조절집단(39.6%)', '적극적 조절집단(34.8%)'의 세 가지 유형으로 분류되었다. 적극적 조절집단은 모든 전략에서 높은 점수를 보 였으며, 특히 사회적 인정/외적 보상 추구, 부모(교사)기대에 대한 보답, 공부에 대한 의무 등의 자기조절 전략에서 두드러진 활용 수준을 보였 다. 이러한 학습동기조절전략의 유형에 따라 대학생 성공의 모든 하위요 인과 삶의 만족도에서 유의미한 차이가 나타났다. 이러한 결과는 보건계 열 대학생의 학습동기조절전략이 학업적 성취를 넘어 대학생활의 다양한 측면에서의 성공과 전반적인 삶의 만족도와 밀접한 관련이 있음을 시사 한다.