The purpose of this paper is to find out how each districts(Gu) of Seoul are related based on the apartment price trends. All the data used in this paper comes from a public data sources, Seoul apartments transaction data provided by ‘Ministry of Land Infrastructure and Transport Korea’ and the apartments properties from NAVER’s real estate service. To analyze the similarities between the price trends of each apartments, this study uses FastDTW algorithm which is quite popular in time series analysis domain. After figured out the distance matrix from FastDTW, this study uses Hierarchical Clustering algorithm and Chi-squared test to compare each districts’ relationship. The analysis result shows that which districts in Seoul are similar and which districts are not.
효율적인 악취관리를 위해서는 민원지역에서 발생한 악취를 분류하고, 그 악취원을 분 석해야 한다. 이를 위해서는 민원지역에서 발생한 악취를 나타낼 수 있는 악취대표패턴과 악취원의 냄새가 필요하다. 이에 본 논문에서는 민원지역의 악취분류를 위해 k-mean 알고리즘을 이용하여 악취데이 터에 대한 군집화를 수행하였다. 그 결과 생성된 악취대표패턴과 미리 측정된 악취원별 냄새와의 유사도를 비교하여 악취에 대한 분류를 수행하였다. 또한, 대기 중에서 여러 악 취가 섞였을 경우를 고려하여 non-negative least square를 이용하여 해당 악취에 대해 책임 이 있는 하나 이상의 악취원과 기여도를 추적하였다. 이러한 본 연구의 성과는 악취 관련 민원해결에 기여할 것으로 사료된다.
In this study, we developed a heuristic algorithm to get better efficiency of clustering than conventional algorithms. Conventional clustering algorithm had lower efficiency of clustering as there were no solid method for selecting initial center of cluster and as they had difficulty in search solution for clustering. EMC(Expanded Moving Center) heuristic algorithm was suggested to clear the problem of low efficiency in clustering. We developed algorithm to select initial center of cluster and search solution systematically in clustering. Experiments of clustering are performed to evaluate performance of EMC heuristic algorithm. Squared-error of EMC heuristic algorithm showed better performance for real case study and improved greatly with increase of cluster number than the other ones.
최근 전자상거래나 웹 컨텐츠 사이트가 늘어나면서 웹 로그 정보를 분석하여 사용자 행동 패턴이나 사이트 구조를 분석하기 위한 연구가 활발하게 이루어지고 있다. 웹 사이트에 접속함으로써 발생되는 누적된 로그를 데이터 마이닝 기법을 이용하여 사용자 행동 패턴을 분석하여 효과적으로 이용하려는 연구는 다양한 웹 컨텐츠 정보 안에서 고객이 진정으로 원하는 정보를 얻기까지 소요되는 시간과 노력을 절약하기 위한 고객 지원 서비스의 차원에서 중요한 문제로 대두되고 있다. 그러나 이러한 연구들 또한 개인화와 고객의 구매성향의 변화에 대한 실시간 대응이라는 두 가지 관점에서 해결방안을 동시에 제시하지 못하고 있다. 본 논문에서는 ART2 신경망 알고리즘을 통해 실시간적이고 방대한 량의 웹 로그 데이터를 효과적으로 군집화하기 위하여 군집화 특성을 평가하고자 한다.
We study clustering algorithm for sequences of categorical values. Clustering is a data mining problem that has received significant attention by the database community. Traditional clustering algorithms deal with numerical or categorical data points. How
A new algorithm has been propose to detect the reflected light region as disturbances in a real-time vision system. There have been several attempts to detect existing reflected light region. The conventional mathematical approach requires a lot of complex processes so that it is not suitable for a real-time vision system. On the other hand, when a simple detection process has been applied, the reflected light region can not be detected accurately. Therefore, in order to detect reflected light region for a real-time vision system, the detection process requires a new algorithm that is as simple and accurate as possible. In order to extract the reflected light, the proposed algorithm has been adopted several filter equations and clustering processes in the HSI (Hue Saturation Intensity) color space. Also the proposed algorithm used the pre-defined reflected light data generated through the clustering processes to make the algorithm simple. To demonstrate the effectiveness of the proposed algorithm, several images with the reflected region have been used and the reflected regions are detected successfully.