        본 연구는 모바일 기기를 활용한 현장체험학습에서 수집된 로그데이터를 STP(Space Time Path)로 시공간 시각화하여 현장체험학습에서 학생들의 이동특성을 파악하고, 머무름이 있던 지점에서의 활동특성을 분석하고자 하였다. 탐구활동 로그데이터 분석결과 이동과 머무름의 패턴이 연속적으로 나타나며, 조사활동의 유형에 따라 머무른 장소와 시간이 다름을 확인할 수 있었고, 머무름이 나타나는 장소는 관찰지점 뿐 아니라 관찰지점이 아닌 곳도 나타남을 확인하였다. 현장체험학습의 경우 공간 및 시간적으로 제한된 범위 내에서 이루어지는 활동이기 때문에 머무른 지점에서의 활동에 대한 추가 분석이 필요함을 알 수 있었다. STP를 이용한 이동 로그의 시각화는 복잡한 구조를 가진 로그데이터를 탐색하여 패턴을 발견하는 기초 자료로 활용할 수 있으며, 이는 다양한 유형의 로그데이터 분석에 응용될 수 있을 것으로 판단되었다.
        세계는 지금 디지털의 연결성과 고도화된 ICT 기술을 기반으로 한 ‘제4차 산업혁명’ 시대로 접어들고 있다. 국내 식품산업도 ICT, AI, 빅데이터, 등 4차산업 관련 요소기술들의 여러가지 분야에 접목시키고 있다. 불량식품은 식품의약품안전처에서 식품의 생산, 제조, 유통, 판매 등전 단계에서 발생할 수 있는 모든 법을 위반한 제품으로 넓게 정의하고 있으나 주로 경제적 이익을 취하기 위해 의도적으로 원료나 원산지를 바꾸거나 부정물질을 첨가한 위변조식품을 말한다. 식품 공급망이 세계화되고 복잡해짐에 따라 위변조 수법이 점점 정교해지고 급증하고 있어 사후 단속하는 방법으로 불량식품 발생에 대응하기에는 한계가 있다. 따라서 불량식품을 사전에 차단할 수 있는 과학적 체계를 마련하기 위하여 소셜빅데이터 분석기술 등을 위변조인자의 안전관리에 적용하고 있는 동향을 소개하고자 한다.
        최근 들어 비행정보에 대한 확인기술의 발달과 소형 드론의 지속적인 기술개발로 인하여 이동성과 안정성이 확보된 근접 항공촬영이 가능해졌다. 특히 GPS좌표를 활용하여 경로비행의 위치를 직접 지정함으로써 조사대상지에 대한 경 로비행의 정확성과 안정성이 확보되었으며, 이를 통해 일정한 고도를 유지한 상태에서 정사투영 촬영을 통한 분석이 가능하게 되었다. 따라서 본 연구에서는 수목의 생육관리와 3D맵핑 시스템의 접목에 착안하여 정밀하고 체계적인 3D 맵핑 도면작성을 활용하여 수목의 시공과 관리측면에서 경제적이고 장기적인 차원에서 수목의 상태를 파악하기 위한 방안을 모색하고자 하였다. 특히 문화재로 지정된 수목의 경우처럼 고부가가치를 지닌 수목에는 활용도가 더 크다 하겠다. 항공사진 촬영에 이용된 UAV는 Mikrokopter사의 회전 익을 이용하였으며, 디지털 데이터의 취득은 Sony α5100을 활용하였다. 항공사진촬영 시 공간해상도를 고려하여 비행고도를 설정하였는데, 계획된 공간해상도 3Cm를 확보하기 위해 비행고도는 대상지를 기준으로 80m로 설정하였으며 촬영 시 종중복율(Endlap) 및 횡중복율(Sidelap)을 45%로 설정하여 항공사진촬영을 실시하였다. 그 결과 약 4개의 스트립 비행 경로를 따라 44개의 Waypoint가 설정되었으며, 비행고도와 속도는 80m, 약 3m/sec로 항공사진촬영을 실시하였다. 연구대상지인 광한루원의 항공사진 촬영을 결과를 살펴 보면 44개의 Wapoint 중 41개 지점에서 촬영되었으며, 취득된 디지털데이터에 비행로그데이터를 적용하여 잔차분 석을 통한 유효성을 검증한 결과 UAV에서 촬영된 41개의 디지털데이터 모두 유효한 데이터로 확인되었다. 3D맵핑 데이터제작 및 DEM분석은 Photoscan을 이용하 여 데이터를 추출하였다. 3D맵핑을 위한 데이터의 정합은 UAV 시스템에서 취득된 디지털영상데이터를 모두 이용하였으며, Photoscan의 자동영상매칭 기능을 이용하여 Point Cloud Data 형식의 데이터를 하나의 데이터로 정렬한 후 이를 바탕으로 Polygon Data 및 Texture로 변환하여 약4.5 ㎝급의 DSM을 생성하였으며, 정사투영 방식의 보정을 통해 약 3cm급의 정사영상데이터를 제작하였다. 취득된 디지털데이터를 통해 구축된 공간정보데이터의 보정 및 정확성 검토를 위해 UAV를 이용하여 취득된 영상과 GPS/INS데이터, 기상기준점 측정 데이터를 기반으로 정확성을 검토하였다. 지상기준점측량은 RTK(Real Time Kinematic)의 GRS80좌표 시스템을 이용하여 데이터를 취득하였으며, 측량지점은 3곳을 지상기준점으로 선정하였 다. 측정결과 RMSE는 ±5Cm 이내의 정확성을 가지는 것으 로 나타나 정사영상 데이터를 이용한 수목의 수관폭 등에 대한 평면데이터 구축에는 문제가 없는 것으로 파악되었다. 구축된 정사영상 데이터를 분석한 결과 총 25주의(산수 유4, 은행나무7, 소나무9, 단풍나무4, 모과나무1) 수목이 확인되었는데, 이중 산수유와 은행나무는 현장조사를 통해 수목의 종류를 확인하였다. 정사영상 데이터를 바탕으로 최종 생성된 DSM데이터를 살펴보면, 시설물 및 지형에 대한 수치데이터는 정확하게 분석되었으나 수목의 경우에는 총 25주의 수목중 약 50%에 해당하는 12주(단풍나무 3주, 소나무 5주, 산수유 4주)의수목에 대한 3D데이터가 추출되었다. 이러한 이유는 항공촬영을 통한 디지털데이터 구축에 있어 수직부감으로 촬영된 디지털데이터는 수목의 불규칙면에 대한 데이터 구축의 어려움과 수목 일부가 그림자와 중첩됨으로써 그림자로 인식되는 현상, 수목들 중첩되는 구간에 대한 3D데이터 구축이 어려운 것으로 판단되었으며 최근에 식재된 수목(은행나무(7)에서 3D데이터가 생성되지 않는 것으로 나타났다. 따라서 추후 항공촬영에 있어 디지 털 데이터 구축 시 45도 사선 촬영을 포함하여 항공사진촬 영 시간과 시기 등에 대한 보완이 필요할 것으로 판단되며, 3D데이터 구축에 필요한 위치좌표의 참고자료 구축을 위해 다양한 고도에서 항공사진촬영을 실시함과 동시에 지상 촬 영의 병행을 통해 수목개체군에 대한 종합적인 3D데이터 구축이 가능할 것으로 판단된다.
        As The Fourth Industrial Revolution and Intelligent Information Age came into full-scale, the policy of open government data has become a hot topic for each country. The United States, the United Kingdom, and other countries are shifting policy direction to “creating value” of open government data. Also, in the age of the digital economy where the data market is soaring, open government data is gradually being recognized as a new raw material for new business and start-ups. In addition, Korea ranked first in the OECD open government data evaluation twice in a row, and was highly evaluated in the international evaluation. However, domestic firms are still lacking in qualitative openness of government data, data is dispersed among institutions, lack of public-private data linkage, and development of app-oriented development. This study attempts to analyze major national policies for the creation of a data ecosystem that considers data lifecycle, from production to storage, distribution and utilization of data. First, the target countries were the leading public data countries among the OGP member countries, the USA, the UK, Australia and Canada. The results of this study are as follows. As a result of analyzing the results and comparing Korea’s policies, it was concluded that most of Korea is superior in open government data policy. However, improvement of data quality, development of open data portal as an open platform, support for finding various users including apps and web development companies, and cultivation of open government data utilizing personnel are analyzed as policy issues. In addition, the direction of policy for the balanced ecosystem of Korea is presented together.
        Current evaluation practices for IT projects suffer from several problems, which include the difficulty of self-explanation for the evaluation results and the improperly scaled scoring system. This study aims to develop a methodology of opinion mining to extract key factors for the causal relationship analysis and to assess the feasibility of quantifying evaluation scores from text comments using opinion mining based on big data analysis. The research has been performed on the domain of publicly procured IT proposal evaluations, which are managed by the National Procurement Service. Around 10,000 sets of comments and evaluation scores have been gathered, most of which are in the form of digital data but some in paper documents. Thus, more refined form of text has been prepared using various tools. From them, keywords for factors and polarity indicators have been extracted, and experts on this domain have selected some of them as the key factors and indicators. Also, those keywords have been grouped into into dimensions. Causal relationship between keyword or dimension factors and evaluation scores were analyzed based on the two research models-a keyword-based model and a dimension-based model, using the correlation analysis and the regression analysis. The results show that keyword factors such as planning, strategy, technology and PM mostly affects the evaluation result and that the keywords are more appropriate forms of factors for causal relationship analysis than the dimensions. Also, it can be asserted from the analysis that evaluation scores can be composed or calculated from the unstructured text comments using opinion mining, when a comprehensive dictionary of polarity for Korean language can be provided. This study may contribute to the area of big data-based evaluation methodology and opinion mining for IT proposal evaluation, leading to a more reliable and effective IT proposal evaluation method.
        This paper presents the novel observation model, called Modified Spherical Signature Descriptor(MSSD), capable of representing 2D image generated from 3D point cloud data. The Modified Spherical Signature Descriptor has a uniform mesh grid to accumulate the occupancy evidence caused by neighbor point cloud data. According to a kind of area such as wall, road, tree, car, and so on, the evidence pattern of 2D image looks so different each other. For the parameter learning of Convolutional Neural Network(CNN) layers, these 2D images were applied as the input layer. The Convolutional Neural Network, one of the deep learning methods and familiar with the image analysis, was utilized for the urban structure classification. The case study on CNN practice was introduced in detail in this paper. The simulation results shows that the classification accuracy of CNN with 2D images of the proposed MSSD was improved more than the traditional methods' one.
        As the 3D laser scanning technology capable of databaseing large sewage box culverts becomes possible, it is necessary to develop a standardization manual that can clearly distinguish the structural and operational defect types of box culver and analyze the defect data. In this study, we collected and analyzed defects in sewage box culverts of 14,827m in total by selecting three districts in Korea. The major defects were surface damages, and their defect densities were 2.17 m2/m, 0.27 m2/m and 0.10 m2/m for aggregate exposure, Steel reinforcement exposure, and Steel reinforcement projecting. In order to support the decision of the box culverment management, it was divided into five grades and each defect code and defect score were allocated. The results of this study are useful for the diagnosis of the sewage box culverts in Korea and it is expected to support a decision making for management.
        토목분야 생산성 향상을 위해 BIM을 적용하기 위한 노력이 계속되고 있으나, 선형과 지반에 대한 정보가 필수적인 터널 구조물의 정보모델링에 대한 연구는 미흡한 상황이다. AMT에서 생성된 선형의 이산화를 통해 포인트의 정보를 BAT로 전 달하여 곡선 선형을 반영한 터널 모델 생성 방안을 제시하였다. 철도 구조물과 선형에 대한 물리적 요소와 공간적 요소를 모두 고려할 수 있도록 IFC 데이터 스키마를 확장하였으며, 확장된 데이터 스키마를 참조하여 선형, 구조물, 지반 정보에 대한 의미정보를 PSET에 담아 IFC기반의 정보관리를 가능하게 하였다. 제안한 방법에 따라 생성한 정보모델을 통해 터널과 밀접한 암반 등급을 자동으로 도출함으로써 활용성을 검증하였다.
        Recent development in science and technology has modernized the weapon system of ROKN (Republic Of Korea Navy). Although the cost of purchasing, operating and maintaining the cutting-edge weapon systems has been increased significantly, the national defense expenditure is under a tight budget constraint. In order to maintain the availability of ships with low cost, we need accurate demand forecasts for spare parts. We attempted to find consumption pattern using data mining techniques. First we gathered a large amount of component consumption data through the DELIIS (Defense Logistics Intergrated Information System). Through data collection, we obtained 42 variables such as annual consumption quantity , ASL selection quantity, order-relase ratio. The objective variable is the quantity of spare parts purchased in f-year and MSE (Mean squared error) is used as the predictive power measure. To construct an optimal demand forecasting model, regression tree model, randomforest model, neural network model, and linear regression model were used as data mining techniques. The open software R was used for model construction. The results show that randomforest model is the best value of MSE. The important variables utilized in all models are consumption quantity, ASL selection quantity and order-release rate. The data related to the demand forecast of spare parts in the DELIIS was collected and the demand for the spare parts was estimated by using the data mining technique. Our approach shows improved performance in demand forecasting with higher accuracy then previous work. Also data mining can be used to identify variables that are related to demand forecasting.
        Our research is aimed at predicting recent trend and leading technology for the future and providing optimal Nano technology trend information by analyzing Nano technology trend. Under recent global market situation, Users’ needs and the technology to meet these needs are changing in real time. At this point, Nano technology also needs measures to reduce cost and enhance efficiency in order not to fall behind the times. Therefore, research like trend analysis which uses search data to satisfy both aspects is required. This research consists of four steps. We collect data and select keywords in step 1, detect trends based on frequency and create visualization in step 2, and perform analysis using data mining in step 3. This research can be used to look for changes of trend from three perspectives. This research conducted analysis on changes of trend in terms of major classification, Nano technology of 30’s, and key words which consist of relevant Nano technology. Second, it is possible to provide real-time information. Trend analysis using search data can provide information depending on the continuously changing market situation due to the real-time information which search data includes. Third, through comparative analysis it is possible to establish a useful corporate policy and strategy by apprehending the trend of the United States which has relatively advanced Nano technology. Therefore, trend analysis using search data like this research can suggest proper direction of policy which respond to market change in a real time, can be used as reference material, and can help reduce cost.
        Data clustering is one of the most difficult and challenging problems and can be formally considered as a particular kind of NP-hard grouping problems. The K-means algorithm is one of the most popular and widely used clustering method because it is easy to implement and very efficient. However, it has high possibility to trap in local optimum and high variation of solutions with different initials for the large data set. Therefore, we need study efficient computational intelligence method to find the global optimal solution in data clustering problem within limited computational time. The objective of this paper is to propose a combined artificial bee colony (CABC) with K-means for initialization and finalization to find optimal solution that is effective on data clustering optimization problem. The artificial bee colony (ABC) is an algorithm motivated by the intelligent behavior exhibited by honeybees when searching for food. The performance of ABC is better than or similar to other population-based algorithms with the added advantage of employing fewer control parameters. Our proposed CABC method is able to provide near optimal solution within reasonable time to balance the converged and diversified searches. In this paper, the experiment and analysis of clustering problems demonstrate that CABC is a competitive approach comparing to previous partitioning approaches in satisfactory results with respect to solution quality. We validate the performance of CABC using Iris, Wine, Glass, Vowel, and Cloud UCI machine learning repository datasets comparing to previous studies by experiment and analysis. Our proposed KABCK (K-means+ABC+K-means) is better than ABCK (ABC+K-means), KABC (K-means+ABC), ABC, and K-means in our simulations.
        The mortality rate in industrial accidents in South Korea was 11 per 100,000 workers in 2015. It’s five times higher than the OECD average. Economic losses due to industrial accidents continue to grow, reaching 19 trillion won much more than natural disaster losses equivalent to 1.1 trillion won. It requires fundamental changes according to industrial safety management. In this study, We classified the risk of accidents in industrial complex of Ulju-gun using spatial analytics and data mining. We collected 119 data on accident data, factory characteristics data, company information such as sales amount, capital stock, building information, weather information, official land price, etc. Through the pre-processing and data convergence process, the analysis dataset was constructed. Then we conducted geographically weighted regression with spatial factors affecting fire incidents and calculated the risk of fire accidents with analytical model for combining Boosting and CART (Classification and Regression Tree). We drew the main factors that affect the fire accident. The drawn main factors are deterioration of buildings, capital stock, employee number, officially assessed land price and height of building. Finally the predicted accident rates were divided into four class (risk category-alert, hazard, caution, and attention) with Jenks Natural Breaks Classification. It is divided by seeking to minimize each class’s average deviation from the class mean, while maximizing each class’s deviation from the means of the other groups. As the analysis results were also visualized on maps, the danger zone can be intuitively checked. It is judged to be available in different policy decisions for different types, such as those used by different types of risk ratings.
        최근 머신러닝은 빅데이터에 대한 분석방법으로서 학습을 통한 지능화된 문제해결 방안으로서 관심이 증가하고 있다. 본 논문은 LBSN 데이터와 머신러닝 방식을 이용하여 토지이용현황을 파악하는 분석을 시도하였다. 도시계획에 있어서 토지이용현황의 파악은 직접적인 현장 조사에 의존해 왔다. 최근 스마트폰 사용자가 증가하면서 등장하고 있는 위치기반 소셜미디어의 자료들 은 토지이용의 상황을 반영하는 빅데이터로서, 머신러닝 방법론은 이들에 대한 자동화된 분석을 할 수 있게 한다. 본 연구에서는 LBSN 자료와 머신러닝 기법을 이용하여 토지이용을 예측하는 모델을 개발하여 실제 토지이용현황 자료와의 비교분석을 수행하였다. 이러한 분석을 통해 LBSN자료를 이용한 토지이용현황의 자동화된 분석 방안에 대해 연구하였다.
        목적 : 본 연구는 상대가치점수를 기반으로 하는 국내 건강보험수가의 행위별 수가제가 국제 기능・장애 및 건강에 대한 분류(International Classification of Functioning, Disability and Health; ICF)의 건강 개 념에 적합한 비용을 지출하고 있는지 알아보고자 하였다. 연구방법 : 2003년-2013년 건강보험 및 의료급여권자 중 인구전체를 대표하는 100만 명의 샘플인 국민 건강보험공단의 건강보험 표본코호트 자료를 이용하였다. 건강보험요양급여비용의 이학요법료 중 제3절 전문재활치료료에 해당하는 행위들을 건강보험심사평가원에서 제시한 행위정의에 따라 신체기능과 활동 및 참여로 분류한 후 청구 통계량을 비교분석하였다. 결과 : 국내 재활치료 수가체계는 독립적인 일상생활활동, 활동/참여 그리고 가정이나 사회로 복귀를 통한 삶의 질 향상이라는 ICF의 건강 및 재활의학의 개념을 반영하지 못하고 있다. 또한, 환자의 상병군, 중 증도에 따른 재활치료의 효율적 수행을 위한 급성기–아급성기(회복기)-만성기의 재활의료체계가 정립되어 있지 않음을 확인하였다. 결론 : 재활치료의 효율적 수행을 위해서는 급성기- 아급성기(회복기)- 만성기의 재활의료체계가 정립되어야 하고 재활의료체계 내에서 의료기관 종별 역할이 구분이 필요하다. 이와 함께 적절한 재활치료 보험수가 체계 그리고 심사기준의 신설 및 개선이 필요하다.
        전 세계적으로 금융선진국을 비롯한 각 국가의 금융당국은 금융기관과 금융소 비자 간의 정보비대칭 완화 및 이를 통한 리스크관리를 위하여 금융기관이 참여하는 신용정 보 공유제도를 운영하고 있다. 본 연구는 한국에서 공유되고 있는 신용정보 중 사고정보를 대상으로 하여 실제로 공유중 인 신용정보 데이터를 분석하였다. 사고정보를 사고횟수, 사고기간, 사고금액의 세 종류로 구 분하여, 생존분석에서는 사고정보가 기업의 생존기간에 미치는 영향을 분석하였고, 이후 집 단 간 비교분석을 통해 업력 7년 이하의 창업기업과 그 외 기존기업 간에 존재하는 사고정보 양상 차이를 검증하였다. 총 449,579개 기업의 사고정보에 대한 정량적인 분석을 시행한 결과 생존분석에서 사고횟 수가 사고후생존기간과 정(+)의 상관관계를 보였는데 이는 사고횟수를 부정적인 요소로 판단하고 있는 금융기관의 현행 리스크정책에 반증적 성격을 갖는다. 또한, 집단 간 비교분석 에서는 창업기업의 사고양상이 기존기업보다 생존기간에 더 긍정적인 모습을 보이고 있음에 따라 창업기업의 특성을 고려한 신용정보 공유제도의 개선이 필요하다는 시사점을 도출할 수 있었다.