Researching and estimating the ecological characteristics of target fish species is crucial for fisheries resource management. The results of these estimates significantly influence stock assessments and management reference points such as size limit and closed seasons. Recently, ecological characteristics have been changing due to overfishing, climate change, and marine pollution, making continuous estimation and monitoring essential. This study analyzed the ecological changes in small yellow croaker (Larimichthys polyactis) resources in Korea over 24 years (2000-2023) using biological data (growth and gonad traits). By estimating the annual length-weight relationship and length at maturity (L50 and L95), we interpreted the numerical trends of early maturation due to resource depletion. The parameter b of the length-weight relationship, indicating the nutritional status of the resources, showed a slight increase over the years, suggesting relatively good nutritional status (b > 3.0) during most periods. Trend analysis between length at maturity and biomass indicated that as biomass decreased, maturity length also decreased.
The Fourth Industrial Revolution and sensor technology have led to increased utilization of sensor data. In our modern society, data complexity is rising, and the extraction of valuable information has become crucial with the rapid changes in information technology (IT). Recurrent neural networks (RNN) and long short-term memory (LSTM) models have shown remarkable performance in natural language processing (NLP) and time series prediction. Consequently, there is a strong expectation that models excelling in NLP will also excel in time series prediction. However, current research on Transformer models for time series prediction remains limited. Traditional RNN and LSTM models have demonstrated superior performance compared to Transformers in big data analysis. Nevertheless, with continuous advancements in Transformer models, such as GPT-2 (Generative Pre-trained Transformer 2) and ProphetNet, they have gained attention in the field of time series prediction. This study aims to evaluate the classification performance and interval prediction of remaining useful life (RUL) using an advanced Transformer model. The performance of each model will be utilized to establish a health index (HI) for cutting blades, enabling real-time monitoring of machine health. The results are expected to provide valuable insights for machine monitoring, evaluation, and management, confirming the effectiveness of advanced Transformer models in time series analysis when applied in industrial settings.
The sensory stimulation of a cosmetic product has been deemed to be an ancillary aspect until a decade ago. That point of view has drastically changed on different levels in just a decade. Nowadays cosmetic formulators should unavoidably meet the needs of consumers who want sensory satisfaction, although they do not have much time for new product development. The selection of new products from candidate products largely depend on the panel of human sensory experts. As new product development cycle time decreases, the formulators wanted to find systematic tools that are required to filter candidate products into a short list. Traditional statistical analysis on most physical property tests for the products including tribology tests and rheology tests, do not give any sound foundation for filtering candidate products. In this paper, we suggest a deep learning-based analysis method to identify hand cream products by raw electric signals from tribological sliding test. We compare the result of the deep learning-based method using raw data as input with the results of several machine learning-based analysis methods using manually extracted features as input. Among them, ResNet that is a deep learning model proved to be the best method to identify hand cream used in the test. According to our search in the scientific reported papers, this is the first attempt for predicting test cosmetic product with only raw time-series friction data without any manual feature extraction. Automatic product identification capability without manually extracted features can be used to narrow down the list of the newly developed candidate products.
전 세계 다양한 국가들을 비롯하여 우리나라도 생물다양성을 보전하기 위한 노력에 동참하고 있다. 특히 생물종과 관련해서는 특정 생물종을 대상으로 서식적합분석을 실시하여 잠재적인 서식 적지를 찾고 보전방안을 수립하는 연구들이 활발하게 수행되고 있다. 그러나 현재까지 축적된 정보를 바탕으로 한 서식적합지역의 중장기 변화에 대한 연구는 미흡한 실정이다. 이에 본 연구는 강원도 지역을 대상으로 멸종위기 야생생물 1급으로 지정된 수달을 대상으로 서식적합지역의 시계열 변화를 분석하고 변화 양상을 살펴보고자 하였다. 시계열 변화 분석을 위해서 약 20년간 수행된 2차, 3차, 4차 전국자연환경조사의 수달 종 출현지점 조사자료를 이용하였다. 또한 각 조사시기 별 서식환경을 반영하기 위해 조사시기와 일치하는 토지피복도를 환경변수 제작에 활용하였다. 서식적합지역 분석을 위해서는 종의 출현 정보만을 바탕으로 모델 구동이 가능하며, 선행연구를 통해 신뢰도가 높다고 입증된 MaxEnt 모형을 사용하였다. 연구결과, 각 조사시기 별 수달의 서식적합지역 지도가 도출되었으며, 하천을 중심으로 서식지가 분포하는 경향이 나타났다. 모델링 결과 도출된 환경변수의 반응곡선을 비교하여 수달이 선호하는 서식지의 특성을 파악하였다. 조사시기 별 서식 적지의 변화를 살펴본 결과, 2차 전국자연환경조사를 기반으로 한 서식 적지가 가장 넓은 분포를 나타냈으며, 3, 4차 조사의 서식 적지는 면적이 줄어드는 경향을 나타냈다. 또한, 3개 조사시기 분석결과를 종합하여 서식 적지의 변화 양상을 분석하고 유형화하였다. 변화 유형에 따라서 현장조사, 모니터링, 보호지역 설정, 복원계획과 같이 서로 다른 보전계획을 제안하였다. 본 연구는 수달 서식 적지의 위치와 면적의 시계열 변화를 볼 수 있는 종합분석 지도를 제작하고, 지역별 서식 적지 변화 유형에 따라 필요한 보전계획을 제안하였다는 점에서 의의를 갖는다. 본 연구에서 제안된 방법과 결과는 향후 서식지 보전 및 관리 방안 수립을 위한 기초자료로 활용될 수 있을 것으로 사료된다.
Economic indicators are a factor that affects air cargo volume. This study analyzes the different factors affecting air cargo volume by each Chinese cities according to the main characteristics. The purpose of this study is to help companies related to China, airlines, and other stakeholders predict and prepare for the fluctuations in air cargo volume and make optimal decisions. To this end, 20 economic data were used, and the entire data was reduced to 5 dimensions through factor analysis to build a dataset necessary and evaluated the influencing factors by multi regression. The result shows that Macro-Economic Indicators, Production/Service indicators are significant for every cities and Chinese manufacture/Customer indicators, Korean manufacture/Oil Price indicators, Trade/Current indicators are significant for each other city. All adjusted R2 values are high enough to explain our model and the result showed excellent performance in terms of analyzing the different factors which affects air cargo volume. If companies that are currently doing business with China can identify factors affecting China's cargo volume, they can be flexible in response to changes in plans such as plans to enter China, production plans and inventory management, and marketing strategies, which can be of great help in terms of corporate operations.
Anomaly detection of Machine Learning such as PCA anomaly detection and CNN image classification has been focused on cross-sectional data. In this paper, two approaches has been suggested to apply ML techniques for identifying the failure time of big time series data. PCA anomaly detection to identify time rows as normal or abnormal was suggested by converting subjects identification problem to time domain. CNN image classification was suggested to identify the failure time by re-structuring of time series data, which computed the correlation matrix of one minute data and converted to tiff image format. Also, LASSO, one of feature selection methods, was applied to select the most affecting variables which could identify the failure status. For the empirical study, time series data was collected in seconds from a power generator of 214 components for 25 minutes including 20 minutes before the failure time. The failure time was predicted and detected 9 minutes 17 seconds before the failure time by PCA anomaly detection, but was not detected by the combination of LASSO and PCA because the target variable was binary variable which was assigned on the base of the failure time. CNN image classification with the train data of 10 normal status image and 5 failure status images detected just one minute before.
빅데이터는 2010년 이후 다양한 산업 분야에서 빠르게 확산이 진행되었다. 본 연구에서는 빅데이터가 확산되는 초기 과정에 대한 시계열 분석을 통해 빅데이터의 범용 기술 특징을 분석하였고, 각 산업의 확산 특성 차이에 대해 조사하였다. 빅데이터를 키워드로 하여 논문, 특허, 뉴스 데이터, 구글트렌드를 분석하여 선행 지수에 해당하는 데이터를 탐색하였고, 논문과 특허보다 뉴스와 구글트렌드가 2년가량 선행하는 트렌드를 보임을 확인하였다. 구글트렌드를 이용하여 국내와 미국, 일본, 중국의 국가별 도입 시기와 확산 양산을 비교하였고, 뉴스 데이터를 통해 국내의 주요한 8가지 산업 분야에 대해 확산이 진행되는 과정을 정량적 그리고 사례를 바탕으로 분석하였다.
본 연구를 통해 빅데이터처럼 산업 전반에 걸쳐 영향을 주는 범용 기술이 어떻게 초기 확산이 이루어지는지에 대한 실증적 연구 방법을 제시하였고, 빅데이터가 국내에서 각 산업별 확산 속도 차이는 어디에서 비롯되는지 파악하였다. 본 논문에서 제시한 방법은 빅데이터 이외에 다른 기술의 확산 과정에도 분석할 수 있으며, 특정 국가내의 기술 키워드 확산에 해당하므로 개발도상국에서 외국으로부터 도입된 기술을 어떻게 받아들일지 분석하는데 사용 가능하다. 그리고, 기업 측면에서는 새로운 기술을 출시하고 이를 확산하고자 할 때 어떤 경로가 효과적인지 이해할 수 있다.
Much of the data used in the analysis of environmental ecological data is being obtained over time. If the number of time points is small, the data will not be given enough information, so repeated measurements or multiple survey points data should be used to perform a comprehensive analysis. The method used for that case is longitudinal data analysis or mixed model analysis. However, if the amount of information is sufficient due to the large number of time points, repetitive data are not needed and these data are analyzed using time series analysis technique. In particular, with a large number of data points in the current situation, when we want to predict how each variable affects each other, or what trends will be expected in the future, we should analyze the data using time series analysis techniques. In this study, we introduce univariate time series analysis, intervention time series model, transfer function model, and multivariate time series model and review research papers studied in Korea. We also introduce an error correction model, which can be used to analyze environmental ecological data.
온난화와 같은 전지구적 변화는 기온과 강수 등 기상요소에 직접적으로 반영되어 곡물 수확량의 변화를 가져온다. 기후변화 시나리오에 기초한 선행연구들에서는 GCM (general circulation model)의 공간해상도 문제로 인하여 상세한 모의가 어려웠고, 시계열통계법을 활용한 연구들에서는 기후요소를 통합하여 수확량을 예측한 사례가 매우 드물었다. 이에 본 연구에서는 상세화된 기후재분석자료의 시계열모델링을 통하여 옥수수와 콩의 수확량 예측실험을 수행하였다. 미국 아이오와 주의 99개 카운티를 대상으로 1960년부터 2009년까지 50년간의 고해상도 기후재분석자료와 정부통계 수확량 DB를 구축하고, 시계열통계법인 VAR (vector autoregression)와 ARIMA (autoregressive integrated moving average)를 이용하여 다음해 수확량 예측실험을 10개 연도에 대해 수행하여 예측력을 평가하였다. VAR는 16-18%, ARIMA는 11-14% 의 오차율로 다음해의 수확량을 예측할 수 있는 것으로 집계되었으며, 옥수수의 경우 표토의 산성도, 심토의 점토와 나트륨 함유량 등의 토양특성 이 실제 수확량 및 예측정확도에 영향을 미치는 것으로 나타났다.
표준은 산업발전 및 무역 자유화의 기반이며 사회 · 경제적인 효율을 향상시키는 중요한 수단이다. 표준과 관련된 정책은 국가적인 차원에서 중요한 이슈 중 하나가 되고 있으며, 이에 따라 산업 분야별 한국산업표준 제정과 활용에 대한 분석은 표준과 관련된 연 구에서 중요한 부분이 되고 있다. 본 연구는 분야별 KS 보유 및 제정현황 분석 그리고 열람실적을 이용하여 표준의 활용도 를 분석한다. 먼저 KS의 보유현황을 국가정책적인 이슈와 함께 살펴보고, 세부적으로 KS 제 정현황이 유사한 분야들은 무엇인지 파악하기 위해 다차원 척도법을 이용하여 시각화 및 군 집화를 실시한다. 이후 각 군집별 제정현황이 유사한 분야들의 표준화 제정활동에 영향을 미 치는 결정요인이 무엇인지 가설설정에 따른 회귀분석을 실시한다. 연구결과 자본집약도, 연구개발 그리고 매출액이 표준화 제정활동에 영향을 미치는 것으로 나타났다. 이에 따라 정부 는 자본집약도가 큰 기업들이 표준화 과정에서 선도적 역할을 유도하고, 연구개발에 따른 표 준과 기술특허 등을 정책적으로 연계시키며, 매출액이 큰 기업들이 표준화 활동을 선도하도 록 지원정책을 수립해야 한다. 두 번째로 표준의 활용도를 분석하기 위해, KS 열람실적 데이 터를 사용하며, 각 KS의 제정연도, 형태 분야별 활용도가 어떻게 다른지 기초통계분석과 의 사결정나무를 사용하여 분석을 수행한다. 그 결과 표준의 제정시기가 활용도에 영향을 크게 미치며, 특정 분야와 형태의 KS들은 최근에 제정되었더라도 활용도가 높은 것으로 나타났 다. 이에 따라 열람실적이 낮은 표준들에 대한 홍보 정책과 함께, 표준을 제정할 때 미열람되 는 표준이 적어지도록 활용도를 고려하는 정책을 수립해야 한다.
Real-life time series characteristic data has significant amount of non-stationary components, especially periodic components in nature. Extracting such components has required many ad-hoc techniques with external parameters set by users in a case-by-case manner. In this study, we used Empirical Mode Decomposition Method from Hilbert-Huang Transform to extract them in a systematic manner with least number of ad-hoc parameters set by users. After the periodic components are removed, the remaining time-series data can be analyzed with traditional methods such as ARIMA model. Then we suggest a different way of setting control chart limits for characteristic data with periodic components in addition to ARIMA components.
본 연구는 MODIS 위성영상을 이용하여 광역적으로 진행되고 있는 식물계절학적 특징을 분석하고자 수행하 였다. 위성영상을 이용한 식물계절학적 특징 분석은 현 장 관찰 자료의 분석을 위한 전반적인 식물계절 경향성 및 변동성에 필요한 정보를 제공해 줄 수 있으며, 현장 관찰 값과 광역 식물계절 관측 값의 연결을 통하여 광 역 수준에서 보다 정밀도 높은 식물 계절현상 모니터링 을 가능하게 한다. 본 연구의 기반이 된 MODIS EVI 자료는 Timesat Algorithms의 double logistic function으로 평활화시켜 분석하였다. 제주→남해안→지리산→소백산→설악산 의 위도 분포에 따라 식물계절 시작일은 늦어지는 경향 을 보였다. 그러나 11년간 주요 산림 지역에서의 식물 계절 시작은 해마다 시작일에 다르게 나타나는 연변동 의 특징을 보였다. 변동 자료를 고차다항식으로 변형한 결과, 제주도는 연간 0.38일, 소백산지역은 0.174일 계 절 시작이 늦어지고, 남해안은 0.32일, 지리산은 0.239 일, 설악산 지역은 0.119일 개엽일이 빨라지고 있는 것 으로 나타났다. 우리나라 전체 식물계절 시작 시기의 특징을 공간적 으로 살펴보면, 주요 산림 지역은 늦어지고, 분지나 산 록의 남사면지역에는 빨라지는 것으로 나타났다. 지역적 으로 살펴보면, 제주도의 남서해안 및 북동해안 사면지 역, 동남해안 지역이 빠른 경향을 보였다. 행정구역별 식물계절 시작 시기를 분석한 결과, 2001 년에는 서울과 경기도, 동해안, 남해안, 마산, 창원, 밀양, 대구, 제주도를 중심으로 빠르게 시작되었다. 이는 서울, 경기도, 마산, 창원, 밀양, 대구 등의 도시지역은 도시화 에 따른 기온상승의 영향인 것으로 해석된다. 이 같은 경향은 2005, 2010년에도 같은 경향으로 보이고 있어 도시화가 식물계절 변화에 중요한 영향을 미치고 있는 것으로 해석할 수 있다. 본 연구의 시간적 규모인 10년 이내에서는 기후변동 에 따른 식물계절 현상의 변이성을 잘 나타내었으며, 이 러한 식물계절 모니터링 기법은 30년 이상의 보다 장기 적인 자료를 축적을 통하여 기후변화 양상에 따른 생물 계절 현상 변화와 해석에 중요한 역할을 할 것으로 생 각된다.
In this paper, we investigate the statistical correlation of the time series for temperature measured at the heat box in the automobile drying process. We show, in terms of the sample variance, that a significant non-linear correlation exists in the time series that consist of absolute temperature changes. To investigate further the non-linear correlation, we utilize the volatility, an important concept in the financial market, and induce volatility time series from absolute temperature changes. We analyze the time series of volatilities in terms of the de-trended fluctuation analysis (DFA), a method especially suitable for testing the long-range correlation of non-stationary data, from the correlation perspective. We uncover that the volatility exhibits a long-range correlation regardless of the window size. We also analyze the cross correlation between two (inlet and outlet) volatility time series to characterize any correlation between the two, and disclose the dependence of the correlation strength on the time lag. These results can contribute as important factors to the modeling of forecasting and management of the heat box’s temperature.
Real-life time series characteristic data has significant amount of non-stationary components, especially periodic components in nature. Extracting such components has required many ad-hoc techniques with external parameters set by users in case-by-case m