With the recent surge in YouTube usage, there has been a proliferation of user-generated videos where individuals evaluate cosmetics. Consequently, many companies are increasingly utilizing evaluation videos for their product marketing and market research. However, a notable drawback is the manual classification of these product review videos incurring significant costs and time. Therefore, this paper proposes a deep learning-based cosmetics search algorithm to automate this task. The algorithm consists of two networks: One for detecting candidates in images using shape features such as circles, rectangles, etc and Another for filtering and categorizing these candidates. The reason for choosing a Two-Stage architecture over One-Stage is that, in videos containing background scenes, it is more robust to first detect cosmetic candidates before classifying them as specific objects. Although Two-Stage structures are generally known to outperform One-Stage structures in terms of model architecture, this study opts for Two-Stage to address issues related to the acquisition of training and validation data that arise when using One-Stage. Acquiring data for the algorithm that detects cosmetic candidates based on shape and the algorithm that classifies candidates into specific objects is cost-effective, ensuring the overall robustness of the algorithm.
In this paper, we proposed and tested an indoor obstacle recognition and avoidance algorithm using vision and ultrasonic sensors for effective operation of drone with low-power. In this paper, the indoor flight of a drone is mainly composed of two algorithms. First, for the indoor flight of the drone, the vanishing point and the center point of the image were extracted through Hough transform of the input image of the vision sensor. The drone moves along the extracted vanishing point. Second, we set an area of interest so that the drone can avoid obstacles. The area of interest is a space where the drone can fly after recognizing an obstacle at a distance from the ultrasonic sensor. When an obstacle is recognized in the drone's area of interest, the drone performs an obstacle avoidance action. To verify the algorithm proposed in this paper, a simple obstacle was installed in an indoor environment and the drone was flown. From the experimental results, the proposed algorithm confirmed the indoor flight and obstacle avoidance behavior of the drone according to the vanishing point.
As a new entertainment and social way, online games now have a huge and increasing user group, so it is of great significance to identify the data stream of online games. Using the excellent nonlinear fitting ability of BP neural network and the advantages of global search of genetic algorithm, the initial weights and thresholds of BP neural network are optimized, and the BP neural network model optimized by genetic algorithm is established. The muti-dimensional input information is proposed to identify online game data streams. Through the experimental simulation, it shows that the selected muti-dimensional information and the established model can be well applied to online game stream recognition.
본 연구에서는 파프리카 수확기 개발의 일환으로 엔드 이펙터의 정확한 제어를 위하여 스테레오 영상으로 파프리카를 인식하고 인식된 파프리카의 공간 좌표를 획득하기 위하여 영상처리 알고리즘을 개발하고자 하였다. 먼저, 색상 정보를 이용하여 파프리카 영상을 추출하기 위하여 히스토그램 분석을 수행하였고 결과에 따른 임계값 을 설정하였다. 임계값에 의해 추출된 파프리카 영역에 대해 스테레오 대응을 수행하기 위해 실험에 사용된 스테레오 영상의 F 행렬을 구하였고 이를 이용하여 에피 폴라선을 구하여 대응을 수행하였다. 대응을 수행 할 때는 색상 영상을 이용하여 강조 마스크와 컨벌루션을 통해 중심 픽셀과 수직, 수평방향 이웃 픽셀에 가중치를 적용하여 강조한 후 최소 자승 오차를 갖는 점을 대응 점으로 추출하였다. 추출 된 대응 점간의 거리를 스테레오 영상의 기하학적인 관계를 이용하여 실제 거리를 계산하였고, 계산된 거리(Z)값을 이용하여 수평(X), 수직 (Y) 방향 공간 좌표를 획득하였다. 그 결과 수평 방향 오차 평균 5.3mm, 수직 방향 오차 평균 18.8mm, 거리 오차 평균 5.4mm로 나타났으며, 거리 400~450mm 구간과 영상의 모서리 부분의 왜곡이 발생하는 부분에서 오차가 다른 구간에 비해 크게 나타나는 것을 확인 할 수 있었다.
고속 주행하는 차량의 움직임은 영상에서 흔들림으로 나타난다. 이러한 흔들림은 번호판 인식의
경우에 오인식률을 높이는 원인이 된다. 이때 흔들림에 대한 사전 정보 없이 흔들림을 복원하는 방법을
블라인드 디컨벌루션이라고 한다. 본 논문에서는 블라인드 디컨벌루션 방법으로 고속 주행으로 인한 흔들림을 복원하여 차량의 번호판을 인식하는 방법을 제안한다. 이를 위해 흔들림이 없는 영상의 통계를 이용하여 흔들림 복원을 수행한다. 다음으로 템플릿 정합을 이용하여 번호판 인식 과정을 수행한다. 실험을 통해 흔들림 보정 전에 인식하지 못하던 데이터에 대하여 흔들림 복원 후 인식률의 향상을 확인하였다.
영상처리는 정확한 오이의 형상 및 위치를 인식하기 위하여 형상인식 알고리즘에 대한 연구를 수행하였다. 다양한 오이형상을 인식하기 위한 방법으로는 신경회로망의 연상 메모리 알고리즘을 이용하여 오이의 특정형상을 인식하였다. 형상인식은 실제영상에서 오이의 형상과 위치를 판정할 수 있도록 알고리즘을 개발한 결과, 다음과 같은 결론을 얻었다. 본 알고리즘에서는 일정한 학습패턴의 수를 2개, 3개, 4개를 각각 기억시켜 샘플패턴 20개를 실험하여 연상시킨 결과, 학습패턴으로 복원된 출력패턴의 비율은 각각 65.0%, 45.0%, 12.5%로 나타났다. 이는 학습패턴의 수가 많을수록 수렴할 때, 다른 출력패턴으로 많이 검출되었다. 오이의 특정형상 검출은 30×30간격으로 자동검출 되도록 처리하였다. 실제영상에서 자동 검출로 처리한 결과, 오이인식의 처리시간은 약 0.5~1초/1개(패턴) 빠르게 검출되었다. 또한, 다섯 개의 실제 영상에서 실험한 결과, 학습패턴에 대한 다른 출력패턴은 96~99%의 제거율을 나타내었다. 오이로 인식된 출력패턴 중에서, 오검출된 출력패턴의 비율은 0.1~4.2%를 나타내었다. 본 연구에서는 신경회로망을 이용하여 오이의 형상 및 위치를 인식할 수 있도록 알고리즘을 개발하였다. 오이의 위치측정은 실제영상에서 학습패턴과 유사한 출력패턴의 좌표를 가지고, 오이의 위치좌표를 추정할 수 있었다.
This paper proposes a pattern recognition and classification algorithm based on a circular structure that can reflect the characteristics of the sEMG (surface electromyogram) signal measured in the arm without putting the placement limitation of electrodes. In order to recognize the same pattern at all times despite the electrode locations, the data acquisition of the circular structure is proposed so that all sEMG channels can be connected to one another. For the performance verification of the sEMG pattern recognition and classification using the developed algorithm, several experiments are conducted. First, although there are no differences in the sEMG signals themselves, the similar patterns are much better identified in the case of the circular structure algorithm than that of conventional linear ones. Second, a comparative analysis is shown with the supervised learning schemes such as MLP, CNN, and LSTM. In the results, the classification recognition accuracy of the circular structure is above 98% in all postures. It is much higher than the results obtained when the linear structure is used. The recognition difference between the circular and linear structures was the biggest with about 4% when the MLP network was used.
Surface electromyogram (sEMG), which is a bio-electrical signal originated from action potentials of nerves and muscle fibers activated by motor neurons, has been widely used for recognizing motion intention of robotic prosthesis for amputees because it enables a device to be operated intuitively by users without any artificial and additional work. In this paper, we propose a training-free unsupervised sEMG pattern recognition algorithm. It is useful for the gesture recognition for the amputees from whom we cannot achieve motion labels for the previous supervised pattern recognition algorithms. Using the proposed algorithm, we can classify the sEMG signals for gesture recognition and the calculated threshold probability value can be used as a sensitivity parameter for pattern registration. The proposed algorithm was verified by a case study of a patient with partial-hand amputation.
This study developed a surveillance robot for a ship. The developed robot consists of ultrasonic sensors, an actuator, a lighting fixture and a camera. The ultrasonic sensors are used to avoid collision with obstacles in the environment. The actuator is a servo motor system. The developed robot has four drive wheels for driving. The lighting fixture is used to guide the robot in a dark environment. To transmit an image, a camera with a pan moving and a tilt moving is equipped on the upper part of the robot. AdaBoost algorithm trained with 15 features, is used for face recognition. In order to evaluate the face recognition of the developed robot, experiments were performed.
스테레오 정합은 스테레오 시각 분야에서 가장 활발히 연구되는 분야이다. 본 논문에서는 물체의 위치 인식을 위한 유전 알고리즘을 이용한 스테레오 정합을 제안한다. 정합 환경을 최적화 문제로 간주하고 진화 전략을 이용하여 최적해를 탐색한다. 따라서, 유전 연산자는 스테레오 정합에 맞게 설계하였고 개체는 변위집단을 대표한다. 영상의 수평화소라인을 염색체로 간주하였다. 비용함수는 스테레오 정합에서 사용하는 일반적인 제약조건들의 조합이다. 비용함수가 명암도, 유사도, 변위 평활성으로 구성되었기 때문에 정합을 시도할 때 매 세대마다 이 모든 요소들을 한번에 다룬다. 염색체를 정의하기 위해 LoG연산자로 경계선을 추출하였으며 실험을 통하여 제안한 방법을 검증하였다.