Lightweight face recognition models, as one of the most popular and long-standing topics in the field of computer vision, has achieved vigorous development and has been widely used in many real-world applications due to fewer number of parameters, lower floating-point operations, and smaller model size. However, few surveys reviewed lightweight models and reimplemented these lightweight models by using the same calculating resource and training dataset. In this survey article, we present a comprehensive review about the recent research advances on the end-to-end efficient lightweight face recognition models and reimplement several of the most popular models. To start with, we introduce the overview of face recognition with lightweight models. Then, based on the construction of models, we categorize the lightweight models into: (1) artificially designing lightweight FR models, (2) pruned models to face recognition, (3) efficient automatic neural network architecture design based on neural architecture searching, (4) Knowledge distillation and (5) low-rank decomposition. As an example, we also introduce the SqueezeFaceNet and EfficientFaceNet by pruning SqueezeNet and EfficientNet. Additionally, we reimplement and present a detailed performance comparison of different lightweight models on the nine different test benchmarks. At last, the challenges and future works are provided. There are three main contributions in our survey: firstly, the categorized lightweight models can be conveniently identified so that we can explore new lightweight models for face recognition; secondly, the comprehensive performance comparisons are carried out so that ones can choose models when a state-of-the-art end-to-end face recognition system is deployed on mobile devices; thirdly, the challenges and future trends are stated to inspire our future works.
This paper presents a new feature representation method, named two- dimensional orthogonalized Fisher discriminant analysis(2D-OFD). The method adopts the 2D-LDA and orthogonalization of Fisher vector. It produces the small size scatter matrix than 1D method. Therefore it can evaluate the scatter matrix accurately. In addition, it is not suffered from small sample size problem. The orthogonalization eliminates the linear dependences among Fisher's discriminant vectors. As a result, it promotes the discriminant capability of the 2D-LDA. The proposed method is tested on the ORL face image database. We test our method 10 times. For each experiment, five training images are randomly chosen each person and the other five images are used for testing. The test show that the average recognition rate is 96.2%. When the image is downsampled to 28x23 matrix to reduce the computational complexity, the average recognition rate is 95.9%.
얼굴 자극의 성별 및 종족과 라인업 절차에 따른 얼굴 인식에서의 차이를 알아보기 위해 두 편의 실험을 수행하였다. 실험 1에서 사용된 자극은 동남아시아인 및 동북아시아인 남성의 정면 얼굴 이미지였으며 얼굴 자극의 종족과 실험참가자의 종족이 동일할 때 얼굴 인식이 향상될 수 있는지(동종족 우세 효과)를 알아보았다. 실험 2에서는 동북아시아인 남성 및 여성의 정면 얼굴을 자극으로 사용하여 참가자와 얼굴 자극의 성별이 같을 때 얼굴 인식이 더 정확한지(동성별 우세효과) 알아보았다. 두 실험에서 실험참가자는 모두 동북아시아인이었으며 라인업 절차의 동시제시 조건과 순차제시 조건을 사용하여 얼굴 자극 제시 방법에 따른 차이도 비교하였다. 실험결과 동종족 우세 효과와 라인업 절차에 따른 얼굴 인식 정확도의 차이는 관찰되지 않았으나 표적이 동남아시아인 자극일 때 얼굴 인식 정확률이 높았다. 흥미롭게도, 동성별 우세 효과는 여성 실험참가자에 한해 관찰되었다. 이러한 결과를 통해 얼굴 인식이 주의에 의해 영향을 받을 수 있을 가능성에 대해 논의하였다.
본 논문은 얼굴인식 분야에 있어서 필수 과정인 얼굴 및 얼굴의 주요소인 눈과 입의 추출에 관한 방법을 제시한다. 얼굴 영역 추출은 복잡한 배경하에서 움직임 정보나 색상정보를 사용하지 않고 통계적인 모델에 기반한 일종의 형찬정합 방법을 사용하였다. 통계적인 모델은 입력된 얼굴 영상들의 Hotelling변환 과정에서 생성되는 고유 얼굴로, 복잡한 얼굴 영상을 몇 개의 주성분 갑으로 나타낼 수 있게 한다. 얼굴의 크기, 영상의 명암, 얼굴의 위치에 무관하게 얼굴을 추출하기 위해서, 단계적인 크기를 가지는 탐색 윈도우를 이용하여 영상을 검색하고 영상 강화 기법을 적용한 후, 영상을 고유얼굴 공간으로 투영하고 복원하는 과정을 통해 얼굴을 추출한다. 얼굴 요소의 추출은 각 요소별 특성을 고려한 엣지 추출과 이진화에 따른 프로젝션 히스토그램 분석에 의하여 눈과 입의 경계영역을 추출한다. 얼굴 영상에 관련된 윤곽선 추출에 관한 기존의 연구에서 주로 기하학적인 모양을 갖는 눈과 입의 경우에는 주로 가변 템플릿(Deformable Template)방법을 사용하여 특징을 추출하고, 비교적 다양한 모양을 갖는 눈썹, 얼굴 윤곽선 추출에는 스네이크(Snakes: Active Contour Model)를 이용하는 연구들이 이루어지고 있는데, 본 논문에서는 이러한 기존의 연구와는 달리 스네이크를 이용하여 적절한 파라미터의 선택과 에너지함수를 정의하여 눈과 입의 윤곽선 추출을 실험하였다. 복잡한 배경하에서 얼굴 영역의 추출, 추출된 얼굴 영역에서 눈과 입의 영역 추출 및 윤곽선 추출이 비교적 좋은 결과를 보이고 있다.
수분량, 유분량, 피부밝기, pH 등 피부 특성을 나타내는 지표들은 환경적, 유전적 요소에 따라 다르게나타난다. 하지만 이는 절대적인 피부 특성을 나타내는 것으로 사람들이 느끼는 감성적인 피부 특성과는 차이가있다. 이를 반영하듯 최근 임상 연구들은 절대적인 피부 변화를 통한 사람들의 인지 변화에 관한 연구들이 주를이루고 있다. 본 연구에서는 아시아인을 대상으로 국가별로 절대적인 피부색의 차이 뿐 아니라 실제 피부색의변화에 따라 본인들이 인지하는 피부 밝기에도 차이가 있는지를 규명하고자 하였다. 아시아 3개국 총 410명의피험자들이 본 연구에 참여하였으며 설문을 통해 본인들이 생각하는 피부밝기를 3단계로 구분하여 응답하고 본인이 생각하는 피부 밝기 변화에 따라 실제 피부색은 어떤 양상으로 변화하는지를 분석하였다. 국적에 관계 없이모든 참가자들이 공통적으로 피부색이 밝다고 느낄수록 실제 피부 밝기는 증가하는 양상을 보였지만 절대적인피부색과 피부가 밝다고 느끼는 정도는 차이가 있었다. 게다가, 피부 붉은기와 노란기의 변화도 국가별로 다른양상을 보였다. 결론적으로, 본 연구 결과에 근거하여 판단 할 때 본인들의 피부 밝기를 인지하는 요소는 절대적인 피부 밝기가 아닌 국가별로 다른 기준이 적용된다는 것을 확인할 수 있었다.
This paper is concerned with face recognition for human-robot interaction (HRI) in robot environments. For this purpose, we use Tensor Subspace Analysis (TSA) to recognize the user's face through robot camera when robot performs various services in home environments. Thus, the spatial correlation between the pixels in an image can be naturally characterized by TSA. Here we utilizes face database collected in u-robot test bed environments in ETRI. The presented method can be used as a core technique in conjunction with HRI that can naturally interact between human and robots in home robot applications. The experimental results on face database revealed that the presented method showed a good performance in comparison with the well-known methods such as Principal Component Analysis (PCA) and Linear Discriminant Analysis (LDA) in distant-varying environments.
This study developed a surveillance robot for a ship. The developed robot consists of ultrasonic sensors, an actuator, a lighting fixture and a camera. The ultrasonic sensors are used to avoid collision with obstacles in the environment. The actuator is a servo motor system. The developed robot has four drive wheels for driving. The lighting fixture is used to guide the robot in a dark environment. To transmit an image, a camera with a pan moving and a tilt moving is equipped on the upper part of the robot. AdaBoost algorithm trained with 15 features, is used for face recognition. In order to evaluate the face recognition of the developed robot, experiments were performed.
This paper is concerned with the template-based face recognition from robot camera images with illumination and distance variations. The approaches used in this paper consist of Eigenface, Fisherface, and Icaface which are the most representative recognition techniques frequently used in conjunction with face recognition. These approaches are based on a popular unsupervised and supervised statical technique that supports finding useful image representations, respectively. Thus we focus on the performance comparison from robot camera images with unwanted variations. The comprehensive experiments are completed for a databases with illumination and distance variations.
In face recognition, learning speed of face is very important since the system should be trained again whenever the size of dataset increases. In existing methods, training time increases rapidly with the increase of data, which leads to the difficulty of training with a large dataset. To overcome this problem, we propose SVDD (Support Vector Domain Description)-based learning method that can learn a dataset of face rapidly and incrementally. In experimental results, we show that the training speed of the proposed method is much faster than those of other methods. Moreover, it is shown that our face recognition system can improve the accuracy gradually by learning faces incrementally at real environments with illumination changes.
컴퓨터 기술의 발전에 따라서 게임분야 역시 다양한 첨단 기술이 적용되고 있다. 예를 들면 강력한 3D가속 기능을 가진 비디오카드, 5.1 채널 사운드, 포스피드백 지원 입력 장치, 운전대, 적외선 센서, 음성 감지기 등이 게임의 입출력 인터페이스로서 이용되고 있다. 전형적인 방법 이외에도 광학방식이나 휴대용 게임기에 대한 플레이 방식에 대한 연구도 활발하다. 최근에는 비디오 게임기에도 사람의 동작을 인식하여 게임의 입력으로 받아들이는 기술이 상용화되기도 하였다. 본 논문에서는 이런 발전 방향을 고려하여 차세대 게임 인터페이스의 방식으로서 사용될 수 있는 사람의 표정 인식을 통한 인터페이스 구현을 위한 접근 방법들에 대하여 고찰을 하고자 한다. 사람의 표정을 입력으로 사용하는 게임은 심리적인 변화를 게임에 적용시킬 수 있으며, 유아나 장애자들이 게임을 플레이하기 위한 수단으로도 유용하게 사용될 수 있다. 영상을 통한 자동 얼굴 인식 및 분석 기술은 다양한 응용분야에 적용될 수 있는 관계로 많은 연구가 진행되어 왔다. 얼굴 인식은 동영상이나 정지영상과 같은 영상의 형태, 해상도, 조명의 정도 등에 따른 요소에 의하여 인식률이나 인식의 목적이 달라진다. 게임플레이어의 표정인식을 위해서는 얼굴의 정확한 인식 방법을 필요로 하며, 이를 위한 비교적 최근의 연구 동향을 살펴보고자 한다.