В настоящей работе рассматривается актуальная научно-практическая задача распознавания эмоций по изображениям лиц. В последнее время наблюдается активное развитие методов и подходов к её решению, что связано с расширением области применения, накоплением значительных массивов данных, появлением новых методов глубокого обучения и высокопроизводительных вычислительных средств. Одним из перспективных направлений является применение искусственных нейронных сетей (ИНС) глубокого обучения, способных самостоятельно выделять необходимые характеристические признаки. Результаты научных исследований могут быть использованы для решения прикладных задач в области психологии, психиатрии, видеоиграх, анимации, автомобильной безопасности, обучающих компьютерных программах, робототехники, маркетинговых исследованиях и др. На основе проведённого анализа современных подходов к решению рассматриваемой задачи предложена оригинальная архитектура ER_CNN (Emotion recognition convolutional neural network) свёрточной нейронной сети, выполнено её обучение и тестирование с применением набора данных FER-2013. Приводится сравнительный анализ различных архитектур нейросетевых моделей (ER_CNN, VGG16, ResNet-50v2, Densenet121, InceptionV3, MobileNet) на том же наборе данных с применением стандартных метрик Precision, Recall и F1-score. Даются выводы о возможности дальнейшего усовершенствования моделей нейронных сетей.
This paper deals with the current scientific and practical problem of emotion recognition from facial images. In recent years, methods and approaches to solving this task have been developed intensively, due to the expansion of its scope, the accumulation of considerable data, the emergence of new methods of deep learning and high-performance computing. The results of scientific research can be used to solve applied problems in the field of psychology, psychiatry, video games, animation, car safety, computer training programs, robotics, marketing research, etc. One promising direction is the use of artificial neural networks (ANNs) of deep learning, capable of independently extracting the necessary characteristic features. On the basis of the conducted analysis of modern approaches to the solution of the problem, the original architecture ER_CNN (Emotion recognition convolutional neural network) of the convolution neural network was proposed. ER_CNN was trained and tested using dataset FER-2013. A comparative analysis of various neural network model architectures (ER_CNN, VGG16, ResNet-50v2, Densenet121, InceptionV3, MobileNet) on the same dataset is presented using the standard metrics Precision, Recall and F1-score. Conclusions are given on the potential for further improvement of neural network models.