В настоящее время методы автоматического распознавания жестов развиваются большими темпами, что связано со значительными успехами их практического использования. Технология жестового управления часто используется в современных технических устройствах, например, в системах «умный дом», дополненной и виртуальной реальности, а также является одним из альтернативных каналов управления робототехническими системами. В работе представлены результаты сравнительного исследования эффективности применения различных методов машинного обучения, в том числе глубокого обучения. Для экспериментов использовался размеченный набор данных с фотографиями жестов, разбитых на классы. В ходе экспериментов были обучены несколько моделей распознавания жестов: модель на основе метода скелетизации руки, совмещённого с обучением на полученных координатах суставов руки, и модели, построенные на основе вариаций современных архитектур сверточных нейронных сетей. При построении моделей глубокого обучения также учитывалась ее сложность исходя из доступных ресурсов и необходимого для оптимального обучения объема данных. На основе результатов проведенных экспериментов был выполнен сравнительный анализ применения выбранных методов. Полученная информация позволяет сделать вывод о том, какой подход будет показывать лучший результат при распознавании жестовой информации с точки зрения эффективности модели и сложности её обучения.
Currently, there is a rapid development of automatic gesture recognition techniques, which is attributed to their significant success in practical applications. Gesture-control technology is frequently used in modern technological products such as smart homes, augmented and virtual reality systems, as well as in robotic systems for alternative control methods. This paper presents the findings of a comparative study on the efficacy of various machine learning techniques, including deep learning, in the context of gesture recognition. For the purpose of the experiments, a labeled dataset of photos of gestures was used, which were categorized into distinct classes. Several gesture recognition models were trained during the experiments. A model that utilizes the skeletonization technique of the hand in combination with training using obtained hand joint coordinates was implemented. Additionally, models based on various variations of contemporary convolutional neural networks were trained. When developing deep learning models for our project, we considered the complexity of the models based on the available resources and the amount of training data required for optimal performance. We conducted experiments to evaluate various methods and analyze their applicability. The results of these tests allowed us to identify the approach that would yield the most effective recognition of gesture information, considering both the accuracy of the model and the training complexity.