Подходы к оценке позы нескольких людей

Оценка позы человека на изображениях и видео стала важной темой в компьютерном зрении благодаря своим разнообразным применениям, таким как распознавание поведения, захват движения, дополненная реальность и обучение роботов. Методы, основанные на глубоком обучении, используются для решения множества задач и дают хорошие результаты. Подходы для оценки позы нескольких людей можно разделить на две категории: нисходящие и восходящие. В нисходящем подходе сначала происходит локализация людей на изображении, а затем определение частей их тел и вычисление положений. Этот подход не зависят от масштаба и хорошо справляются с популярными тестами с точки зрения точности. Однако из-за сложности этих моделей получение вывода в реальном времени требует больших вычислительных затрат. С другой стороны, система определяет части тел людей на изображении с последующим вычислением положений. Тепловая карта используется этим подходом для оценки вероятности того, что каждый пиксель содержит определённый ориентир. В данной статье представлен обширный обзор методов глубокого обучения для оценки позы человека на двумерных изображениях с особым акцентом на нисходящие подходы.

Approaches to multi-person pose estimation

Human pose estimation in images and videos has become an important topic in computer vision due to its diverse applications, such as behavior recognition, motion capture, augmented reality, and robot training. Methods based on deep learning are used for a variety of tasks and yield good results. Approaches for Multi-Person Pose Estimation can be divided into two categories: top-down and bottom-up. In the top-down approach, people are first localized in the image and then their body parts are identified and positions are computed. This approach is scale-independent and handles popular tests well in terms of accuracy. However, because of the complexity of these models, obtaining real-time output is computationally intensive. On the other hand, the system identifies parts of people's bodies in the image and then calculates positions. A heat map is used by this approach to estimate the probability that each pixel contains a particular landmark. This paper presents an extensive review of deep learning methods for human pose estimation in two-dimensional images, with special emphasis on top-down approaches.

Authors
Publisher
Российский университет дружбы народов (РУДН)
Language
Russian
Pages
423-428
Status
Published
Year
2023
Organizations
  • 1 Peoples' Friendship University of Russia
Keywords
human pose estimation; object detector; multi-person pose estimation; оценка позы человека; детектор объектов; оценка позы нескольких людей
Share

Other records

Serenko D.S.
Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем. Российский университет дружбы народов (РУДН). 2023. P. 417-422
Frolov K.V.
Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем. Российский университет дружбы народов (РУДН). 2023. P. 429-431