ПРОТОТИП СИСТЕМЫ РАСПОЗНАВАНИЯ УСТАЛОСТИ ПО ВИДЕО-, АУДИО- И ТЕКСТОВЫМ ДАННЫМ

Описан прототип системы, использующей видео-, аудио- и текстовые данные для распознавания состояния усталости и низкой работоспособности человека. Для этого также была изучена и подробно описана задача VQA, а также особенности ее реализации на примерах из других исследований. Проведены эксперименты на наборах с большой вариацией задач: стандартная задача VQA на наборе VQA v2, сложные сцены CLEVR CoGenT, анализ кассовых чеков Receipt-AVQA-2023.

A prototype system utilizing video, audio, and text data for recognizing states of fatigue and reduced human performance is described. For this purpose, the task of Visual Question Answering (VQA) has also been studied and elaborately outlined, along with features of its implementation based on examples from another research. Experiments have been conducted on datasets with a wide range of tasks: the standard VQA task on the VQA v2 dataset, complex scenarios on CLEVR CoGenT, and analysis of cash receipts on Receipt-AVQA-2023.

Authors
Вейценфельд Д.А. 1, 2 , Киселев Г.А. 1 , Коровин Я.С.3 , Маков С.В.4
Journal
Publisher
АНО "Национальный центр физики и математики"
Number of issue
1
Language
Russian
Pages
65-73
Status
Published
Volume
1
Year
2023
Organizations
  • 1 ФИЦ “Информатика и управление” Российской академии наук”
  • 2 Российский Университет дружбы народов им. Патриса Лумумбы
  • 3 Научно-исследовательский институт многопроцессорных вычислительных и управляющих систем
  • 4 Институт сферы обслуживания и предпринимательства (филиал) ДГТУ в г. Шахты
Date of creation
01.07.2024
Date of change
01.07.2024
Short link
https://repository.rudn.ru/en/records/article/record/107861/
Share

Other records

ФИЛЬКЕВИЧ И.А., ЧЖАН Цзяньвэй
Экономика. Бизнес. Банки. Автономная некоммерческая организация высшего образования "Русско-Итальянский Международный Университет" (Институт). 2023. P. 9-18