ПРОТОТИП СИСТЕМЫ РАСПОЗНАВАНИЯ УСТАЛОСТИ ПО ВИДЕО-, АУДИО- И ТЕКСТОВЫМ ДАННЫМ

Описан прототип системы, использующей видео-, аудио- и текстовые данные для распознавания состояния усталости и низкой работоспособности человека. Для этого также была изучена и подробно описана задача VQA, а также особенности ее реализации на примерах из других исследований. Проведены эксперименты на наборах с большой вариацией задач: стандартная задача VQA на наборе VQA v2, сложные сцены CLEVR CoGenT, анализ кассовых чеков Receipt-AVQA-2023.

A prototype system utilizing video, audio, and text data for recognizing states of fatigue and reduced human performance is described. For this purpose, the task of Visual Question Answering (VQA) has also been studied and elaborately outlined, along with features of its implementation based on examples from another research. Experiments have been conducted on datasets with a wide range of tasks: the standard VQA task on the VQA v2 dataset, complex scenarios on CLEVR CoGenT, and analysis of cash receipts on Receipt-AVQA-2023.

Авторы
Вейценфельд Д.А. 1, 2 , Киселев Г.А. 1 , Коровин Я.С.3 , Маков С.В.4
Журнал
Издательство
АНО "Национальный центр физики и математики"
Номер выпуска
1
Язык
Русский
Страницы
65-73
Статус
Опубликовано
Том
1
Год
2023
Организации
  • 1 ФИЦ “Информатика и управление” Российской академии наук”
  • 2 Российский Университет дружбы народов им. Патриса Лумумбы
  • 3 Научно-исследовательский институт многопроцессорных вычислительных и управляющих систем
  • 4 Институт сферы обслуживания и предпринимательства (филиал) ДГТУ в г. Шахты
Цитировать
Поделиться

Другие записи

ФИЛЬКЕВИЧ И.А., ЧЖАН Цзяньвэй
Экономика. Бизнес. Банки. Автономная некоммерческая организация высшего образования "Русско-Итальянский Международный Университет" (Институт). 2023. С. 9-18