Применение сверточных нейронных сетей для обнаружения и распознавания изображений на основе самописного генератора

состоит в идентификации форм, заранее описанных в цифровом изображении и, в общем случае, в цифровом видеопотоке. Хотя, как правило, можно выполнять распознавание по видеофрагментам, процесс обучения обычно выполняется на изображениях. В данной работе рассматривается алгоритм классификации и распознавания объектов с использованием сверточных нейронных сетей. Цель работы - реализовать алгоритм обнаружения и классификации различных графических объектов, подаваемых с веб-камеры. Задача состоит в том, чтобы сначала классифицировать и распознавать объект с высокой точностью по заданному набору данных, а затем продемонстрировать способ генерации изображений для увеличения объема обучающего набора данных путем самописного генератора. Используемый алгоритм классификации и распознания является инвариантным к переносу, сдвигу и повороту. Существенной новизной в этой работе является создание самописного генератора, позволяющего применять различные виды аугментации (искусственное увеличение объема обучающей выборки путем модификации обучающих данных) для формирования каждый раз новых групп измененных изображений.

Object recognition is a branch of artificial vision and one of the pillars of machine vision. It consists of the identification of forms pre-described in a digital image and, in general, in a digital video stream. While it is generally possible to perform recognition on video clips, the learning process is usually performed on images. In this paper, we consider an algorithm for classifying and recognizing objects using convolutional neural networks. The purpose of the work is to implement an algorithm for detecting and classifying various graphic objects fed from a webcam. The task is to first classify and recognize an object with high accuracy according to a given dataset and then demonstrate how to generate images to increase the size of the training data set using a self-written generator. The classification and recognition algorithm used is invariant to translation, translation, and rotation. A significant novelty in this work is the creation of a self-written generator that allows you to apply various types of augmentation (artificial increase in the size of the training sample by modifying the training data) to form new groups (batches) of modified images each time.

Издательство
Фонд содействия развитию интернет-медиа, ИТ-образования, человеческого потенциала Лига интернет-медиа
Номер выпуска
3
Язык
Русский
Страницы
507-515
Статус
Опубликовано
Том
18
Год
2022
Организации
  • 1 Российский университет дружбы народов
Ключевые слова
image detection; image recognition; convolutional neural networks; R-CNN model; Augmentations; subsampling; обнаружение изображений; распознавание изображений; сверточные нейронные сети; модель R-CNN; аугментации; субдискретизация; Regional Convolutional Neural Networks
Дата создания
28.12.2023
Дата изменения
28.12.2023
Постоянная ссылка
https://repository.rudn.ru/ru/records/article/record/99697/
Поделиться

Другие записи

Буатта М.А., Васильев С.А., Канзитдинов Ш.К., Царева Г.О.
Современные информационные технологии и ИТ-образование. Фонд содействия развитию интернет-медиа, ИТ-образования, человеческого потенциала Лига интернет-медиа. Том 18. 2022. С. 496-506