Применение сверточных нейронных сетей для обнаружения и распознавания изображений на основе самописного генератора

Муаль, М.Н.; Козырев, Д.В.

Применение сверточных нейронных сетей для обнаружения и распознавания изображений на основе самописного генератора

состоит в идентификации форм, заранее описанных в цифровом изображении и, в общем случае, в цифровом видеопотоке. Хотя, как правило, можно выполнять распознавание по видеофрагментам, процесс обучения обычно выполняется на изображениях. В данной работе рассматривается алгоритм классификации и распознавания объектов с использованием сверточных нейронных сетей. Цель работы - реализовать алгоритм обнаружения и классификации различных графических объектов, подаваемых с веб-камеры. Задача состоит в том, чтобы сначала классифицировать и распознавать объект с высокой точностью по заданному набору данных, а затем продемонстрировать способ генерации изображений для увеличения объема обучающего набора данных путем самописного генератора. Используемый алгоритм классификации и распознания является инвариантным к переносу, сдвигу и повороту. Существенной новизной в этой работе является создание самописного генератора, позволяющего применять различные виды аугментации (искусственное увеличение объема обучающей выборки путем модификации обучающих данных) для формирования каждый раз новых групп измененных изображений.

Object recognition is a branch of artificial vision and one of the pillars of machine vision. It consists of the identification of forms pre-described in a digital image and, in general, in a digital video stream. While it is generally possible to perform recognition on video clips, the learning process is usually performed on images. In this paper, we consider an algorithm for classifying and recognizing objects using convolutional neural networks. The purpose of the work is to implement an algorithm for detecting and classifying various graphic objects fed from a webcam. The task is to first classify and recognize an object with high accuracy according to a given dataset and then demonstrate how to generate images to increase the size of the training data set using a self-written generator. The classification and recognition algorithm used is invariant to translation, translation, and rotation. A significant novelty in this work is the creation of a self-written generator that allows you to apply various types of augmentation (artificial increase in the size of the training sample by modifying the training data) to form new groups (batches) of modified images each time.

Авторы

Муаль М.Н. ¹ , Козырев Д.В. ¹

Журнал

Современные информационные технологии и ИТ-образование

Издательство

Фонд содействия развитию интернет-медиа, ИТ-образования, человеческого потенциала Лига интернет-медиа

Номер выпуска

Язык

Русский

Страницы

507-515

Статус

Опубликовано

Том

Год

2022

Организации

¹ Российский университет дружбы народов

Ключевые слова

image detection; image recognition; convolutional neural networks; R-CNN model; Augmentations; subsampling; обнаружение изображений; распознавание изображений; сверточные нейронные сети; модель R-CNN; аугментации; субдискретизация; Regional Convolutional Neural Networks

Цитировать

ГОСТ MLA RIS BibTex

Другие записи

ЧИСЛЕННЫЙ АНАЛИЗ НА НЕРАВНОМЕРНОЙ СЕТКЕ ЗАДАЧИ О КРАТЧАЙШЕЙ ОЧЕРЕДИ ДЛЯ МАСШТАБИРУЕМОЙ ВО ВРЕМЕНИ СИСТЕМЫ МАССОВОГО ОБСЛУЖИВАНИЯ С МАЛЫМ ПАРАМЕТРОМ

Статья

Буатта М.А., Васильев С.А., Канзитдинов Ш.К., Царева Г.О.

Современные информационные технологии и ИТ-образование. Том 18. 2022. С. 496-506

CHANGES IN THE USE OF THE MOODLE PLATFORM BY STUDENTS AT DIFFERENT LEVELS OF TRAINING DEPENDING ON THE PERIOD OF RESTRICTIONS DUE TO COVID-19

Статья

Borodina Maria, Ivashkina T.A., Golubeva Tatyana, Afanasiev Oleg, Pronina Yulia, Berlov Kirill

Revista Conrado. Том 18. 2022. С. 125-132