Использование нейросетевого метода для решения задач сегментации изображений

Сегментация изображений играет важную роль при выявлении различных заболеваний и патологий посредством обработки медицинских изображений. За прошедшие годы был разработан целый ряд традиционных подходов такие как бинарный пороговый метод (метод Оцу), метод водоразделов, метод кластеризации с помощью K-средних к выполнению сегментации изображений, использующих специфичные для предметной области знания для эффективного решения проблем сегментации в конкретных областях применения. Но, к сожалению, эти методы являлись не эффективными. На самом деле, суть сегментации изображений является классификацией содержащих каждый пиксель с аналогичными атрибутами. А цель классификации пиксель - это обработать его крупно, нечувствительно к шуму, мелко, и средний звёздочный фильтр. То, что не позволяет сделать традиционные методы. Поэтому есть необходимость предлагать новый метод позволяющий устранять эти недостатки. Мы предлагаем метод основан на автокодировщик (специальная архитектура искусственных нейронных сетей, позволяющая применять обучение без учителя при использовании метода обратного распространения ошибки), позволяющий сжимать любое большое изображение на мелкое, (с тем же свойствами как входное). Этот метод позволяет также сэкономить ресурсы. При этом, мы используем метода обработки изображение под названием "MaxPooling" (U-Net). В работе, мы создавали собственную метрику для отслеживания результата тренировки сети. В практической части мы попробовали сегментировать на классы изображения со стройки, а также попиксельно определили местонахождения самолета на изображения.

Image segmentation plays an important role in detecting various diseases and pathologies through medical image processing. Over the years, a number of traditional approaches such as the binary threshold method (Otsu method), watershed method, and K-means clustering method have been developed to perform image segmentation, using domain-specific knowledge to efficiently solve segmentation problems in specific applications. But unfortunately, these methods were not effective. In fact, the essence of image segmentation is the classification of containing each pixel with similar attributes. And the goal of classifying a pixel is to treat it coarse, insensitive to noise, fine, and a medium star filter. Something that traditional methods cannot do. Therefore, there is a need to propose a new method that allows eliminating these disadvantages. We propose a method based on autoencoder (a special architecture of artificial neural networks that allows the application of learning without a teacher using the method of back propagation of the error), which allows compressing any large image into a small one, (with the same properties as the input). This method also saves resources. In this case, we use an image processing method called "MaxPooling" (U-Net). In the work, we created our own metric to track the result of the network training. In the practical part, we tried segmenting into classes the images from the construction site, as well as pixel by pixel the locations of the aircraft in the images.

Авторы
Издательство
Фонд содействия развитию интернет-медиа, ИТ-образования, человеческого потенциала Лига интернет-медиа
Номер выпуска
4
Язык
Русский
Страницы
744-755
Статус
Опубликовано
Том
18
Год
2022
Организации
  • 1 Российский университет дружбы народов
Ключевые слова
segmentation; pixel; autoencoder; Max-pooling; U-Net; metrics; object detection; artificial neural networks; CNNs; full-width network; сегментация; пиксель; автокодировщик; Max-pooling; U-Net; метрика; обнаружение объектов; искусственные нейронные сети; CNN-сети; полносверточная сеть
Дата создания
28.12.2023
Дата изменения
28.12.2023
Постоянная ссылка
https://repository.rudn.ru/ru/records/article/record/100185/
Поделиться

Другие записи

Шевякова Ю.С.
Вестник Набережночелнинского государственного педагогического университета. Набережночелнинский государственный педагогический университет. 2022. С. 172-174