Нейросетевые методы сжатия векторов для задачи приближенного поиска ближайших соседей

Буянов, И.О.; Ядринцев, В.В.; Соченков, И.В.

Нейросетевые методы сжатия векторов для задачи приближенного поиска ближайших соседей

В статье проверяется гипотеза применимости нейросетевых автокодировщиков как метод векторного сжатия для задачи приближенного поиска ближайших соседей. Проверка проводилась на нескольких больших датасетах с различными архитектурами автокодировщиков и индексов. Она показала, что, хотя ни одна из комбинаций автокодировщиков и индексов не может полностью превзойти чистые решения, в некоторых случаях они могут быть полезными. Мы также выявили некоторые эмпирические связи оптимальной размерности скрытого слоя и внутренней размерности наборов данных. Было также показано, что функция потерь является определяющим фактором качества сжатия.

The paper examines the hypothesis of the applicability of neural autoencoders as a method of vector compression in the pipeline of approximate nearest neighbor search. The evaluation was conducted on several large datasets using various autoencoder architectures and indexes. It has been demonstrated that, although none of the combinations of autoencoders and indexes can fully outperform pure solutions, in some cases, they can be useful. Additionally, we have identified some empirical relationships between the optimal dimensionality of the hidden layer and the internal dimensionality of the datasets. It has also been shown that the loss function is a determining factor for compression quality.

Авторы

Буянов И.О. ¹ , Ядринцев В.В. ¹ , Соченков И.В. ^1, ^2, ^3, ⁴

Журнал

Труды Института системного программирования РАН

Издательство

Институт системного программирования им. В.П. Иванникова РАН

Номер выпуска

Язык

Русский

Страницы

7-22

Статус

Опубликовано

Том

Год

2024

Организации

¹ Федеральный исследовательский центр Информатика и Управление РАН
² Институт системного программирования РАН
³ Университет Иннополис
⁴ Сеченовский Университет

Ключевые слова

approximate nearest neighbor search; autoencoders; large datasets; приближенный поиск соседей; автокодировщики; крупномасштабный набор данных

Цитировать

ГОСТ MLA RIS BibTex

Другие записи

ПЕРСПЕКТИВЫ ВНЕДРЕНИЯ ПРИНЦИПОВ БЕРЕЖЛИВОГО СТРОИТЕЛЬСТВА

Статья

Коротеев Д.Д., Васютин А.О., Ким А.А.

Инженерный вестник Дона. 2024. С. 305-315

ПРОБЛЕМА ВРАЧЕБНЫХ ОШИБОК: МНЕНИЕ ВРАЧЕЙ

Статья

Подмаркова О.И., Пивень Н.П., Пак В.И.

Вестник Медицинского стоматологического института. 2024. С. 25-27