АЛГОРИТМЫ РАСПОЗНАВАНИЯ СХОЖЕСТИ ТЕКСТА В ВОПРОСНО-ОТВЕТНЫХ СИСТЕМАХ

Вопросно-ответные системы играют важную роль в поиске информации, а основным этапом в процессе их создания является обработка текста. Чтобы понять, как это происходит, следует изучить алгоритмы, которые распознают сходства в запросах пользователей и производят их анализ. Чем выше процент результата их работы, тем лучше они справляются с поставленной задачей. В данной статье рассмотрены основные процессы обработки естественных языков и работа вопросно-ответной системы. Произведен сравнительный анализ некоторых алгоритмов схожести и на основании этого сделан вывод о том, какой алгоритм лучше использовать для разработки системы.

TEXT SIMILARITY RECOGNITION ALGORITHMS IN QUESTION-ANSWER SYSTEMS

Question-answer systems play an important role in the search for information, and the main stage in the process of their creation is text processing. You should study the algorithms that recognize the similarities in user requests and analyze them in order to understand how this happens. The higher the percentage of the result of their work, the better they cope with the task. This article discusses the basic processes of processing natural languages and the operation of the question-answer system. A comparative analysis of some similarity algorithms was performed and on the basis of this, a conclusion was drawn about which algorithm is better to use for system development.

Авторы
Издательство
ООО Агентство перспективных научных исследований
Номер выпуска
6
Язык
Русский
Страницы
11-15
Статус
Опубликовано
Год
2020
Организации
  • 1 Российский университет дружбы народов
Ключевые слова
вопросно-ответная система; natural language processing; алгоритм распознавания схожести текста; коэффициент Жаккара; коэффициент Сёренсена; question-answer system; text similarity algorithm; jaccard coefficient; Sørensen coefficient
Дата создания
11.07.2024
Дата изменения
11.07.2024
Постоянная ссылка
https://repository.rudn.ru/ru/records/article/record/152356/
Поделиться

Другие записи