АНАЛИЗ МЕТОДОВ ВЫЯВЛЕНИЯ ИСКУССТВЕННО СГЕНЕРИРОВАННЫХ ТЕКСТОВ

Современные модели генерации текстов показывают достаточно хорошие результаты в ряде задач, связанных с написанием небольших текстовых фрагментов. Результаты использования данных моделей могут быть использованы в том числе с целью создания большого количества фейковой информации (новости, рецензии, отзывы, и т. п.). В связи с этим, возникает необходимость разработки алгоритмов, способных отличать тексты, написанные человеком, от автоматически сгенерированных. Данная работа посвящена исследованию методов машинного обучения в решении задач генерации текстов, а также анализу методов, способных выявлять искусственно синтезированные тексты. Рассматриваются существующие подходы к генерации текстов и варианты их практического применения. Приводится разбор существующих наборов данных для анализа эффективности работы методов выявления искусственно синтезированных текстов. Также рассматривается подход к созданию собственного набора данных для решения данной задачи.

Authors
Language
Russian
Pages
27-30
Status
Published
Year
2024
Organizations
  • 1 Российский университет дружбы народов
  • 2 Федеральный исследовательский центр «Информатика и управление» РАН
Keywords
генерация текстов; обработка естественного языка; машинное обучение

Other records