Классификационные модели в дискурсивном анализе текстов на русском языке

В настоящей работе рассматривается задача распознавания дискурсивных отношений между фрагментами русскоязычных текстов в рамках Теории Риторических Структур (Rhetorical Structure Theory). Представлен подход, основанный на машинном обучении с учителем, приводится анализ информативности различных видов текстовых признаков применительно к подзадачам классификации и определения ядра дискурсивного отношения. В качестве набора классов используется сокращённый набор отношений RST-DT.

Classification models for discourse analysis in Russian

In this paper, the problem of discourse relation labeling for the pairs of Russian texts spans according to Rhetorical Structure Theory is considered. The efficiency of various supervised machine learning algorithms is compared, analysis of feature importances is provided according to the tasks of relation classification and nucleus detection. In this work, the subset of RST-DT discourse relations is used as a set of classes.

Авторы
Издательство
РУДН
Язык
Русский
Страницы
347-352
Статус
Опубликовано
Год
2019
Организации
  • 1 Российский университет дружбы народов
  • 2 Федеральный исследовательский центр «Информатика и управление» РАН
Ключевые слова
discourse parsing; Rhetorical Structure Theory; Information Extraction; дискурсивный анализ; теория риторических структур; извлечение информации
Цитировать
Поделиться

Другие записи