Классификационные модели в дискурсивном анализе текстов на русском языке

В настоящей работе рассматривается задача распознавания дискурсивных отношений между фрагментами русскоязычных текстов в рамках Теории Риторических Структур (Rhetorical Structure Theory). Представлен подход, основанный на машинном обучении с учителем, приводится анализ информативности различных видов текстовых признаков применительно к подзадачам классификации и определения ядра дискурсивного отношения. В качестве набора классов используется сокращённый набор отношений RST-DT.

Classification models for discourse analysis in Russian

In this paper, the problem of discourse relation labeling for the pairs of Russian texts spans according to Rhetorical Structure Theory is considered. The efficiency of various supervised machine learning algorithms is compared, analysis of feature importances is provided according to the tasks of relation classification and nucleus detection. In this work, the subset of RST-DT discourse relations is used as a set of classes.

Authors
Publisher
РУДН
Language
Russian
Pages
347-352
Status
Published
Year
2019
Organizations
  • 1 Peoples' Friendship University of Russia
  • 2 Institute of System Analysis Federal Research Center “Computer Science and Control” of RAS
Keywords
discourse parsing; Rhetorical Structure Theory; Information Extraction; дискурсивный анализ; теория риторических структур; извлечение информации
Date of creation
20.02.2020
Date of change
20.02.2020
Short link
https://repository.rudn.ru/en/records/article/record/58283/
Share

Other records

Carluccio A.
Изучение и преподавание русского языка в разных лингвокультурных средах. Российский университет дружбы народов (РУДН). 2019. P. 348-357