Классификационные модели в дискурсивном анализе текстов на русском языке

В настоящей работе рассматривается задача распознавания дискурсивных отношений между фрагментами русскоязычных текстов в рамках Теории Риторических Структур (Rhetorical Structure Theory). Представлен подход, основанный на машинном обучении с учителем, приводится анализ информативности различных видов текстовых признаков применительно к подзадачам классификации и определения ядра дискурсивного отношения. В качестве набора классов используется сокращённый набор отношений RST-DT.

Classification models for discourse analysis in Russian

In this paper, the problem of discourse relation labeling for the pairs of Russian texts spans according to Rhetorical Structure Theory is considered. The efficiency of various supervised machine learning algorithms is compared, analysis of feature importances is provided according to the tasks of relation classification and nucleus detection. In this work, the subset of RST-DT discourse relations is used as a set of classes.

Publisher
РУДН
Language
Russian
Pages
347-352
State
Published
Year
2019
Organizations
  • 1 Peoples' Friendship University of Russia
  • 2 Institute of System Analysis Federal Research Center “Computer Science and Control” of RAS
Keywords
discourse parsing; Rhetorical Structure Theory; Information Extraction; дискурсивный анализ; теория риторических структур; извлечение информации
Share

Other records