Идентификация фальшивых новостей с применением методов машинного обучения

В данной работе рассматривается задача выявления поддельных новостных сообщений. Предлагаемый подход состоит в классификации позиции (уровня соответствия) основного текста относительно заголовка новостной статьи. В частности, основной текст может быть согласованным, несогласованным, быть связным или бессвязным. В ходе решения задачи был предложен и реализован алгоритм автоматической классификации новостных сообщений с помощью методов машинного обучения, а именно комбинация методов, основанная на средневзвешенном значении между деревьями решений с градиентным усилением и глубокой свёрточной нейронной сетью. Для обучения модели использовался размеченный корпус новостных сообщений. Для проверки алгоритма, в свою очередь, был предложен неразмеченный корпус новостных сообщений. В качестве результата мы определяем позицию основного текста относительно утверждения в заголовке, которая принадлежит одному из четырёх классов: согласованна, не согласованна, связна, бессвязна.

Fake news detection using machine learning

This paper covers the topic of fake news detection. The proposed approach consists of the stance classification of a body text from a news article relative to a headline. Specifically, the body text may agree, disagree, discuss or be unrelated to the headline. In the course of solving our task, the algorithm for automatic classification was proposed and implemented. The model is based on a weighted average between gradient-boosted decision trees and a deep convolutional neural network. To train our model a labeled corpus of news messages was used. For testing the algorithm, in turn, an unlabeled corpus of news messages was proposed. As an output we provide a prediction of the stance of the body text relative to the claim made in the headline which belongs to one of four categories: agree, disagree, discuss and unrelated.

Authors
Publisher
РУДН
Language
Russian
Pages
242-244
Status
Published
Year
2019
Organizations
  • 1 Peoples' Friendship University of Russia
Keywords
Computer Science; information technologies; text analysis; natural language processing; компьютерные науки; информационные технологии; анализ текста; обработка текста на естественном языке
Date of creation
20.02.2020
Date of change
20.02.2020
Short link
https://repository.rudn.ru/en/records/article/record/57903/
Share

Other records

Bezyaev Vladimir, Volpert Vitaly, Sadekov Nail
Сборник материалов международной конференции КРОМШ-2019 " XXX Крымская Осенняя Математическая Школа-симпозиум по спектральным и эволюционным задачам". "Полипринт". 2019. P. 242-243