Fake news detection using machine learning

Kurysheva, E.S.

Идентификация фальшивых новостей с применением методов машинного обучения

В данной работе рассматривается задача выявления поддельных новостных сообщений. Предлагаемый подход состоит в классификации позиции (уровня соответствия) основного текста относительно заголовка новостной статьи. В частности, основной текст может быть согласованным, несогласованным, быть связным или бессвязным. В ходе решения задачи был предложен и реализован алгоритм автоматической классификации новостных сообщений с помощью методов машинного обучения, а именно комбинация методов, основанная на средневзвешенном значении между деревьями решений с градиентным усилением и глубокой свёрточной нейронной сетью. Для обучения модели использовался размеченный корпус новостных сообщений. Для проверки алгоритма, в свою очередь, был предложен неразмеченный корпус новостных сообщений. В качестве результата мы определяем позицию основного текста относительно утверждения в заголовке, которая принадлежит одному из четырёх классов: согласованна, не согласованна, связна, бессвязна.

Fake news detection using machine learning

This paper covers the topic of fake news detection. The proposed approach consists of the stance classification of a body text from a news article relative to a headline. Specifically, the body text may agree, disagree, discuss or be unrelated to the headline. In the course of solving our task, the algorithm for automatic classification was proposed and implemented. The model is based on a weighted average between gradient-boosted decision trees and a deep convolutional neural network. To train our model a labeled corpus of news messages was used. For testing the algorithm, in turn, an unlabeled corpus of news messages was proposed. As an output we provide a prediction of the stance of the body text relative to the claim made in the headline which belongs to one of four categories: agree, disagree, discuss and unrelated.

Авторы

Курышева Е.С. (Kurysheva E.S.) ¹

Conference proceedings

Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем: материалы Всероссийской конференции с международным участием. Москва, РУДН, 16–20 апреля 2018 г.

Издательство

РУДН

Язык

Russian

Страницы

242-244

Статус

Published

Год

2019

Организации

¹ Peoples' Friendship University of Russia

Ключевые слова

Computer Science; information technologies; text analysis; natural language processing; компьютерные науки; информационные технологии; анализ текста; обработка текста на естественном языке

Цитировать

ГОСТ MLA RIS BibTex

Другие записи

AUTONOMY IN THE RUSSIAN FEDERATION: THEORY AND PRACTICE

Article

Kartashkin V.A., Abashidze A.Kh.

International Journal on Minority and Group Rights. Том 10. 2003. С. 203-220

ОБРАЗ РОССИИ В БОЛГАРСКОМ ЛИТЕРАТУРНОМ МИРЕ

Article

Найденов С.М., Анипкина Л.Н.

Языки и культуры народов мира. Межкультурная коммуникация : сборник статей круглого стола молодых исследователей, посвященного Дню Славянской Письменности. Москва, 23 мая 2020 г.. 2019. С. 242-245