Natural Language Processing for the Analysis of the Political Characterisation of Migration in the Croatian Political Discourse

This paper tackles the issue of analyst bias in performance of comparative political analyses on political discourse, by leveraging data and machine-learning over human prior knowledge. The case studied is characterization of the issue of migration in the Croatian political discourse, which was chosen arbitrarily. We developed a machine-learning system that identifies most prominent features in the Croatian political discourse, with regards to migration and were interested solo in comparative political analysis in political science. This system does not rely on human judgement on the part of the researchers, and can be thus considered to be “objective”, short of possible sampling or selection bias. It is replicable. If provided, the same dataset and algorithm used, same conclusions should be reached by any scientist. This result was achieved by creating a text corpus from news items and press releases extracted from the websites of Croatian political parties currently represented in the Parliament. Available and collected data consist of public announcements mainly from IDS (Istarski Demokratski Sabor / Istrian Democratic Assambly), SDSS (Samostalna Demokratska Srpska Stranka / Independed Democratic Serb Party) and HSLS (Hrvatska Socijalno Liberalna Stranka / Croatian Social Liberal Party). Data analyzed suggests three dominant phrases of the research process. All political parties had similar political stand towards pointed out issues. Three most significant phrases were determined. First phrase is related to words “Demography” and “Reduction” and finding suggest that most analyzed articles relates towards migration of Croatian citizens in connection to economic hardships of some kind. Phrase two is related to words “Border” and “Croatia-Serbia” which strongly indicates relation to migration and is related towards inter-Balkan migration, mostly connected with consequences of the Croatian War of Independence from 1990’s, and is of most interest to SDSS, a Serb minority party in Croatia. Phrase three is related towards Marrakesh Agreement (Global Compact for Safe, Orderly and Regular Migration), where most of analyzed data shows that parties have a constructive but ambivalent stance towards migration from the third countries. Research conducted on available data, shows that wide spread international migration is not in the focus of most Croatian political parties, while topics and interest for inter-Balkan and Croatian economic/political migration dominates Croatian political spectre

Статья посвящена решению проблемы предвзятости аналитиков при проведении сравнительного анализа политического дискурса. Предлагаемое решение строится на анализе данных и использовании машинного обучения для обработки естественного языка. Кейс, который мы изучаем в связи с этой проблемой, относится к определению проблемы миграции в хорватском политическом дискурсе. Была разработана система машинного обучения, которая выявляет наиболее характерные черты хорватского политического дискурса в отношении миграции: эта система свободна от исследовательской субъективности. Исследование воспроизводимо, и при условии, что используется тот же набор данных и алгоритм, любой ученый должен прийти к тем же выводам. Этот результат был достигнут на основе сбора корпус-текстов из новостных материалов и пресс-релизов с веб-сайтов хорватских политических партий, представленных в парламенте, а также группу алгоритмов классификации машинного обучения для матриц Bag-of-Words, вычисленных из корпуса. Мы определили наиболее точную модель, классификатор дерева решений, которая была выбрана для дальнейшего анализа из-за ее точности и интерпретируемости. Нами также проанализированы правила принятия решений, определенные этим классификатором, которые затем были интерпретированы людьми, чтобы определить политические особенности текста, которые лучше всего предсказывают связь этого текста с темой миграции. В итоге подробно раскрыты три правила, идентифицированные с этой процедурой, которые мы считаем особенно интересными.

Авторы
Издательство
Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН)
Номер выпуска
3
Язык
Английский
Страницы
517-532
Статус
Опубликовано
Том
22
Год
2020
Организации
  • 1 Peoples’ Friendship University of Russia (RUDN University)
Ключевые слова
политический дискурс; кампания общественной информации; машинное обучение; поиск информации; обработка естественного языка; миграция; political discourse; public information campaign; machine learning; Information Retrieval; natural language processing; migration
Цитировать
Поделиться

Другие записи

Должикова А.В., Мосейкина М.Н.
Вестник Российского университета дружбы народов. Серия: Политология. Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН). Том 22. 2020. С. 387-400
Аникеева Е.Н.
Вестник Российского университета дружбы народов. Серия: Философия. Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН). Том 24. 2020. С. 125-133