Составление словарей лингвистических показателей текстов методами корпусного анализа

В данной работе рассмотрены методы корпусной лингвистики в их практическом применении к частотному словарю. Частотные словари были созданы на основе корпуса русских рассказов начала 20 века и проанализированы с помощью методов корпусной лингвистики, предоставляемых платформой TXM. Также был сделан вывод, что с помощью частотных словарей можно отслеживать изменения, происходящие во времени в естественных языках. Данная работа состоит из таких частей, как введение, теоретическая часть, практическая часть и заключение. В теоретической части представлена информация по темам корпусной лингвистики, корпусам и их типам, а также частотным словарям и методу частотного анализа. Практическая часть содержит информацию о составлении частотного словаря и его анализе методами платформы TXM. В конце работы подводятся итоги.

Compiling word lists of texts' linguistic indicators by the means of corpus analysis methods

In this paper the methods of corpus linguistics in their practical application to the word list were considered. The word lists were created based on the corpus of Russian stories of the early 20th century and analyzed by the means of the corpus linguistics methods provided by the TXM platform. It was also concluded that with the help of word lists it is possible to track the changes occurring over time in natural languages. This paper consists of such parts as introduction, theoretical part, practical part and conclusion. In the theoretical part, the information about the topics of corpus linguistics, corpora and their types, as well as word lists and the method of frequency analysis is provided. The practical part contains the information about the compilation of a word list and its analysis by the means of the TXM platform methods. At the end of the work, the summarized results are given.

Издательство
Российский университет дружбы народов (РУДН)
Язык
Русский
Страницы
386-391
Статус
Опубликовано
Год
2023
Организации
  • 1 Российский университет дружбы народов
Ключевые слова
corpus linguistics; word lists; TXM platform; корпусная лингвистика; частотные словари; платформа TXM
Дата создания
28.12.2023
Дата изменения
28.12.2023
Постоянная ссылка
https://repository.rudn.ru/ru/records/article/record/102172/
Поделиться

Другие записи