Об эволюции классических вероятностных моделей языка в естественно-языковых приложениях

Мельников, С.Ю.; Пересыпкин, В.А.

Об эволюции классических вероятностных моделей языка в естественно-языковых приложениях

В работе предпринята попытка систематизировать основные этапы эволюции моделей языка, связать их с развитием персональных электронно-вычислительных средств и математического аппарата моделирования. Рассмотрены наиболее востребованные на сегодняшний день статистические и нейросетевые модели языка, которые активно используются на практике в естественно-языковых приложениях, связанных с задачами распознавания (распознавание речи, оптические системы распознавания, коррекция искаженных текстов и др.). Отмечено, что развитие технологий языкового моделирования привело к существенному снижению перплексии и энтропии разрабатываемых моделей, что, в свою очередь, позволило существенно повысить эффективность распознавания и коррекции.

The paper attempts to systematize the main stages of the evolution of language models, to link them with the development of personal electronic computing tools and mathematical modeling apparatus. The most popular, to date, statistical and neural network models of language are considered, which are actively used in practice in natural language applications related to recognition tasks (speech recognition, optical recognition systems, correction of distorted texts, etc.). It is noted that the development of language modeling technologies has led to a significant decrease in the perplexity and entropy of the developed models, which, in turn, has significantly improved the efficiency of recognition and correction.

Авторы

Мельников С.Ю. ¹ , Пересыпкин В.А. ²

Журнал

Вестник современных цифровых технологий

Издательство

Щербаков Андрей Юрьевич

Номер выпуска

Язык

Русский

Страницы

4-14

Статус

Опубликовано

Год

2023

Организации

¹ Российский университет дружбы народов имени Патриса Лумумбы
² Академия Криптографии РФ

Ключевые слова

probabilistic language model; neural language model; entropy; perplexity; speech recognition; ocr; text correction; вероятностная модель языка; нейросетевая модель языка; энтропия; перплексия; распознавание речи; ocr; коррекция текста

Цитировать

ГОСТ MLA RIS BibTex

Другие записи

AUTONOMY IN THE RUSSIAN FEDERATION: THEORY AND PRACTICE

Статья

Kartashkin V.A., Abashidze A.Kh.

International Journal on Minority and Group Rights. Том 10. 2003. С. 203-220

НОВАЯ НЕИСКРЕННОСТЬ: О ТВОРЧЕСТВЕ ЗАХАРА ПРИЛЕПИНА

Статья

Жучкова А.В.

ФИЛОЛОГИЧЕСКИЕ НАУКИ. НАУЧНЫЕ ДОКЛАДЫ ВЫСШЕЙ ШКОЛЫ. 2023. С. 102-115