Об эволюции классических вероятностных моделей языка в естественно-языковых приложениях

В работе предпринята попытка систематизировать основные этапы эволюции моделей языка, связать их с развитием персональных электронно-вычислительных средств и математического аппарата моделирования. Рассмотрены наиболее востребованные на сегодняшний день статистические и нейросетевые модели языка, которые активно используются на практике в естественно-языковых приложениях, связанных с задачами распознавания (распознавание речи, оптические системы распознавания, коррекция искаженных текстов и др.). Отмечено, что развитие технологий языкового моделирования привело к существенному снижению перплексии и энтропии разрабатываемых моделей, что, в свою очередь, позволило существенно повысить эффективность распознавания и коррекции.

The paper attempts to systematize the main stages of the evolution of language models, to link them with the development of personal electronic computing tools and mathematical modeling apparatus. The most popular, to date, statistical and neural network models of language are considered, which are actively used in practice in natural language applications related to recognition tasks (speech recognition, optical recognition systems, correction of distorted texts, etc.). It is noted that the development of language modeling technologies has led to a significant decrease in the perplexity and entropy of the developed models, which, in turn, has significantly improved the efficiency of recognition and correction.

Авторы
Мельников С.Ю. 1 , Пересыпкин В.А.2
Издательство
Щербаков Андрей Юрьевич
Номер выпуска
16
Язык
Русский
Страницы
4-14
Статус
Опубликовано
Год
2023
Организации
  • 1 Российский университет дружбы народов имени Патриса Лумумбы
  • 2 Академия Криптографии РФ
Ключевые слова
probabilistic language model; neural language model; entropy; perplexity; speech recognition; ocr; text correction; вероятностная модель языка; нейросетевая модель языка; энтропия; перплексия; распознавание речи; ocr; коррекция текста
Дата создания
28.12.2023
Дата изменения
28.12.2023
Постоянная ссылка
https://repository.rudn.ru/ru/records/article/record/104991/
Поделиться

Другие записи

Топильская Ю.В., Багаутдинова А.С.
Цифровая трансформация, инновации, SMART-CITY. Проблемы устойчивого развития, экологии человека и охраны окружающей среды. 2023. С. 214-218