Using artificial intelligence to develop a machine translation system and teaching resources in the Tuvan language

Новикова, М.Л.; Новиков, Ф.Н.

Использование искусственного интеллекта для создания системы машинного перевода и образовательных ресурсов на тувинском языке

Усовершенствование компьютерных технологий, применяемых в гуманитарных науках, прогресс в области развития больших языковых моделей, основанных на технологиях машинного обучения и нейросетей, вышел на высочайший уровень развития. Лингвистический потенциал больших языковых моделей вызывает закономерный интерес исследователей, что является обоснованным отражением актуальности и важности использования искусственного интеллекта для создания системы машинного перевода и образовательных ресурсов. В статье рассматривается опыт создания большой языковой модели на тувинском языке с использованием машинного обучения и искусственного интеллекта. Авторами была предпринята попытка создания большой языковой модели, способной распознавать тувинский язык, осуществлять перевод фраз с тувинского языка на русский язык, или с русского на тувинский. Помимо этого, исследовались и тестировались возможности генерации текста на тувинском языке, что может быть использовано как в сфере преподавания языка, так и при проведении различных лингвистических исследований. Актуальность исследования заключается в том, что в настоящее время тувинский язык не представлен ни в одной из известных систем машинного перевода. Важным результатом является анализ уровня цифрового присутствия тувинского языка в Интернете, а также предложенные рекомендации по выработке оптимального алгоритма построения подобных систем и веб-сервисов, основанных на машинном обучении. Результаты исследования представляют практическую ценность не только применительно к тувинскому языку, но могут быть экстраполированы и на другие государственные языки Российской Федерации.

Using artificial intelligence to develop a machine translation system and teaching resources in the Tuvan language

The advancement of computer technologies applied in the humanities and the progress in the development of large language models based on machine learning and neural network technologies have reached an exceptionally high level of sophistication. The linguistic potential of large language models elicits a natural interest among researchers, which constitutes a justified reflection of the relevance and importance of using artificial intelligence to create machine translation systems and educational resources. The article explores the experience of creating a large language model for the Tuvan language using machine learning and artificial intelligence. The authors undertook an attempt to develop a large language model capable of recognizing the Tuvan language, translating phrases into Russian and back. In addition, the possibilities of generating text in Tuvan were examined and tested, which can be used both in the field of language teaching and when conducting various kinds of linguistic research. This experience is unique since, as of now, the Tuvan language is not represented in any well-established machine translation systems. A secondary aim of the research is to analyze the level of the language's digital presence on the Internet, as well as to provide recommendations for devising an optimal algorithm for building similar systems and web services based on machine learning. The research outcomes are of practical value not only with respect to the Tuvan language but can also be extrapolated to other official languages in the Russian Federation.

AUTONOMY IN THE RUSSIAN FEDERATION: THEORY AND PRACTICE

Article

Kartashkin V.A., Abashidze A.Kh.

International Journal on Minority and Group Rights. Том 10. 2003. С. 203-220

Использование искусственного интеллекта для создания системы машинного перевода и образовательных ресурсов на тувинском языке