Проведено исследование управляемых популяционных моделей с применением машинного обучения с подкреплением. Изучены вопросы синтеза детерминированных и стохастических моделей динамики численности взаимосвязанных видов с учётом внутренних трофических взаимодействий и с учётом управляющих воздействий. Предложена постановка задачи оптимального управления в детерминированном случае. Рассмотрен подход к управлению с учётом мультипликативной зависимости плотности популяций и функций, описывающих внешние воздействия. Проведена оптимизация траекторий детерминированной модели с применением искусственных нейронных сетей. На основе метода построения самосогласованных стохастических моделей построена схема взаимодействия и разработана стохастическая модель популяционной динамики с учётом управляющих воздействий. Предложен подход к созданию алгоритмического обеспечения для программной реализации нейронной сети с учётом введения стохастики. Проведены серии вычислительных экспериментов и изучены качественные эффекты траекторной динамики. Полученные результаты могут найти применение при изучении экологических, социально-экономических и физико-химических процессов.
The research of controlled population models using machine learning with reinforcement is carried out. The synthesis issues of deterministic and stochastic models of interconnected species number dynamics are studied, taking into account internal trophic interactions and taking into account control actions. The formulation of the optimal control problem in the deterministic case is proposed. An approach to control is considered taking into account the multiplicative dependence of populations density and functions describing external influences. The trajectories of the deterministic model are optimized using artificial neural networks. Based on the method of constructing self-consistent stochastic models, an interaction scheme is constructed and a stochastic model of population dynamics is developed taking into account control actions. An approach to the creation of algorithmic support for the software implementation of a neural network is proposed, taking into account the insertion of stochastics. A series of computational experiments are carried out and qualitative effects of trajectory dynamics are studied. The obtained results can be used in the study of ecological, socioeconomic and physico-chemical processes.