Среди всех наблюдаемых природных стихийных бедствий катастрофы, связанные с водой, наиболее частые и несут серьезную опасность для людей и социально-экономического развития. Для России наибольшую актуальность представляют речные паводки, важность борьбы с которыми, в частности на Дальнем Востоке, неоднократно подчеркивал президент РФ В.В. Путин. Изучено качество работы различных методов искусственного интеллекта по предсказанию речных паводков в бассейне реки Амур. Уникальность исследования заключается в том, что прежде подобных изысканий для этой реки не проводилось. Основная задача состояла в последующем практическом применении полученных результатов в системах прогнозирования паводков и управления их риском. С этой целью поиск наилучшего метода выполнялся среди широко используемых на рынке методов, обладающих богатым выбором вспомогательных решений: градиентный бустинг на деревьях, линейная регрессия без регуляризации и нейронные сети. В дизайне исследования сделан упор на достижение максимальной воспроизводимости результатов. В итоге наивысшее качество показал градиентный бустинг над деревьями в отечественной реализации CatBoost. Полученные результаты могут быть экстраполированы и на другие реки, сравнимые как по площади, так и по объему собранных данных.
Among all observed natural disasters, water-related disasters are the most frequent and pose a serious threat to people and socio-economic development. River floods are the most relevant for the Russian Federation, and the importance of flood control, particularly in the Far East, was repeatedly stressed by Russian President Vladimir Putin. The quality of performance of various artificial intelligence methods on the task of predicting river floods in the Amur River basin was investigated. The uniqueness of the research lies in the fact that similar studies have not previously been conducted for this river. The main task of the work was the subsequent practical application of the obtained results in flood forecasting and risk management systems. For this purpose, the best method was searched among widely used methods on the market, which have a rich choice of auxiliary solutions: gradient tree binning, linear regression without regularisation and neural networks. The study design focus on achieving maximum reproducibility of the results. The gradient boosting over the trees in the domestic implementation of CatBoost showed the highest quality. The results of this work can be extrapolated to other rivers comparable in both area and volume of data collected.