Картирование восприимчивости к оползням (LSM) является важнейшим компонентом оценки геологических опасностей и управления рисками для стратегий предотвращения и смягчения последствий стихийных бедствий. Однако неполные наборы данных об оползнях, дефицит и дисбаланс данных об оползнях, а также точность картирования восприимчивости являются сложными проблемами, которые были решены с помощью различных новых методов в этом исследовании. Нашей целью было разработать всеобъемлющий кадастр оползней, создать синтетические данные и использовать машинное обучение для гибридного моделирования. Методология была реализована в три этапа. На первом этапе для разработки кадастра оползней применялись методы малого базового подмножества (SBAS) и интерферометрии постоянных рассеивателей (PSInSAR). На втором этапе условная генеративно-состязательная сеть с двойным дискриминатором (DDCGAN) была обучена на реальных данных об оползнях для создания синтетических выборок, напоминающих исходные данные. На заключительном этапе гибридная ансамблевая модель машинного обучения (HBEM), объединяющая XGBoost, AdaBoost и LogitBoost, была обучена на расширенном наборе данных для прогнозирования восприимчивости к оползням вдоль дороги Гилгит-Скарду на севере Пакистана. В ходе исследования была составлена пространственная база данных с 12 предрасполагающими параметрами и 152 картированными оползнями, коррелированно проанализированными с использованием подхода отношения частот. SBAS InSAR обнаружил 76 оползней, 38 с помощью PSInSAR, и нанес на карту 38 дополнительных быстрых камнепадов и оползней, вызванных дождями, с использованием изображений высокого разрешения, подтвержденных историческими данными. Модель случайного леса (RF) с точностью 0,986 сравнивалась с HBEM. Наша модель с 400 синтетическими образцами из DDCGAN достигла AUC 0,996, заложив основу для будущих систем раннего оповещения для снижения рисков и обеспечения общественной безопасности.
Landslide susceptibility mapping (LSM) is a critical component in geohazard assessment and risk management for disaster prevention and mitigation strategies. However, incomplete landslide datasets, landslide data scarcity and imbalance, and the accuracy of susceptibility mapping are challenging problems that were tackled via different novel techniques in this study. We aimed to develop a comprehensive landslide inventory, generate synthetic data, and employ machine learning for hybrid modeling. The methodology was implemented in three phases. The Small Baseline Subset (SBAS) and Persistent Scatterer Interferometry (PSInSAR) techniques were applied to design landslide inventory in the first phase. Secondly, the Dual Discriminator Conditional Generative Adversarial Network (DDCGAN) was trained on real landslide data to produce synthetic samples resembling the original data. In the final phase, a Hybrid Ensemble Machine Learning Model (HBEM) combining XGBoost, AdaBoost, and LogitBoost was trained on an enhanced dataset to forecast landslide susceptibility along the Gilgit-Skardu road in Northern Pakistan. The study compiled a spatial database with 12 predisposing parameters and 152 mapped landslides, correlatedly analyzed using a frequency ratio approach. The SBAS InSAR detected 76 landslides, 38 with PSInSAR, and mapped 38 additional rapid rockfalls and rainfall-induced landslides using high-resolution imagery, validated against historical data. The Random Forest (RF) model, with an accuracy of 0.986, was compared to HBEM. Our model, with 400 synthetic samples from DDCGAN, achieved a 0.996 AUC, laying the groundwork for future early warning systems to reduce risks and safeguard public safety.