پیش‌بینی و مدل‌سازی نرخ فرسایش خاک با استفاده از الگوریتم‌های یادگیری ماشین در شهرستان‌های مراوه تپه و کلاله استان گلستان

نوع مقاله : پژوهشی

نویسندگان

1 محقق پسادکتری گروه مدیریت مناطق خشک و بیابانی، دانشکده منابع طبیعی و محیط زیست، دانشگاه فردوسی، مشهد، ایران

2 استادیار بخش مهندسی منابع طبیعی و محیط زیست، دانشکده کشاورزی، دانشگاه شیراز، شیراز، ایران

3 دانشیار گروه مدیریت مناطق خشک و بیابانی، دانشکده منابع طبیعی و محیط زیست، دانشگاه فردوسی مشهد، مشهد، ایران

4 دانشجوی دکتری گروه مهندسی آب، دانشکده کشاورزی، دانشگاه شهرکرد، شهرکرد، ایران

5 استادیار گروه مهندسی طبیعت، دانشکده علوم محیطی و توسعه پایدار، دانشگاه سراوان، سراوان، ایران

10.22092/wmrj.2025.371189.1641

چکیده

مقدمه و هدف
فرسایش آبی یکی از چالش‌های مهم زیست‌محیطی در سراسر جهان است که منجر به نابودی خاک، کاهش حاصلخیزی و افزایش رسوب­دهی در رود‌ها می‌شود. استان گلستان، به­ویژه مناطق شمالی آن با خاک‌های حساس لسی و شرایط اقلیمی خاص، یکی از کانون‌های اصلی فرسایش در ایران به‌شمار می‌آید. موضوع بررسی‌شده، ضعف روش‌های سنتی در ارائه پهنه‌بندی دقیق، سریع و قابل اطمینان برای فرسایش آبی در مناطق حساس استان گلستان است؛ جایی که روابط پیچیده و غیرخطی میان عامل‌های محیطی نیازمند رویکردهای پیشرفته‌تر است. الگوریتم‌های یادگیری ماشین به‌دلیل قابلیت مدل‌سازی روابط پیچیده و غیرخطی میان متغیرها، ابزار قدرتمندی برای پیش‌بینی مکانی پدیده‌هایی مانند فرسایش به‌شمار می‌آیند. هدف این پژوهش، مدل‌سازی مکانی فرسایش آبی در شهرستان‌های مراوه‌تپه و کلاله با استفاده از الگوریتم‌های پیشرفته یادگیری ماشین و مقایسه کارایی آن‌ها با یک مدل ترکیبی (Ensemble) بود.
مواد و روش‌ها
منطقه مطالعه‌شده زمین‌های شمالی استان گلستان با مساحت 4944.5 کیلومتر­مربع بود که به‌دلیل پستی‌بلندی شیب‌دار، بارندگی‌های فصلی و خاک‌های لسی، مستعد فرسایش آبی است. ازاین‌رو، ابتدا لایه‌های اطلاعات مربوط به عامل‌های مؤثر بر فرسایش تهیه شد. این عامل‌ها 8 شاخص محیط زیستی و اقلیمی شامل شاخص بارش (داده‌های ایستگاهی)، شاخص پوشش گیاهی (NDVI)، شاخص بافت سطحی خاک (TGSI)، لایه کاربری زمین‌، شاخص رطوبت سطحی (NDMI)، مدل ارتفاعی رقومی (DEM)، شاخص خاک لخت (BI) و شاخص شوری خاک (NDSI) بودند که همگی از تصویرهای ماهواره‌ای لندست 8 استخراج شدند. نقشه موقعیت فرسایش‌های مشاهده‌شده به­عنوان لایه وابسته در مدل‌سازی استفاده شد. بر این اساس در بازدید میدانی 100 نقطه (50 نقطه از فرسایش آبی و 50 نقطه از نبودن آن) برداشت شد. در این پژوهش، از 70% داده‌ها برای آموزش و از 30% آن برای آزمون استفاده شد. سه الگوریتم یادگیری ماشین شامل جنگل تصادفی (RF)، ماشین بردار پشتیبانی (SVM) و وایازی درختی تقویت‌شده (BRT) برای آموزش مدل به‌کار گرفته شدند. سرانجام، یک مدل ترکیبی (Ensemble) بر اساس میانگین وزنی خروجی از هر یک از این سه مدل ساخته شد تا دقت پیش‌بینی افزایش یابد. عملکرد مدل‌ها با استفاده از شاخص‌های آماری ضریب کاپا، منحنی مشخصه عملکرد گیرنده و شاخص آماری تسیل ارزیابی شد.
نتایج و بحث
نتایج ارزیابی نشان داد که عملکرد هر یک از سه مدل به‌طور جداگانه RF، SVM و BRT در مدل‌سازی فرسایش آبی قابل قبول بود، اما عملکرد مدل ترکیبی (0/90Kappa=، 0/93 ROC=و 0/89TSS =) با بهره‌گیری از نقاط قوت هر یک از سه مدل نامبرده، در تفکیک دقیق پهنه‌های مستعد به فرسایش از پهنه‌های پایدار و کاهش خطاهای طبقه‌بندی برتر بود. این برتری مؤید آن است که در مدل ترکیبی (Ensemble) با میانگین‌گیری وزنی، می‌توان نبودن قطعیت‌ها را مؤثرتر از هر یک از مدل‌ها به‌طور جداگانه مدیریت کرد و یک خروجی پایدار و قابل اطمینان به‌دست آورد. نقشه پتانسیل فرسایش نهایی تولیدشده به‌وسیلة این مدل دقیق بود و به­وضوح نشان داد که مناطق شمالی، غربی و جنوب‌غربی منطقه ­مطالعه‌شده کانون‌های اصلی فرسایش آبی هستند. این الگوی مکانی صرفاً تصادفی نبوده، بلکه ریشه در تعامل پیچیده عامل‌ها دارد؛ در این مناطق با پستی‌بلندی شیب‌دار، سرعت جریان آب و قدرت فرسایندگی آن افزایش یافته و هم­زمان با دریافت بارندگی‌های بیشتر انرژی لازم برای فرآیند فرسایش فراهم می‌آید و پوشش گیاهی که به­عنوان سد دفاعی اولیه خاک عمل می‌کند، ضعیف‌ است. با تحلیل اهمیت متغیرها نیز مشخص شد بارش به­عنوان عامل محرک و شاخص پوشش گیاهی (NDVI) به­عنوان عامل مقاوم، به‌ترتیب مهم‌ترین مهار‌کنندگان فرسایش در این منطقه است. این یافته بیانگر آن است که با هرگونه اقدام حفاظتی که بتوان پوشش گیاهی را بهبود بخشید (مانند کاشت، مدیریت چرای دام و جلوگیری از نابودی)، می‌توان به­طور مستقیم اثرات ویرانگر باران را خنثی کرد. این اقدام مؤثرترین راهکار برای مهار فرسایش در مناطق حساس است. ازاین‌رو، نتایج این پژوهش هم یک نقشه دقیق ارائه داد و هم یک چارچوب علمی برای اولویت‌بندی و اجرای اقدامات مدیریتی مبتنی بر شواهد فراهم آورد.
نتیجه‌گیری و پیشنهادها
برتری مدل ترکیبی در این پژوهش، بیانگر قابلیت اطمینان زیاد رویکردهای مبتنی بر میانگین‌گیری وزنی در کاهش خطا و افزایش دقت پیش‌بینی بود. استعداد مناطق پرخطر در بخش‌های شیب‌دار و با پوشش گیاهی کم، با اصول فیزیک فرسایش کاملاً سازگار است. اهمیت زیاد بارش و پوشش گیاهی مؤید آن است که مدیریت پایدار زمین، از جمله اجرای عملیات زیستی (مانند کاشت گونه‌های مقاوم و با ریشه‌های ژرف) مؤثرترین راهکار برای مهار فرسایش در منطقه بوده و بر پایة گزارش‌های علمی ۳۰ تا ۵۰% از رواناب سطحی و فرسایش را کاهش می‌دهد. تصمیم‌گیرندگان، مدیران منابع‌طبیعی و برنامه‌ریزان شهری و روستایی از نقشه فرسایش تولیدشده در این پژوهش می‌توانند به­عنوان یک ابزار علمی و کاربردی برای اولویت‌بندی اقدامات حفاظتی و تخصیص بهینه منابع، بهره‌گیرند. بر پایة نتایج این پژوهش، پیشنهاد می‌شود در پژوهش‌های آینده با در نظر گرفتن محدودیت‌ها (مانند تفکیک مکانی برخی داده‌ها) از مدل‌های ترکیبی پیشرفته‌تر و داده‌هایی با دقت بیشتر استفاده شود.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Prediction and Modeling of Soil Erosion Rates Using Machine Learning Algorithms in Maraveh Tappeh and Kalaleh Counties, Golestan Province

نویسندگان [English]

  • Abdolhossein Boali 1
  • Narges Kariminejad 2
  • Morteza Akbari 3
  • Maryam Yaghoobi 4
  • Mohsen Farahi 5
1 Postdoctoral Researcher, Department of Desert and Arid Zones Management, Faculty of Natural Resources and Environment, Ferdowsi University of Mashhad, Mashhad, Iran
2 Assistant Professor, Department of Natural Resources and Environmental Engineering, College of Agriculture, Shiraz University, Shiraz, Iran
3 Associate Professor, Department of Desert and Arid Zones Management, Faculty of Natural Resources and Environment, Ferdowsi University of Mashhad, Mashhad, Iran
4 PhD Student, Department of Water Engineering, Faculty of Agriculture, Shahrekord University, Shahrekord, Iran
5 Assistant Professor, Department of Natural Engineering, Faculty of Environmental Sciences and Sustainable Development, University of Saravan, Saravan, Iran
چکیده [English]

Introduction and Goal
Water erosion is one of the major environmental hazards worldwide, leading to soil degradation, reduced fertility, and increased sedimentation in rivers. Golestan Province, particularly its northern regions with sensitive loess soils and specific climatic conditions, is considered one of the main erosion hotspots in Iran. The investigated issue is the limitation of traditional methods in providing accurate, rapid, and reliable zoning of water erosion in the sensitive regions of Golestan Province, where complex and nonlinear relationships among environmental factors require more advanced approaches. Machine learning (ML) algorithms, due to their ability to model complex and non-linear relationships between variables, are powerful tools for the spatial prediction of phenomena such as erosion. The objective of this study was to model the spatial potential of water erosion in the Maraveh Tappeh and Kalaleh counties using advanced machine learning algorithms and to compare their performance with an ensemble model.
Materials and Methods
The study area covers the northern lands of Golestan Province, with an area of approximately 4944.5 km², which is susceptible to water erosion due to its steep topography, seasonal rainfall, and loess soils. Therefore, first, layers of informational of factors affecting erosion were first prepared. These factors included eight environmental and climatic indices: Precipitation Index (station data), Vegetation Index (NDVI), Topographic Grain Size Index (TGSI), Land Use layer, Normalized Difference Moisture Index (NDMI), Digital Elevation Model (DEM), Bare Soil Index (BI), and Normalized Difference Salinity Index (NDSI), all of which were extracted from Landsat 8 satellite imagery. A map of observed erosion locations was used as the dependent variable layer in the modeling. Accordingly, 100 points (50 points of water erosion and 50 points of its absence) were taken during the field visit. In this study, 70% of the data was used for training and 30% for testing. Three machine learning algorithms Random Forest (RF), Support Vector Machine (SVM), and Boosted Regression Trees (BRT) were employed to train the models. Finally, an ensemble model was developed based on the weighted average of the outputs of these three individual models to enhance prediction accuracy. The performance of the models was evaluated using statistical indices, including the Kappa coefficient, Receiver Operating Characteristic (ROC) curve, and True Skill Statistic (TSS).
Results and Discussion
The evaluation results indicated that the performance of each of the three individual models (RF, SVM, and BRT) in modeling water erosion was acceptable, however, the ensemble model (Kappa=0.90, ROC=0.93, and TSS=0.89), by leveraging the strengths of all three models, demonstrated superior performance in accurately distinguish erosion-prone from stable zones and in reducing classification errors. This superiority confirms that the ensemble approach, using weighted averaging, uncertainties can be managed more effectively than in any individual model, resulting in a more stable, reliable output. The final erosion potential map, generated by this model was clearly identified that the northern, western, and southwestern parts of the study area are the main hotspots for water erosion. This spatial pattern is not random but is rooted in the complex interaction of factors; in these areas have steep topography, which increases water flow velocity and its erosive power, receive higher rainfall, providing the necessary energy for the erosion process, and possess weaker vegetation cover, which acts as the soil's primary defense. Analysis of variable importance also revealed that precipitation as a driving factor and the Vegetation Index (NDVI) as the resisting factor, are respectively the most influential controls on erosion in the region. This finding indicates that any conservation measure that improve vegetation cover (such as planting, grazing management, and preventing degradation) can directly neutralize the destructive effects of rainfall. This approach is the most effective strategy for controlling erosion in sensitive areas. Therefore, the results of this study not only provide an accurate map but also offer a scientific framework for prioritizing and implementing evidence-based management actions.
Conclusion and Suggestions
The superiority of the ensemble model in this research demonstrates the high reliability of weighted averaging approaches in reducing error and enhancing prediction accuracy. The concentration of high-risk areas in steep slopes with low vegetation cover is fully consistent with the principles of erosion physics. The high importance of precipitation and vegetation cover emphasizes that sustainable land management, such as implementing biological operations (such as planting resistant and deep-rooted species) is the most effective strategy for erosion control in the region, and according to scientific reports, can reduce surface runoff and erosion by 30–50%. Decision-makers, natural resource managers, and urban and rural planners can use the erosion potential map produced in this study as a practical scientific tool for prioritizing conservation measures and optimize resource allocation. Based on the results of this study, it is recommended that future research, while considering existing limitations (such as the spatial resolution of some datasets), make use of more advanced ensemble models and higher-accuracy data.

کلیدواژه‌ها [English]

  • Modeling
  • machine learning methods
  • northern Golestan Province
  • water erosion
Akbari M, Ownegh M, Asgari HR, Sadoddin A, Khosravi H. 2016. Desertification risk assessment and management program. Global Journal of Environmental Science and Management. 2(4):365–380. https://doi.org/10.22034/gjesm.2016.02.04.006
Akbari M, Modarres R, Alizadeh Noughani M. 2020. Assessing early warning for desertification hazard based on E-SMART indicators in arid regions of northeastern Iran, Journal of Arid Environments. Elsevier, 174:104086. https://doi.org/10.1016/j.jaridenv.2019.104086.
Alqadhi S, Mallick J, Talukdar S, Alkahtani M. 2023. An artificial intelligence-based assessment of soil erosion probability indices and contributing factors in the Abha-Khamis watershed, Saudi Arabia. Frontiers in Ecology and Evolution. 11: p. 1189184. https://doi: 10.3389/fevo.2023.1189184
Arab Khadri H. 2021. The status of water erosion and sediment yield in Iran: A statistical and comparative analysis. Strategic Research in Agricultural Sciences and Natural Resources, 6(2): 139–156. ( In Persian).
Allouche O, Tsoar A, Kadmon R. 2006. Assessing the accuracy of species distribution models: Prevalence, kappa and the true skill statistic (TSS). Journal of Applied Ecology. 43(6):1223–1232. https://doi.org/10.1111/j.1365-2664.2006.01214.x
Bashari H, Boali A, Soltani S. 2023. Accommodating uncertainty in soil erosion risk assessment: Integration of Bayesian belief networks and MPSIAC model. Natural Hazards Research. 1(4): 134 – 147. https://doi.org/10.1016/j.nhres.2023.09.009
Belgiu M, Drăgu L. 2016. Random forest in remote sensing: A review of applications and future directions. ISPRS Journal of Photogrammetry and Remote Sensing. 114: 24-31. https://doi.org/10.1016/j.isprsjprs.2016.01.011
Boali A, Asgari H. R, Mohammadian Behbahani A, Salmanmahiny A, Naimi B. 2024. Remote sensing applications: Society and environment remotely sensed desertification modeling using ensemble of machine learning algorithms. Remote Sensing Applications: Society and Environment. 34(14): 1–16. https://doi.org/ 10.1016/j.rsase.2024.101149
Boali A, Kariminejad N, Hosseinalizadeh M. 2024. Enhancing wind erosion risk assessment through remote sensing techniques. Plos one. 19(10): e0308854. https://doi.org/10.1371/journal.pone.0308854
Boali A, Hosseinalizadeh M, Kariminejad N, Asgari HR, Behbahani AM, Naimi B, Shafaie V, Rad MM. 2025. Evaluation of early warning signals for soil erosion using remote sensing indices in northeastern Iran. Scientific Reports. 15 (9742):1–13. https://doi.org/10.1038/s41598-025-94926-x
Bofana J, Zhang M, Nabil M, Wu B, Tian F, Liu W, Moyo C. 2020. Comparison of different cropland classification methods under diversified agroecological conditions in the Zambezi River Basin. Remote Sensing. 12(13): p. 2096. https://doi.org/10.3390/rs12132096
Devkota KC, Regmi AD, Pourghasemi HR, Yoshida K, Pradhan B, Ryu IC, Althuwaynee OF. 2013. Landslide susceptibility mapping using certainty factor, index of entropy and logistic regression models in GIS and their comparison at Mugling-Narayanghat road section in Nepal Himalaya. Natural Hazards. 65(1): 135–165. https://doi.org/10.1007/s11069-012-0347-6
Jalali Fard A, Hosseinalizadeh M, Kamaki Choghi B, Azim Mohseni M. 2018. Modeling of piping erosion in loess lands. Environmental Erosion Research. 8(4): 1–18. (In Persian).
Jafar Ardakani A, Bayat R, Piran HR, Shariat Jafari M. 2009. Investigation of erosion and sedimentation status in the loess deposits of Golestan province. Paper presented at the 6th Iranian Conference on Engineering Geology and Environment, Tehran, Iran. (In Persian).
Jahani M, Taleghani S, Akbari, M. 2024.  Quantitative evaluation of soil erodibility potential using SLEMSA model (Case study:  Karkheh watershed, Lorestan province, Environmental Erosion Research Journal. 14 (2):161-179. https://doi.org/10.61186/jeer.14.2.10
Memarian H, Abdi Bastami S, Akbari M, Tajbakhsh SM, Azamirad M. 2023. An integrative approach of the physical-based stability index mapping with the maximum entropy stochastic model for risk analysis of mass movements. Environment, Development and Sustainability. 25: 2808–2830. https://doi.org/10.1007/s10668-022-02165-1
Memarian H. Akbari M. 2021. Prediction of combined effect of climate and land use changes on soil erosion in Iran using GloSEM data. Journal of Ecohydrology. 8(2): 513-534. https://doi.org/10.22059/ije.2021.320754.1482. (In Persian).
Mohamadifar A, Gholami H. 2021. Assessment of the interpretability of data mining for the spatial modelling of water erosion using game theory. Catena, 20(10): 51-78). https://doi.org/10.1016/j.catena.2021.105178
Najafi Nia M, Khoramali F, Kiani F, Motlagh MB. 2018. Micromorphology of early Pleistocene loess soils and their comparison with modern loesses. Journal of Agronomy Engineering. 41(4):67–82. (In Persian). https://doi.org/10.22055/agen.2018.22565.1360
Park S, Jungho I, Jang E, Rhee J. 2016. Drought assessment and monitoring through blending of multi-sensor indices using machine learning approaches for different climate regions. Agricultural and Forest Meteorology. 216: 157–169. https://doi.org/10.1016/j.agrformet.2015.10.011
Piri H, Mobaraki M. 2022. Comparison of artificial intelligence and geostatistical methods in soil surface salinity prediction in Ghorghori, Hirmand. Journal of Environmental and Water Engineering. 8(3):622–635. (In Persian). https://doi.org/10.22034/jewe.2022.312194.1656
Raee B, Ahmadi A, Neyshabouri M, Ghorbani M, Asadzadeh F. 2020. Assessment of the efficiency of some artificial intelligence methods in modeling soil wind erodibility in a part of the eastern lands of Urmia Lake. Iranian Journal of Water and Soil Research. 51(1): 61–76. (In Persian). https://doi.org/10.22059/ijswr.2019.283359.668233
Ren Z, Liu C, Zhao X, Jin Y, Ou Y, Liu R, Cheng H. 2024. A large-scale riverbank erosion risk assessment model integrating multi-source data and explainable artificial intelligence (XAI). Ecological Indicators. 166: p. 112575. https://doi.org/10.1016/j.ecolind.2024.112575
Tang X, Li J, Liu M, Liu W, Hong H. 2020. Flood susceptibility assessment based on a novel random Naïve Bayes method: A comparison between different factor discretization methods. Catena, 190. p. 104536. https://doi.org/10.1016/j.catena.2020.104536
Vapnik VN. 1995. The Nature of Statistical Learning Theory. The Nature of Statistical Learning Theory. https://doi.org/10.1007/978-1-4757-2440-0
Wijitkosum S. 2020. Factor influencing land degradation sensitivity and desertification in a drought prone watershed in Thailand. International Soil and Water Conservation Research. 9(2):217-228. https://doi.org/10.1016/j.iswcr.2020.10.005
Yang X, Yang Q, Zhu H, Wang L, Wang C, Pang G, Hussain S. 2023. Quantitative Evaluation of Soil Water and Wind Erosion Rates in Pakistan. Remote Sensing. 15(9): 1–23. https://doi.org/10.3390/rs15092404