ارزیابی عملکرد مدل‌های یادگیری ماشین و الگوریتم‌های بهینه‌سازی در پیش‌بینی دبی جریان رودخانه کشکان

نوع مقاله : پژوهشی


1 دانشگاه یزد

2 گروه آب، دانشکده مهندسی عمران، دانشگاه یزد، یزد، ایران

3 استاد گروه مرتع و آبخیزداری دانشگاه یزد



شبیه‌سازی جریان رودخانه در ایستگاه‌های هیدرومتری به منظور آگاهی از دبی رودخانه در دوره‌های زمانی آینده از مسائل مهمی است که معمولا توسط سری‌های زمانی هیدرولوژیکی مرتبط با همان ایستگاه انجام می‌شود. با توجه به اهمیت موضوع، در این پژوهش، به منظور پیش‌بینی جریان روزانه ایستگاه هیدرومتری پل دختر واقع بر رودخانه کشکان در استان لرستان، داده‌های دبی جریان و بارش مربوط به سال‌های 1350-1397 تهیه شده و از مدل‌های هوشمند سیستم استنتاج فازی عصبی (ANFIS) و سیستم بردار پشتیبان (SVM)، مدل آموزش دیده شبکه عصبی با الگوریتم‌های بهینه‌سازی نهنگ (WOA) و الگوریتم ازدحام ذرات (PSO) استفاده شده است. در این تحقیق، تاثیر سری‌های زمانی جریان، بارش و ترکیبی از این دو پارامتر به عنوان ورودی مدل‌ها و همچنین اثر پارامترهای هر دو مدل‌ مورد بررسی قرار گرفت. به منظور تعیین بهترین ترکیبات ورودی، روش‌های آماری تابع همبستگی خودکار (ACF) و تابع همبستگی خودکار جزئی (PACF) و ضریب همبستگی پیرسون (PCC) بکار گرفته شد. با توجه به نتایج بیشترین همبستگی مربوط به دبی جریان با یک (Q-1)، دو (Q-2) و سه (Q-3) روز تاخیر زمانی (بیش از 5/0) و بارش با یک روز تاخیر (P-1) (بیش از 4/0) در پیش‌بینی دبی جریان روزانه بود. در نهایت، مدل بهینه با توجه به معیارهای ارزیابی مجذور میانگین مربعات خطا (RMSE)، ضریب تبیین (R2) و ضریب نش ساتکلیف (NE) مشخص شد. با توجه به نتایج، در همه مدل‌ها، دبی جریان با یک (Q-1)، دو (Q-2) و سه (Q-3) روز تاخیر زمانی و بارش با یک روز تاخیر (P-1) بیش‌ترین همبستگی را با دبی جریان روزانه داشتند. به‌طور کلی، همه مدل‌ها از دقت قابل قبولی در مدل کردن دبی جریان در آبخیز کشکان برخوردار بودند. بر اساس نتایج به‌دست آمده، مدل ANN-WOA با داشتن بیش‌ترین مقدار R2 برابر با 896/0 و NE برابر با 803/0 و کمترین مقدار RMSE برابر با 0186/0، بالاترین دقت را در پیش‌بینی دبی جریان روزانه دارد. پس از آن، مدل SVM با ساختار تابع کرنل پایه شعاعی و مقادیر C=4، γ=1 و ε=0.001 با داشتن مقدار ضریب تبیین برابر با 895/0، ضریب نش ساتکلیف برابر با 801/0 و مقدار خطای 0187/0 عملکرد بهتری را نشان داد و مدل‌های ANN-PSO و ANN نیز به ترتیب در رده‌های سوم و چهارم قرار گرفتند. نتایج حاکی از آن است که استفاده از الگوریتم‌های بهینه‌سازی فرابتکاری دقت مدل ANN را افزایش داده و می‌توانند برای آموزش شبکه مورد استفاده قرار بگیرند. بررسی ساختارهای مختلف ANFIS نشان داد، به‌طور کلی توابع مثلثی و گوسی توانایی بالاتری در مدل‌سازی دبی جریان منطقه مورد مطالعه دارند. با این حال، این مدل با داشتن مقادیر R2=0.88، NE=0.76 و RMSE=0.023 خطای بیش‌تری در مقایسه با سایر مدل‌ها دارد.



عنوان مقاله [English]

Evaluation of the performance of machine learning models and optimization algorithms in predicting flow discharge of Kashkan River

نویسندگان [English]

  • fatemeh Avazpour 1
  • Mohammad Reza Hadian 2
  • Ali Talebi 3
1 yazd university
2 Department of Civil Engineering, Yazd University, Yazd
3 Department of Natural Resources and Desertology, Yazd University
چکیده [English]

In this study, the efficacy of several AI models, including the fuzzy-neural adaptive inference system (ANFIS), support vector machine (SVM), artificial neural network (ANN), as well as hybrid models integrating ANN with optimization algorithms such as whale optimization algorithm (ANN-WOA) and particle swarm optimization algorithm (ANN-PSO), has been evaluated for predicting the daily flow discharge of the Poldokhtar station, situated at the outlet of the Kashkan basin. The research aims to assess the performance of different AI models and optimization algorithms in daily flow discharge prediction, while also identifying optimal input parameters. By comparing the performance of these models, researchers can gain insights into which AI approaches are most effective for river flow prediction tasks. Additionally, determining the optimal input parameters can further enhance the accuracy and reliability of flow discharge forecasts, contributing to improved water resource management and decision-making processes.The use of ACF and PACF analyses revealed notable correlations in the context of daily flow and precipitation patterns. Specifically, the daily flow exhibited its strongest correlations with lag times of one day (Q-1), two days (Q-2), and three days (Q-3). Additionally, precipitation showed a significant correlation when lagged by one day (P-1). The results showed that all models have an acceptable ability in predicting the flow. The findings reveal that across all models, variables such as flow rate with one (Q-1), two (Q-2), and three (Q-3) days delay, along with precipitation with a one-day delay (P-1), exhibited the strongest correlation with daily flow rate in the Kashkan watershed. Overall, the models demonstrated acceptable accuracy in flow rate modeling. Among them, the ANN-WOA model stood out with the highest accuracy, boasting an R2 value of 0.896, NE of 0.803, and the lowest RMSE of 0.0186. Following closely, the SVM model, employing a radial base kernel function structure with parameter values of C=4, γ=1, and ε=0.001, showcased commendable performance. It yielded an explanation coefficient of 0.895, Nash Sutcliffe coefficient of 0.801, and an error value of 0.0187. The ANN-PSO and ANN models secured third and fourth positions, respectively. The integration of meta-engineering optimization algorithms notably enhanced the ANN model's accuracy, making it viable for network traininging. Furthermore, the exploration of various ANFIS structures revealed that triangular and Gaussian functions generally exhibited superior capabilities in modeling flow rate within the study area. However, despite its competence, the ANFIS model yielded slightly higher errors compared to other models, with an R2 of 0.88, NE of 0.76, and RMSE of 0.023.

کلیدواژه‌ها [English]

  • Kashkan watershed
  • particle swarm algorithm
  • whale algorithm
  • precipitation
  • flow rate
  • artificial intelligence

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از تاریخ 31 خرداد 1403
  • تاریخ دریافت: 16 اسفند 1402
  • تاریخ بازنگری: 20 اردیبهشت 1403
  • تاریخ پذیرش: 31 خرداد 1403