نشریه علمی پژوهشی مهندسی آبیاری و آب ایران

نشریه علمی پژوهشی مهندسی آبیاری و آب ایران

مدل جنگل تصادفی چندهدفه برای پیش‌بینی جریان رودخانه با بهبود انتخاب ویژگی مبتنی بر الگوریتم ژنتیک

نوع مقاله : مقاله پژوهشی

نویسندگان
1 گروه مهندسی آب، دانشکده کشاورزی، دانشگاه لرستان، خرم آباد، ایران
2 گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه لرستان، خرم آباد، ایران
10.22125/iwe.2026.556636.1906
چکیده
مطالعه حاضر به توسعه و ارزیابی مدل پیش‌بینی جریان رودخانه در حوضه آبریز کشکان پرداخته است. هدف اصلی پژوهش، بهبود دقت پیش‌بینی دبی جریان در ایستگاه‌های هیدرومتری کشکان-افرینه و کشکان-پلدختر با استفاده از مدل جنگل تصادفی و انتخاب ویژگی‌های موثر از طریق الگوریتم ژنتیک، همراه با اعتبارسنجی متقاطع k بخشی است. داده‌های مورد استفاده شامل مشاهدات سه ایستگاه هیدرومتری و نه ایستگاه هواشناسی می‌باشد. مدل جنگل تصادفی با میانگین‌گیری از پیش‌بینی‌های مجموعه‌ای از درختان تصمیم، قادر به شناسایی الگوهای پیچیده، روابط غیرخطی و جلوگیری از بیش‌برازش است. نتایج نشان داد برخی ورودی‌ها مانند دبی ایستگاه کاکارضا همبستگی بسیار بالایی (97/0) با متغیر هدف دارند که نقش کلیدی در افزایش دقت مدل داشته و حذف آن‌ها منجر به کاهش قابل توجه عملکرد مدل شد. در سناریوی استفاده از تمام ویژگی‌ها، R2 برای ایستگاه کشکان-پلدختر و کشکان-افرینه به ترتیب 91/0 و 95/0 به‌دست آمد که بیانگر قدرت تعمیم‌پذیری مناسب مدل است. خطاهای پیش‌بینی دارای میانگین نزدیک به صفر و انحراف معیار پایین بودند و پراکندگی خطاها حدود صفر بود.

حذف داده دبی کاکارضا باعث کاهش همبستگی ورودی‌ها به حدود 64/0 و افت محسوس عملکرد مدل شد به طوری‌که R² برای کشکان-پلدختر به 72/0 و کشکان-افرینه به 73/0 رسید در حالی‌که مقادیر RMSE و MSE به‌طور قابل توجهی افزایش یافتند. این یافته‌ها اهمیت انتخاب دقیق ویژگی‌ها و بهره‌گیری از ایستگاه‌های کلیدی هیدرومتری را نشان داده و ترکیب RF با انتخاب ویژگی‌های موثر و اعتبارسنجی متقاطع k بخشی را به‌عنوان روشی کارآمد برای پیش‌بینی در حوضه‌های داده محدود تایید می‌کند.
کلیدواژه‌ها
موضوعات

عنوان مقاله English

A Multi-Target Random Forest Model for River Flow Forecasting Enhanced by Genetic Algorithm-Based Feature Selection

نویسندگان English

Maryam Mirbeyk Sabzevari 1
Hassan Torabi podeh 1
Mohammad Bagher Dowlatshahi 2
Amir Hamzeh Haghiabi 1
Abbas Maleki 1
1 , Department of Water Engineering, Faculty of Agriculture, Lorestan University, Khorramaad, Iran
2 Department of Computer Engineering, Faculty of Engineering, Lorestan University,Khorramabad, Iran
چکیده English

This study develops and evaluates a river flow prediction model in the Kashkan River Basin. The main objective is to improve streamflow prediction accuracy at the Kashkan-Afrine and Kashkan-Poldokhtar hydrometric stations using the Random Forest model, combined with effective feature selection via a Genetic Algorithm and k-fold cross validation. The dataset includes observations from three hydrometric and nine meteorological stations.

The RF model, by averaging predictions from an ensemble of decision trees, can identify complex patterns, capture nonlinear relationships, and prevent overfitting. Results showed that some input variables, such as the discharge at the Kakareza station, had a very high correlation (0.97) with the target variable, playing a key role in improving model accuracy. Removing these inputs caused a notable decline in performance. When all features were used, the coefficient of determination (R²) for the Kashkan-Poldokhtar and Kashkan-Afrine stations was 0.91 and 0.95, respectively, indicating strong generalization capability. Prediction errors had means close to zero, low standard deviations, and residuals distributed around zero. Excluding the Kakareza discharge data reduced the input correlation to about 0.64 and led to a noticeable performance drop, with R² decreasing to 0.72 for Kashkan-Poldokhtar and 0.73 for Kashkan-Afrine, while RMSE and MSE increased significantly. These findings highlight the importance of accurate feature selection and the inclusion of key hydrometric stations. Overall, integrating the RF model with effective feature selection and k-fold cross-validation provides an efficient approach for streamflow prediction in data-scarce basins.

کلیدواژه‌ها English

Feature Selection
Flow Forecasting
Genetic Algorithm
Hydrological Modeling
Multi-Target Random Forest

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از 16 خرداد 1405