تعیین پتانسیل سیل با استفاده از مدل‌های یادگیری ماشین CART، GLM و GAM (مطالعه موردی: حوضه کشکان)

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشیار، دانشکده علوم و فنون نوین، دانشگاه تهران

2 عضو هیئت علمی گروه مهندسی آب ، دانشکده کشاورزی دانشگاه لرستان

3 دکتری آبخیزداری- دانشگاه لرستان

4 دانشجوی دکتریسازه های آبی دانشگاه لرستان

5 دانشجوی دکتری سازه های آبی دانشگاه لرستان

چکیده

سیل پدیده‌ای است که موجب آسیب‌های زیست­محیطی و اقتصادی-اجتماعی بسیاری می‌شود. هدف از این پژوهش، ارزیابی کارایی مدل‌های یادگیری ماشین CART، GLM و GAM در شناسایی مناطق حساس به خطر سیلاب در حوضه کشکان است. استان لرستان و به­ویژه حوضه کشکان شامل: سلسله، دلفان، دوره، خرم­آباد، پلدختر و کوهدشت، سیل­خیز است و دفعات بسیاری دچار خسارات ناشی از سیل شده است و در فروردین 1398، بزرگ‌ترین سیل 200 سال اخیر را تجربه کرده است؛ در همین راستا از عوامل مختلف شامل: ارتفاع، جهت شیب، انحنای زمین، درصد شیب، فاصله از رودخانه، تراکم زهکشی، خاک، سنگ­شناسی، کاربری اراضی و شاخص رطوبت توپوگرافی استفاده شد. نقشه رقومی تمام عوامل نام­برده در نرم­افزار ArcGIS10.5 و در قالب پایگاه داده تهیه شد. موقعیت 123 واقعه سیل ثبت­شده در سال­های اخیر در این حوضه، جمع­آوری و به‌صورت تصادفی در دو دسته آموزش مدل (86 واقعه) و اعتبار­سنجی مدل (37 واقعه) در مدل‌سازی‌ها استفاده شد. با استفاده از مدل‌های یادگیری ماشین و عوامل مؤثر محیطی، نقشه‌های پیش­بینی پتانسیل سیل تهیه شدند و سپس با استفاده از روش‌های منحنی مشخصه AUC و شاخص TSS اعتبار­­سنجی شدند. نتایج حاصل از اعتبارسنجی مدل‌ها نشان داد که مدل‌ یادگیری ماشین CART با 91/0AUC= و شاخص 88/0TSS= دقیق‌ترین مدل در پیش‌بینی پتانسیل خطر سیل بوده و پس ‌از آن مدل GAM با 87/0AUC= و شاخص 84/0 TSS=و مدل GLM با 83/0AUC= و شاخص 88/0 TSS=قرار دارند. دقت 91/0 مدل CART نشان­دهنده دقت عالی این مدل برای حوضه کشکان است. این مدل، مساحت بیشتری از حوضه را تحت شرایط پتانسیل بالا و متوسط خطر سیل­گیری نشان می­دهد که اغلب مناطق غربی و همچنین مناطق مرکزی حوضه (کوهدشت، خرم­آباد و پلدختر) را شامل می­شوند که دقیقاً بخش­هایی از همین مناطق در سیل بزرگ سال 98 هم زیر آب رفتند و لازم است در اولویت اول برنامه‌ریزی و مدیریت ریسک سیل قرار گیرند.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Determination of Flood potential Using CART, GLM and GAM Machine learning Models

نویسندگان [English]

  • Hossein Yousefi 1
  • Hojjat allah Yonesi 2
  • Davoud Davoudimoghadam 3
  • Azadeh Arshia 4
  • Zahra Shamsi 5
1 Associate Professor, Faculty of New Sciences and Technologies, University of Tehran
2 water Eng. agriculture faculty of lorestan university
3 lu
4 LU
5 lu
چکیده [English]

Flood is a phenomenon that causes a lot of environmental and socio-economic damage. The purpose of this study is to evaluate the efficiency of CART, GLM and GAM machine learning models in identifying flood risk areas in the Kashkan basin. Lorestan province and especially Kashkan basin, including: Selseleh, Delfan, Doreh, Khorramabad, Poldakhtar and Kuhdasht, is flooded and has suffered flood damage many times and in April 2019, experienced the largest flood of the last 200 years. In this regard, various factors including: height, slope direction, land curvature, slope percentage, distance from the river, drainage density, soil, lithology, land use and topographic moisture index were used. The digital map of all the mentioned factors was prepared in ArcGIS10.5 software and in the form of a database. The location of 123 flood events recorded in recent years in this basin was collected and randomly used in two categories of model training (86 cases) and model validation (37 cases) in modeling. Using machine learning models and environmental factors, flood potential prediction maps were prepared and then validated using AUC characteristic curve methods and TSS index. The results of model validation showed that CART machine learning model with AUC = 0.91 and TTS = 0.88 index was the most accurate model in predicting flood risk potential, followed by GAM model with AUC = 0.87 and TSS index = 0.84 and GLM model with AUC = 0.83 and TSS index = 0.88. Accuracy 0.91 CART model indicates the excellent accuracy of this model for the Kashkan basin. This model shows a larger area of ​​the basin under high potential and moderate flood risk conditions, which include most of the western areas as well as the central areas of the basin (Kuhdasht, Khorramabad and Poldakhtar), which are exactly parts The same areas were flooded in the great flood of 2019 and it is necessary to be in the first priority of flood risk planning and management in this basin.

کلیدواژه‌ها [English]

  • AUC
  • flood map
  • ROC
  • Topographic moisture index
  • TSS
آزاد طلب، م.، شهابی، ه.، شیرزادی، ع.، چپی، ک. 1399. پهنه­بندی خطر سیلاب ‏در شهر سنندج با استفاده از مدل‌های ترکیبی شاخص آماری و تابع شواهد قطعی. 9 (36): ص 40-27.
آزادی، ف. صدوق، س. ح.، قهرودی، م.، شهابی، ه. 1399. پهنه‌بندی حساسیت خطر سیل در حوضه آبخیز رودخانه کشکان با استفاده از دو مدل WOE و .EBF  نشریه علمی جغرافیا و مخاطرات محیطی. 9 (1): ص 60-45.
اسماعیلی علویجه، ا.، کریمی، س.، علوی پور، ف. س. 1399. ارزیابی آسیب‌پذیری مناطق شهری در برابر سیل با منطق فازی (مطالعه موردی: منطقه 22 تهران). فصلنامه علوم و تکنولوژی محیط زیست. 22 (3): ص 361-349.
برخورداری، ج.، زارع مهرجردی، م.، یوسفی، م. 1393. تاثیر پخش سیلاب بر برخی خصوصیات پوشش گیاهی و خاک در ایستگاه آبخوان سرچاهان-استان هرمزگان. نشریه پژوهش­های آبخیزداری. 2 (27): ص 42-33.
حسین زاده، م.، پناهی، ر.، تربند، ت. 1399. پهنه‌بندی حساسیت سیل در حوضۀ آبریز سنقر در استان کرمانشاه. نشریه اکوهیدرولوژی. 7 (4): ص 889-873.
حسینی، س. م.، جعفربیگلو، م. گراوند، ف. 1394. تعیین پهنه­های سیل­گیر رود کشکان با استفاده از مدل هیدرولیکی به­منظور کاهش مخاطرات سیل. نشریه دانش مخاطرات. 2 (3): ص 369-355.
داودی مقدم، د.، حقی زاده، ع. 1399. شناسایی مناطق مستعد سیل‌گیری و تعیین مهم‌ترین عامل‌های مؤثر بر وقوع آن با استفاده از مدل بیشینه‌ی بی‌نظمی در آبخیز تشان خوزستان. نشریه پژوهش­های آبخیزداری. 33 (4): ص 112-96.
سیاه کمری، ص.، زینی وند، ح. 1395. پتانسیل‌یابی مناطق مستعد سیل با استفاده از مدل شاخص آماری و وزن شواهد (حوزه آبخیز مادرسو، گلستان). نشریه سنجش از دور و سامانه اطلاعات جغرافیایی در منابع طبیعی. 7 (4): ص 133-116.
عابدینی، م.، بهشتی جاوید، ا. 1395. پهنه­بندی خطر وقوع سیلاب حوضه آبخیز لیقوان چای با استفاده از مدل فرآیند تحلیل شبکه و سیستم اطلاعات جغرافیایی. 16 (55): ص 312-293.
عابدینی، م.، فتحی، م. ح. 1394. پهنه­بندی خطر وقوع سیلاب با استفاده از فرآیند تحلیل شبکه (مطالعه موردی: حوضه آبخیز خیاو چای). نشریه هیدروژئومورفولوژی. 3: ص 120-99.
عرب عامری، ع.، پورقاسمی، ح. ر.، شیرانی، ک. 1396. پهنه ‏بندی حساسیت سیل‏گیری با استفاده از روش ترکیبی نوین تئوری بیزین‌ـ‌ فرایند تحلیل سلسله‌مراتبی (مطالعۀ موردی: حوضۀ آبخیز نکا ـ استان مازندران). نشریه اکوهیدرولوژی. 4 (2): ص 462-447.
فرامرزی، ح.، حسینی، س. م.، پورقاسمی، ح.، فرنقی، م. 1398. ارزیابی و پهنه‌بندی وقوع مخاطرۀ سیلاب در پارک ملی گلستان. نشریه اکوهیدرولوژی. 6 (4): 1068-1055.
مختاری، د.، رضایی مقدم، م. ح.، رحیم پور، ت.، معزز، س. 1399. تهیه نقشه خطر وقوع سیلاب در حوضه آبریز گمناب چای با استفاده از مدل ANP و تکنیک GIS. نشریه اکوهیدرولوژی. 7 (2): ص 509-497.
یوسفی، ح.، یونسی، ح.، ارشیا، ا.، یاراحمدی، ی.، گودرزی، ا. 1400. تعیین مناطق مستعد سیل با مدل­های FR، SI و  Shannon به­منظور کاهش مخاطرات سیل (مطالعه موردی: حوزه‌آبخیزکشکان). نشریه اکوهیدرولوژی. 8 (1): ص 319-307.
Arianpour, M. and Jamali, A. A. 2015. Flood Hazard Zonation using Spatial Multi-Criteria Evaluation (SMCE) in GIS (Case Study: Omidieh-Khuzestan). European Online Journal of Natural and Social Sciences. 4(1): 39 – 49.
Bates PD. 2012. Integrating remote sensing data with flood inundation models: how far have we got? Hydrol. Process. (26):2515–2521.
Breiman L, Friedman JH, Olshen RA, Stone CJ. 1984. Classification and regression trees.Wadsworth, Belmont, CA.
Brenning A. 2009. Benchmarking classifiers to optimally integrate terrain analysis and multispectral remote sensing in automatic rock glacier detection. Remote Sens Environ 113
(1):239–247.
Bui, D. T., Panahi, M., Shahabi, H., Singh, V. P., Shirzadi, A., Chapi, K., Ahmad, B. B. 2018. Novel hybrid evolutionary algorithms for spatial prediction of floods. Scientific reports, 8(1), 15364.
Chapi, K., Singh, V. P., Shirzadi, A., Shahabi, H., Bui, D. T., Pham, B. T., Khosravi, K. 2017. A novel hybrid artificial intelligence approach for flood susceptibility assessment. Environmental Modelling & Software. 95, 229-245.
Davoudi Moghaddam, D., Pourghasemi, H.R., Rahmati, O. 2019. Assessment of the Contribution of Geo-environmental Factors to Flood Inundation in a Semi-arid Region of SW Iran: Comparison of Different Advanced Modeling Approaches. In Natural Hazards GIS-Based Spatial Modeling Using Data Mining Techniques, Advances in Natural and Technological Hazards Research. Springer: Cham, Switzerland. Volume 48, pp. 59–78.
Davoudi Moghaddam, D., Rahmati, O., Haghizadeh, A., Kalantari, Z. 2020. A Modeling Comparison of Groundwater Potential Mapping in a Mountain Bedrock Aquifer: QUEST, GARP, and RF Models. Water 2020, 12, 679. https://doi.org/10.3390/w12030679.
Fernandez DS, Lutz MA. 2010. Urban flood hazard zoning in Tucuman Province, Argentina, using GIS and multicriteria decision analysis. Engineering Geology. 111: 90-98.
Goetz JN, Guthrie RH, Brenning A. 2011. Integrating physical and empirical landslide susceptibility models using generalized additive models. Geomorphology 129:376–386
Gordon, L. 2013. Using classification and regression trees (CART) in SAS® enterprise miner TM for applications in public health. Public Health.
 
Kanani-Sadat, Y., Arabsheibani, R., Karimipour, F., Nasseri, M. 2019. A New Approach to Flood Susceptibility Assessment in Data-Scarce and Ungauged Regions Based on GIS-based Hybrid Multi CriteriaDecision-Making Method, Journal of Hydrology. Volume 572, pp 17-31.
Khosravi, K., Pourghasemi, H. R., Chapi, K., Bahri, M. 2016. Flash flood susceptibility analysis and its mapping using different bivariate models in Iran: a comparison between Shannon’s entropy, statistical index, and weighting factor models. Environmental monitoring and assessment. 188(12), 656.
Loh, W.Y. 2011. Classification and regression trees. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery. 1(1):14-23.
Mutzner R, Tarolli P, Sofia G, Parlange MB, Rinaldo A. 2016. Field study on drainage densities and rescaled width functions in a high‐altitude alpine catchment. Hydrological Processes. 30(13): 2138-2152.
Ozdemir A, Altural T. 2013. A comparative study of frequency ratio, weights of evidence and logistic regression methods for landslide susceptibility mapping: Sultan Mountains, SW Turkey. J Asian Earth Sci 64:180–197.
Regmi, N. R., Giardino, J.R., Vitek, J. D. 2010. Modeling susceptibility to landslides using the weight of evidence approach: Western Colorado, USA. Geomorphology. 115(1):172–187.
Sharma, H., Kumar, S. 2016. A survey on decision tree algorithms of classification in data mining. International Journal of Science and Research. 5(4):209497.
Tehrany, M. S., Pradhan, B., Jebur, M. N. 2013. Spatial prediction of flood susceptible areas using rule based decision tree (DT) and a novel ensemble bivariate and multivariate statistical models in GIS. J. Hydrol. 504(1):69–79.
Tehrany MS, Pradhan B, Jebur MN. 2014. Flood susceptibility mapping using a novel ensemble weights-of-evidence and support vector machine models in GIS. J. Hydrol. 512(1):332–343.
Tehrany, M. S., Jones, S., Shabani, F. 2019. Identifying the essential flood conditioning factors for flood prone area mapping using machine learning techniques. Catena. 1(175):174-92.
Tehrany, M. S., Pradhan, B., Mansor, S., Ahmad, N. 2015. Flood susceptibility assessment using GIS-based support vector machine model with different kernel types. Catena. 125(1):91–101.