Determination of Flood potential Using CART, GLM and GAM Machine learning Models

Document Type : Original Article

Authors

1 Associate Professor, Faculty of New Sciences and Technologies, University of Tehran

2 water Eng. agriculture faculty of lorestan university

3 lu

4 LU

Abstract

Flood is a phenomenon that causes a lot of environmental and socio-economic damage. The purpose of this study is to evaluate the efficiency of CART, GLM and GAM machine learning models in identifying flood risk areas in the Kashkan basin. Lorestan province and especially Kashkan basin, including: Selseleh, Delfan, Doreh, Khorramabad, Poldakhtar and Kuhdasht, is flooded and has suffered flood damage many times and in April 2019, experienced the largest flood of the last 200 years. In this regard, various factors including: height, slope direction, land curvature, slope percentage, distance from the river, drainage density, soil, lithology, land use and topographic moisture index were used. The digital map of all the mentioned factors was prepared in ArcGIS10.5 software and in the form of a database. The location of 123 flood events recorded in recent years in this basin was collected and randomly used in two categories of model training (86 cases) and model validation (37 cases) in modeling. Using machine learning models and environmental factors, flood potential prediction maps were prepared and then validated using AUC characteristic curve methods and TSS index. The results of model validation showed that CART machine learning model with AUC = 0.91 and TTS = 0.88 index was the most accurate model in predicting flood risk potential, followed by GAM model with AUC = 0.87 and TSS index = 0.84 and GLM model with AUC = 0.83 and TSS index = 0.88. Accuracy 0.91 CART model indicates the excellent accuracy of this model for the Kashkan basin. This model shows a larger area of ​​the basin under high potential and moderate flood risk conditions, which include most of the western areas as well as the central areas of the basin (Kuhdasht, Khorramabad and Poldakhtar), which are exactly parts The same areas were flooded in the great flood of 2019 and it is necessary to be in the first priority of flood risk planning and management in this basin.

Keywords

Main Subjects


آزاد طلب، م.، شهابی، ه.، شیرزادی، ع.، چپی، ک. 1399. پهنه­بندی خطر سیلاب ‏در شهر سنندج با استفاده از مدل‌های ترکیبی شاخص آماری و تابع شواهد قطعی. 9 (36): ص 40-27.
آزادی، ف. صدوق، س. ح.، قهرودی، م.، شهابی، ه. 1399. پهنه‌بندی حساسیت خطر سیل در حوضه آبخیز رودخانه کشکان با استفاده از دو مدل WOE و .EBF  نشریه علمی جغرافیا و مخاطرات محیطی. 9 (1): ص 60-45.
اسماعیلی علویجه، ا.، کریمی، س.، علوی پور، ف. س. 1399. ارزیابی آسیب‌پذیری مناطق شهری در برابر سیل با منطق فازی (مطالعه موردی: منطقه 22 تهران). فصلنامه علوم و تکنولوژی محیط زیست. 22 (3): ص 361-349.
برخورداری، ج.، زارع مهرجردی، م.، یوسفی، م. 1393. تاثیر پخش سیلاب بر برخی خصوصیات پوشش گیاهی و خاک در ایستگاه آبخوان سرچاهان-استان هرمزگان. نشریه پژوهش­های آبخیزداری. 2 (27): ص 42-33.
حسین زاده، م.، پناهی، ر.، تربند، ت. 1399. پهنه‌بندی حساسیت سیل در حوضۀ آبریز سنقر در استان کرمانشاه. نشریه اکوهیدرولوژی. 7 (4): ص 889-873.
حسینی، س. م.، جعفربیگلو، م. گراوند، ف. 1394. تعیین پهنه­های سیل­گیر رود کشکان با استفاده از مدل هیدرولیکی به­منظور کاهش مخاطرات سیل. نشریه دانش مخاطرات. 2 (3): ص 369-355.
داودی مقدم، د.، حقی زاده، ع. 1399. شناسایی مناطق مستعد سیل‌گیری و تعیین مهم‌ترین عامل‌های مؤثر بر وقوع آن با استفاده از مدل بیشینه‌ی بی‌نظمی در آبخیز تشان خوزستان. نشریه پژوهش­های آبخیزداری. 33 (4): ص 112-96.
سیاه کمری، ص.، زینی وند، ح. 1395. پتانسیل‌یابی مناطق مستعد سیل با استفاده از مدل شاخص آماری و وزن شواهد (حوزه آبخیز مادرسو، گلستان). نشریه سنجش از دور و سامانه اطلاعات جغرافیایی در منابع طبیعی. 7 (4): ص 133-116.
عابدینی، م.، بهشتی جاوید، ا. 1395. پهنه­بندی خطر وقوع سیلاب حوضه آبخیز لیقوان چای با استفاده از مدل فرآیند تحلیل شبکه و سیستم اطلاعات جغرافیایی. 16 (55): ص 312-293.
عابدینی، م.، فتحی، م. ح. 1394. پهنه­بندی خطر وقوع سیلاب با استفاده از فرآیند تحلیل شبکه (مطالعه موردی: حوضه آبخیز خیاو چای). نشریه هیدروژئومورفولوژی. 3: ص 120-99.
عرب عامری، ع.، پورقاسمی، ح. ر.، شیرانی، ک. 1396. پهنه ‏بندی حساسیت سیل‏گیری با استفاده از روش ترکیبی نوین تئوری بیزین‌ـ‌ فرایند تحلیل سلسله‌مراتبی (مطالعۀ موردی: حوضۀ آبخیز نکا ـ استان مازندران). نشریه اکوهیدرولوژی. 4 (2): ص 462-447.
فرامرزی، ح.، حسینی، س. م.، پورقاسمی، ح.، فرنقی، م. 1398. ارزیابی و پهنه‌بندی وقوع مخاطرۀ سیلاب در پارک ملی گلستان. نشریه اکوهیدرولوژی. 6 (4): 1068-1055.
مختاری، د.، رضایی مقدم، م. ح.، رحیم پور، ت.، معزز، س. 1399. تهیه نقشه خطر وقوع سیلاب در حوضه آبریز گمناب چای با استفاده از مدل ANP و تکنیک GIS. نشریه اکوهیدرولوژی. 7 (2): ص 509-497.
یوسفی، ح.، یونسی، ح.، ارشیا، ا.، یاراحمدی، ی.، گودرزی، ا. 1400. تعیین مناطق مستعد سیل با مدل­های FR، SI و  Shannon به­منظور کاهش مخاطرات سیل (مطالعه موردی: حوزه‌آبخیزکشکان). نشریه اکوهیدرولوژی. 8 (1): ص 319-307.
Arianpour, M. and Jamali, A. A. 2015. Flood Hazard Zonation using Spatial Multi-Criteria Evaluation (SMCE) in GIS (Case Study: Omidieh-Khuzestan). European Online Journal of Natural and Social Sciences. 4(1): 39 – 49.
Bates PD. 2012. Integrating remote sensing data with flood inundation models: how far have we got? Hydrol. Process. (26):2515–2521.
Breiman L, Friedman JH, Olshen RA, Stone CJ. 1984. Classification and regression trees.Wadsworth, Belmont, CA.
Brenning A. 2009. Benchmarking classifiers to optimally integrate terrain analysis and multispectral remote sensing in automatic rock glacier detection. Remote Sens Environ 113
(1):239–247.
Bui, D. T., Panahi, M., Shahabi, H., Singh, V. P., Shirzadi, A., Chapi, K., Ahmad, B. B. 2018. Novel hybrid evolutionary algorithms for spatial prediction of floods. Scientific reports, 8(1), 15364.
Chapi, K., Singh, V. P., Shirzadi, A., Shahabi, H., Bui, D. T., Pham, B. T., Khosravi, K. 2017. A novel hybrid artificial intelligence approach for flood susceptibility assessment. Environmental Modelling & Software. 95, 229-245.
Davoudi Moghaddam, D., Pourghasemi, H.R., Rahmati, O. 2019. Assessment of the Contribution of Geo-environmental Factors to Flood Inundation in a Semi-arid Region of SW Iran: Comparison of Different Advanced Modeling Approaches. In Natural Hazards GIS-Based Spatial Modeling Using Data Mining Techniques, Advances in Natural and Technological Hazards Research. Springer: Cham, Switzerland. Volume 48, pp. 59–78.
Davoudi Moghaddam, D., Rahmati, O., Haghizadeh, A., Kalantari, Z. 2020. A Modeling Comparison of Groundwater Potential Mapping in a Mountain Bedrock Aquifer: QUEST, GARP, and RF Models. Water 2020, 12, 679. https://doi.org/10.3390/w12030679.
Fernandez DS, Lutz MA. 2010. Urban flood hazard zoning in Tucuman Province, Argentina, using GIS and multicriteria decision analysis. Engineering Geology. 111: 90-98.
Goetz JN, Guthrie RH, Brenning A. 2011. Integrating physical and empirical landslide susceptibility models using generalized additive models. Geomorphology 129:376–386
Gordon, L. 2013. Using classification and regression trees (CART) in SAS® enterprise miner TM for applications in public health. Public Health.
 
Kanani-Sadat, Y., Arabsheibani, R., Karimipour, F., Nasseri, M. 2019. A New Approach to Flood Susceptibility Assessment in Data-Scarce and Ungauged Regions Based on GIS-based Hybrid Multi CriteriaDecision-Making Method, Journal of Hydrology. Volume 572, pp 17-31.
Khosravi, K., Pourghasemi, H. R., Chapi, K., Bahri, M. 2016. Flash flood susceptibility analysis and its mapping using different bivariate models in Iran: a comparison between Shannon’s entropy, statistical index, and weighting factor models. Environmental monitoring and assessment. 188(12), 656.
Loh, W.Y. 2011. Classification and regression trees. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery. 1(1):14-23.
Mutzner R, Tarolli P, Sofia G, Parlange MB, Rinaldo A. 2016. Field study on drainage densities and rescaled width functions in a high‐altitude alpine catchment. Hydrological Processes. 30(13): 2138-2152.
Ozdemir A, Altural T. 2013. A comparative study of frequency ratio, weights of evidence and logistic regression methods for landslide susceptibility mapping: Sultan Mountains, SW Turkey. J Asian Earth Sci 64:180–197.
Regmi, N. R., Giardino, J.R., Vitek, J. D. 2010. Modeling susceptibility to landslides using the weight of evidence approach: Western Colorado, USA. Geomorphology. 115(1):172–187.
Sharma, H., Kumar, S. 2016. A survey on decision tree algorithms of classification in data mining. International Journal of Science and Research. 5(4):209497.
Tehrany, M. S., Pradhan, B., Jebur, M. N. 2013. Spatial prediction of flood susceptible areas using rule based decision tree (DT) and a novel ensemble bivariate and multivariate statistical models in GIS. J. Hydrol. 504(1):69–79.
Tehrany MS, Pradhan B, Jebur MN. 2014. Flood susceptibility mapping using a novel ensemble weights-of-evidence and support vector machine models in GIS. J. Hydrol. 512(1):332–343.
Tehrany, M. S., Jones, S., Shabani, F. 2019. Identifying the essential flood conditioning factors for flood prone area mapping using machine learning techniques. Catena. 1(175):174-92.
Tehrany, M. S., Pradhan, B., Mansor, S., Ahmad, N. 2015. Flood susceptibility assessment using GIS-based support vector machine model with different kernel types. Catena. 125(1):91–101.