شناسایی داده‌های غیرنرمال آزمایشات الگوی جریان در قوس با استفاده از روش‌های آماری

نویسندگان

1 استادیار گروه مهندسی عمران، دانشکده فنی و مهندسی، دانشگاه خلیج فارس، بوشهر

2 دانشکده مهندسی دریا، دانشگاه امیرکبیر، تهران، ایران

3 کارشناس ارشد سازه‌های هیدرولیکی، گروه مهندسی عمران، دانشگاه خلیج فارس،

چکیده

عوامل مختلفی مانند خطاهای انسانی و دستگاهی، شرایط اندازه‌گیری و طبیعت جریان در شرایط یکتا ممکن است سبب بروز داده‌هایی شود که با الگوی نرمال جامعه آماری در تناقض باشند؛ به گونه‌ای که این گمان به وجود آید که با یک روند متفاوت تولید شده‌اند. در یک تعریف کلی به این نوع از داده‌ها، داده‌های غیرنرمال (پرت یا خارج از محدوده) گفته می‌شود. شناسایی داده‌های پرت از جنبه‌های مختلف دارای اهمیت بوده و منجر به شناخت هرچه بهتر و دقیق‌تر الگوی جریان می‌شود. هدف اصلی از انجام این تحقیق، بررسی و شناسایی داده‌های پرت موجود در آزمایشات الگوی جریان در یک کانال قوسی با زاویه مرکزی 180 درجه و عرض 1 متر با و بدون وجود آبشکن در قوس با استفاده از روش‌های آماری است. کانال مورد نظر در آزمایشگاه هیدرولیک دانشگاه خلیج فارس قرار داشته و برای برداشت سرعت‌های سه بعدی جریان از سرعت‌سنج وکترینو استفاده شده است. به منظور شناسایی داده‌های پرت در این تحقیق از روش‌های انحراف مطلق میانگین، خوشه‌بندی K-Means، ضریب چگالی محلی و روش رای‌گیری استفاده شده است. نتایج حاصل از اجرای این روش‌ها بر داده‌های آزمایشگاهی برداشت شده نشان داد که کارایی بیشتر روش‌ها مناسب است. در این مقاله در نهایت برای حصول بهترین نتیجه، از روش رای‌گیری استفاده شده است. در این روش، داده‌هایی به عنوان کاندیدای داده پرت نهایی در نظر گرفته می‌شوند که توسط بیشتر روش‌ها به عنوان داده پرت شناسایی شده باشند.

کلیدواژه‌ها


عنوان مقاله [English]

Identification of Outlier Data in Flow Pattern Experiments in a Bend by Using Statistical Methods

نویسندگان [English]

  • Mohammad vaghefi 1
  • kumars mahmoodi 2
  • maryam akbari 3
چکیده [English]

Various factors such as human or instrument errors, measurement conditions, and the nature of the flow under unique circumstances may lead to generation of data inconsistent with the normal pattern of the statistical population, and result in the assumption that they may have been generated through a different process. In a general definition, these data are called outlier data. Identification of outliers is significant in many aspects, and will thus result in an ever better and more precise understanding of flow pattern. The main purpose of this study was analysis and identification of outliers existing in flow pattern experiments in a bend channel with a central angle of 180 degrees and width of 1 meter in the presence and absence of a spur dike in the bend by employing statistical methods. The intended channel is located in the Hydraulic Laboratory of Persian Gulf University, and Vectrino velocimeter has been utilized for collection of 3D flow velocities. Median of Absolute Deviations (MAD), K-Means Clustering, Local Density Factor (LDF), and Voting were the methods employed for outlier detection in this study. The results of applying these methods on the collected experimental data suggested that most of the methods were efficient and appropriate. Eventually, the Voting method was used to achieve the optimum results in this paper. In this method, the data which have been identified as outlier by most of the methods are considered the final candidates as outlier

کلیدواژه‌ها [English]

  • Statistical methods
  • Outlier Data
  • Flow Pattern
  • 180 Degree Sharp Bend
  • Vectrino Velocimeter