2
گروه مهندسی حمل و نقل ریلی، دانشکده مهندسی راه آهن، دانشگاه علم و صنعت ایران
چکیده
هدف از این مقاله، پیشبینی تأخیرات قطارهای مسافری در راهآهن جمهوری اسلامی ایران با استفاده از تکنیکهای دادهکاوی است. پیشبینی تأخیرات میتواند برای تعیین زمانهای حائل در جداول زمانی قطارهای مسافری مورد استفاده قرار گیرد. دادههای مورد استفاده در این مطالعه شامل پایگاه داده تأخیر قطارهای مسافری از سال 92 تا 97 است که دربردارنده 380.748 رکورد میباشد. متغیرهای مستقل جهت پیشبینی شامل سال، ماه، روز ماه، روز هفته، ساعت حرکت، محورهای حرکت، نوع قطار، نوع سالن، مبدا و مقصد قطار و همچنین نام مالک قطار هستند. مدلسازی پیشبینی به دو صورت عددی و طبقهای انجام شده است. جهت پیشبینی طبقهای، دادههای تأخیر با استفاده از روش خوشهبندی دو مرحلهای گسستهسازی شدهاند. از دو روش شبکه عصبی و C5.0 جهت پیشبینی طبقهای و سه روش رگرسیون، CHAID و شبکه عصبی برای پیشبینی عددی استفاده شده است. برای ارزیابی نتایج پیشبینی، مدل ساخته شده ابتدا بر اساس دادههای سالهای 92 تا 95 آموزش میبیند، سپس به پیشبینی تأخیر برای سال 96 میپردازد. نتایج نشان میدهد که در پیش بینی عددی، روش شبکه عصبی و در پیشبینی به صورت طبقهای، روش C5.0 از دقت بالاتری نسبت به سایر روشها برخوردار هستند، لذا از این دو تکنیک برای پیشبینی تأخیر قطارهای سال 97 استفاده شده است. همچنین جهت ارزیابی تکرارپذیری نتایج، تاخیرات پیش بینی شده سال 97 با سال 96 مقایسه گردیده اند. در انتها، پیشبینی عددی به صورت گروهبندی بر روی رکوردهای پایگاه داده نیز انجام شده است. نتایج نشان میدهد که دقت پیشبینی به صورت گروهبندی، بالاتر است.