مقایسه عملکرد چهار الگوریتم یادگیری ماشین در مدل سازی شدت تصادفات

نوع مقاله : علمی - پژوهشی

نویسندگان

1 حمل و نقل، دانشکده عمران، دانشگاه علم و صنعت ایران، تهران، ایران

2 استادیار- دانشگاه علم و صنعت ایران، دانشکده عمران

چکیده

تصادفات جاده ای خسارات اجتماعی و اقتصادی زیادی را به جوامع تحمیل می‌کنند. از این حیث مطالعات ایمنی ترافیک در دهه های اخیر مورد نوجه قرار گرفته است. در این راستا مطالعات مختلفی در راستای مدل سازی شدت ترافیک انجام شده که اکثریت این مدل ها از روش های آماری استفاده کرده اند و استفاده از روش های مبتنی یادگیری ماشین در این زمینه محدود بوده است. روش های آماری فرضیات مشخصی در رابطه با داده ها و متغیر ها دارند که در صورت تخطی از مساله ار آنها، استنباط آماری تحت تاثیر قرار خواهد گرفت. این در حالی است که روش های مبتنی بر یادگیری ماشین این فرضیات را نداشته و از این حیث نسبت به روش های آماری برتری دارند. طیف وسیعی از روش های یادگیری ماشین می‌توانند در امر مدل سازی شدت تصادفات مورد استفاده قرار گیرند، از این حیث پژوهش پیش رو به بررسی عملکرد چهار مدل مبتنی بر یادگیری ماشین شامل روش درخت تصمیم، شبکه عصبی مصنوعی، ماشین بردار پشتیبان و نزدیک ترین همسایگی پرداخته است. نتایج نشان دادند عملکرد درخت تصمیم هم از حیث دقت مدل و هم از حیث دسته بندی تصادفات جرحی/فوتی بهتر بوده است. همچنین پژوهش حاضر با استفاده از روش SHAP به بررس تاثیر متغیر های مختلف پرداخته. نتیاج نشان دادند متغیر های سن راننده مقصر، روشنایی راه و سرعت مجاز در تمامی مدل ها تاثیر گذاری معناداری داشته اند.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

a comparative study on performance of 4 machine learning algorithms in crash severity modeling

نویسندگان [English]

  • omid abdolhoseinpoor mahjoubian 1
  • Ali Tavakoli Kashani 2
1 Department of transportation, faculty of civil engineering, Iran university of science and technology, Tehran, Iran
2 department of transportation engineering, faculty of civil engineering, Iran university of science and technology, Tehran, Iran
چکیده [English]

Road crashes cause sociological and economical costs to societies, hence in recent years traffic safety studies has been a major concern. studies have been conducted in regards to crash severity modeling, but the majority of theses studies has traditionally used statistical modeling techniques, and the use of machine learning has been limited. Statistical methods have presupposed some conditions regarding variables and their relations, and if these conditions are violated, inference is affected. A wide spectrum of machine learning algorithm could be employed in crash safety modeling; hence the current study aims to comprehensively compare the performance of 4 widely used machine learning algorithms, namely classification and regression tree, artificial neural network, support vector machine and k-nearest neighbors. Results indicate that CART outperformed other models both in terms of accuracy and the prediction of the less populated crash severity level. Furthermore, the variable importance effected was analyzed using SHAP method, where at fault driver’s age, lighting condition and speed limit were found to be most significant across different models.

کلیدواژه‌ها [English]

  • crash severity modeling
  • machine learning
  • sensitivity analysis

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از تاریخ 19 مهر 1402
  • تاریخ دریافت: 13 شهریور 1402
  • تاریخ بازنگری: 06 مهر 1402
  • تاریخ پذیرش: 08 مهر 1402