کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6948331 1451032 2018 38 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
An investigation of bankruptcy prediction in imbalanced datasets
ترجمه فارسی عنوان
بررسی پیش بینی ورشکستگی در مجموعه داده های نامتعادل
ترجمه چکیده
مطالعات پیشین پیش بینی ورشکستگی در مجموعه داده های عدم تعادل تجزیه و تحلیل یا از دست دادن پیش بینی به دلیل مشکلات عدم تعادل داده ها و یا روش های درمان برای مقابله با این موضوع است. در مقاله حاضر، بررسی ترکیبی از میزان عدم تعادل، از دست دادن عملکرد و روش های درمان ارائه شده است. این تعریف می کند که توزیع های طبقه عدم توازن، عملکرد روش های پیش بینی ورشکستگی را به خطر می اندازد و ظرفیت های بازیابی روش های درمان را شناسایی می کند. نتایج نشان می دهد که توزیع نامتقارن، که در آن طبقه اقلیت 20٪ است، عملکرد پیش بینی را به طور قابل توجهی مختل می کند. علاوه بر این، روش ماشین بردار پشتیبانی کمتر از سایر روش های پیش بینی برای توزیع نامتقارن است و روش های نمونه گیری می تواند بخش قابل قبولی از ضررهای عملکرد را بازیابی کند. بر این اساس، این مطالعه، درک درستی از مسئله عدم تعادل داده ها در زمینه شکست های شرکت ها را فراهم می کند و به عنوان یک راهنمای روش شناختی برای طراحی روش های پیش بینی ورشکستگی در مجموعه داده های نامتعادل استفاده می شود.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر سیستم های اطلاعاتی
چکیده انگلیسی
Previous studies of bankruptcy prediction in imbalanced datasets analyze either the loss of prediction due to data imbalance issues or treatment methods for dealing with this issue. The current article presents a combined investigation of the degree of imbalance, loss of performance, and treatment methods. It determines which imbalanced class distributions jeopardize the performance of bankruptcy prediction methods and identifies the recovery capacities of treatment methods. The results show that an imbalanced distribution, in which the minority class represents 20%, significantly disturbs prediction performance. Furthermore, the support vector machine method is less sensitive than other prediction methods to imbalanced distributions, and sampling methods can recover a satisfactory portion of performance losses. Accordingly, this study provides a better understanding of the data imbalance issue in the field of corporate failure and serves as a methodological guide for designing bankruptcy prediction methods in imbalanced datasets.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Decision Support Systems - Volume 112, August 2018, Pages 111-124
نویسندگان
, ,