کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
10321824 660756 2015 11 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Example-dependent cost-sensitive decision trees
ترجمه فارسی عنوان
درخت تصمیمی حساس به هزینه وابسته به نمونه
کلمات کلیدی
یادگیری حساس طبقه بندی حساس به ارزش، نمره اعتباری، تشخیص تقلب، بازاریابی مستقیم، درختان تصمیم گیری،
ترجمه چکیده
چندین مشکل طبقه بندی دنیای واقعی به طور مثال وابسته به هزینه های حساس در طبیعت هستند، جایی که هزینه های ناشی از طبقه بندی تقلبی بین نمونه ها متفاوت است. با این حال، روش های طبقه بندی استاندارد این هزینه ها را به حساب نمی گیرند و هزینه های ثابت خطاهای اشتباه طبقه بندی را در نظر می گیرند. تکنولوژیهای حساس وابسته به مثالهای وابسته به حالت قبلی تنها هزینه قبل و بعد از آموزش را به الگوریتم معرفی می کنند، بنابراین، فرصت ها را برای بررسی اثر بالقوه الگوریتم هایی که هزینه های وابسته به مثال واقعی مالی را در نظر می گیرند، معرفی می کنند در طول یک الگوریتم آموزش. در این مقاله، الگوریتم تصمیم گیری وابسته به هزینه وابسته به عنوان مثال، با ترکیب هزینه های مختلف به عنوان مثال وابسته به یک اندازه گیری ناخالص مبتنی بر هزینه های جدید و معیارهای هرس بر اساس هزینه های جدید است. سپس، با استفاده از سه پایگاه داده مختلف از سه برنامه دنیای واقعی: تشخیص تقلب کارت اعتباری، امتیاز اعتبار و بازاریابی مستقیم، روش پیشنهادی را ارزیابی می کنیم. نتایج نشان می دهد که الگوریتم پیشنهادی بهترین روش برای همه پایگاه های داده است. علاوه بر این، در مقایسه با یک درخت تصویب استاندارد، روش ما در پنجه از زمان درختان به طور معنی داری کوچکتر می سازد، در حالیکه عملکرد برتر را با صرفه جویی هزینه ها اندازه گیری می کند و منجر به یک روش است که نه تنها نتایج کسب وکار بیشتری دارد بلکه همچنین یک روش که مدل های ساده تر را ارائه می دهد که برای تحلیل آسان تر است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Several real-world classification problems are example-dependent cost-sensitive in nature, where the costs due to misclassification vary between examples. However, standard classification methods do not take these costs into account, and assume a constant cost of misclassification errors. State-of-the-art example-dependent cost-sensitive techniques only introduce the cost to the algorithm, either before or after training, therefore, leaving opportunities to investigate the potential impact of algorithms that take into account the real financial example-dependent costs during an algorithm training. In this paper, we propose an example-dependent cost-sensitive decision tree algorithm, by incorporating the different example-dependent costs into a new cost-based impurity measure and a new cost-based pruning criteria. Then, using three different databases, from three real-world applications: credit card fraud detection, credit scoring and direct marketing, we evaluate the proposed method. The results show that the proposed algorithm is the best performing method for all databases. Furthermore, when compared against a standard decision tree, our method builds significantly smaller trees in only a fifth of the time, while having a superior performance measured by cost savings, leading to a method that not only has more business-oriented results, but also a method that creates simpler models that are easier to analyze.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Expert Systems with Applications - Volume 42, Issue 19, 1 November 2015, Pages 6609-6619
نویسندگان
, , ,