کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4944598 1438006 2017 21 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A two dimensional accuracy-based measure for classification performance
ترجمه فارسی عنوان
یک سنجش مبتنی بر دقت دو بعدی برای عملکرد طبقه بندی
کلمات کلیدی
معیارهای طبقه بندی طبقه بندی نامتعادل، دقت،
ترجمه چکیده
دقت به طور سنتی برای ارزیابی عملکرد طبقه بندی استفاده شده است. با این حال، به خوبی شناخته شده است که دقت، قادر به ضبط تمام عوامل مختلف که عملکرد یک طبقه بندی چند طبقه مشخص نیست. در این مقاله، دقت مورد مطالعه و تحلیل به عنوان میانگین وزنی نرخ طبقه بندی هر کلاس است. این دیدگاه ما را قادر می سازد تا پراکندگی میزان طبقه بندی هر کلاس را به عنوان مکمل مکمل آن ارائه دهیم. به این معنا، برای ارزیابی عملکرد طبقه بندی ها، یک ماتریس عملکرد گرافیکی، که در فضای دو بعدی با توجه به دقت و پراکندگی تعریف شده است، پیشنهاد می شود. ما نشان می دهیم که مقادیر ترکیبی دقت و پراکندگی باید در یک منطقه ی دو بعدی ی که به وضوح محدود است، برای هر مسئله متفاوت باشد. ماهیت این منطقه تنها به احتمال پیشینی هر کلاس بستگی دارد و نه در طبقه بندی مورد استفاده. بنابراین، عملکرد طبقه بندی های طبقه بندی شده در یک فضای دو بعدی نشان داده شده است که در آن مدل ها را می توان با روش عادلانه تر مقایسه کرد، آگاهی بیشتری در مورد استراتژی هایی که در هنگام تلاش برای بهبود عملکرد یک طبقه بندی دقیق تر است، دقیق تر است. علاوه بر این، ما به طور تجربی از رفتار هفت معیار عملکرد عملکرد بر اساس محاسبه مقادیر ماتریس سردرگمی در چندین سناریو، شناسایی خوشه ها و روابط بین اندازه گیری ها، تحلیل می کنیم. همانطور که در آزمایشات نشان داده شده است، متریک گرافیکی پیشنهاد شده به طور خاص در چالش کشیدن، بسیار نامتعادل و با تعداد زیادی از مجموعه داده های کلاس ها مناسب است. رویکرد پیشنهاد شده نقطه نظر جدیدی است برای ارزیابی طبقهبندیهای طبقهبندی شده و جایگزینی برای سایر اقدامات ارزیابی مورد استفاده در یادگیری ماشین است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Accuracy has been used traditionally to evaluate the performance of classifiers. However, it is well known that accuracy is not able to capture all the different factors that characterize the performance of a multiclass classifier. In this manuscript, accuracy is studied and analyzed as a weighted average of the classification rate of each class. This perspective allows us to propose the dispersion of the classification rate of each class as its complementary measure. In this sense, a graphical performance metric, which is defined in a two dimensional space composed by accuracy and dispersion, is proposed to evaluate the performance of classifiers. We show that the combined values of accuracy and dispersion must fall within a clearly bounded two dimensional region, different for each problem. The nature of this region depends only on the a priori probability of each class, and not on the classifier used. Thus, the performance of multiclassifiers is represented in a two dimensional space where the models can be compared in a more fair manner, providing greater awareness of the strategies that are more accurate when trying to improve the performance of a classifier. Furthermore we experimentally analyze the behavior of seven different performance metrics based on the computation of the confusion matrix values in several scenarios, identifying clusters and relationships between measures. As shown in the experimentation, the graphical metric proposed is specially suitable in challenging, highly imbalanced and with a high number of classes datasets. The approach proposed is a novel point of view to address the evaluation of multiclassifiers and it is an alternative to other evaluation measures used in machine learning.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volumes 382–383, March 2017, Pages 60-80
نویسندگان
, , , , ,