کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
7562483 1491508 2017 10 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Stable variable selection of class-imbalanced data with precision-recall criterion
ترجمه فارسی عنوان
انتخاب متغیر پایدار از داده های عدم تعادل کلاس با معیار دقیق یادآوری
کلمات کلیدی
منحنی دقیق یادآوری، داده های عدم تعادل کلاس، رگرسیون لجستیک مقررات زدایی، انتخاب متغیر پایدار زیرمجموعه
موضوعات مرتبط
مهندسی و علوم پایه شیمی شیمی آنالیزی یا شیمی تجزیه
چکیده انگلیسی
Screening important variables for class-imbalanced data is still a challenging task. In this study, we propose an algorithm for stably selecting key variables on class-imbalanced data based on the precision-recall curve (PRC), where the PRC is utilized as the assessment criterion in the model building stage, and sparse regularized logistic regression combined with subsampling (SRLRS) is designed to perform stable variable selection. Considering the characteristic of class-imbalanced data, we also proposed classification-based partition for cross validation, as well as leaving half of majority observations out and leaving one minority observation out (LHO-LOO) for subsampling. Simulation results and real data showed that our algorithm is highly suitable for handling class-imbalanced data, and that the PRC can be an alternative evaluation criterion for model selection when handling class-imbalanced data.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Chemometrics and Intelligent Laboratory Systems - Volume 171, 15 December 2017, Pages 241-250
نویسندگان
, , , ,