کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4948059 1439602 2017 25 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Feature selection based on quality of information
ترجمه فارسی عنوان
انتخاب ویژگی بر اساس کیفیت اطلاعات
کلمات کلیدی
انتخاب ویژگی، آنتروپی اطلاعات، حداکثر نزدیکترین همسایه، کیفیت اطلاعات،
ترجمه چکیده
انتخاب ویژگی به عنوان یکی از مشکلات کلیدی پیش پردازش داده ها، یک موضوع تحقیق داغ در شناخت الگو، یادگیری ماشین و داده کاوی است. ارزیابی ارتباط بین ویژگی های مبتنی بر نظریه اطلاعات یک روش محبوب و موثر است. با این حال، تحقیقات بسیار کمی به توانایی تشخیص ویژگی می پردازد، به عنوان مثال، میزان ویژگی یک نمونه داده شده را با نمونه های دیگر تشخیص می دهد. در این مقاله، ما یک روش انتخاب جدید ویژگی را بر اساس قابلیت تشخیص ویژگی پیشنهاد می کنیم. ابتدا مفهوم حداکثر نزدیکترین همسایه را تعریف می کنیم و از این مفهوم برای تشخیص نزدیکترین همسایگان نمونه استفاده می کنیم. سپس، ما یک روش اندازه گیری جدید برای ارزیابی کیفیت ویژگی ارائه می دهیم. در نهایت، الگوریتم پیشنهاد شده بر روی مجموعه داده های معیار مورد آزمایش قرار می گیرد. نتایج تجربی نشان می دهد که الگوریتم پیشنهادی می تواند به طور موثر زیر مجموعه ای از ویژگی های تشخیصی را انتخاب کند و همچنین به خوبی یا بهتر از سایر الگوریتم های انتخاب محبوبیت محبوب عمل کند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Feature selection as one of the key problems of data preprocessing is a hot research topic in pattern recognition, machine learning, and data mining. Evaluating the relevance between features based on information theory is a popular and effective method. However, very little research pays attention to the distinguishing ability of feature, i.e., the degree of a feature distinguishes a given sample with other samples. In this paper, we propose a new feature selection method based on the distinguishing ability of feature. First, we define the concept of maximum-nearest-neighbor, and use this concept to discriminate the nearest neighbors of samples. Then, we present a new measure method for evaluating the quality of feature. Finally, the proposed algorithm is tested on benchmark datasets. Experimental results show that the proposed algorithm can effectively select a discriminative feature subset, and performs as well as or better than other popular feature selection algorithms.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 225, 15 February 2017, Pages 11-22
نویسندگان
, , , , ,