کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
10321867 660771 2015 26 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Nearest neighbor classification of categorical data by attributes weighting
ترجمه فارسی عنوان
نزدیکترین همسایگی طبقه بندی داده های طبقه بندی شده بر اساس ویژگی های وزن
کلمات کلیدی
نزدیکترین طبقه همسایه، داده های طبقه بندی شده اندازه گیری فاصله، زیرمجموعه طرح شده، انتخاب ویژگی، وزن مشخصی
ترجمه چکیده
طبقه بندی زیربنایی داده های طبقه بندی شده، یک فرایند ضروری برای بسیاری از برنامه های کاربردی دنیای واقعی مانند تشخیص پزشکی کامپیوتری و توصیه مشترک است. نزدیک ترین متصدی طبقه بندی ها به دلیل سادگی و انعطاف پذیری آنها، علاقه فراوانی به این برنامه ها ایجاد کرده است. با این وجود، به دلیل فقدان یک اندازه گیری دقیق از راه دور استفاده شده برای محاسبه تفاوت های بین نمونه های قطعی در زیربناهای پیش بینی شده، آنها در هنگام اعمال به داده های قطعی بی اثر می شوند. در این مقاله، با تعیین مجموعه ای از توابع توزیع وزن برای ویژگی های دسته ای، با تعیین این مشکل، با استفاده از آنها برای استخراج جدیدترین طبقه بندی های همسایه، مشکل را حل می کنیم. چهار معیار-وزن گیری پیشنهاد شده است، که دو مورد بر اساس رویکردهای جهانی رتبه بندی شده است، در حالی که دو طرف دیگر بر رویکردهای محلی هستند. نتایج تجربی انجام شده بر روی مجموعه داده های واقعی قطعی نشان می دهد که هر چهار طبقه بندی به طور مداوم از روش های سنتی بهتر عمل می کنند و مناسب بودن پیشنهاد برای برنامه های واقعی را از لحاظ انتخاب ویژگی های خودکار نشان می دهد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Subspace classification of categorical data is an essential process for many real-world applications such as computer-aided medical diagnosis and collaborative recommendation. The nearest neighbor classifiers have sparked wide interest from these applications because of their simplicity and flexibility. However, they become ineffective when applied to categorical data, due to the lack of a well-defined distance measure used to compute dissimilarities between categorical samples in the projected subspaces. In this paper, we tackle the problem by defining a series of weighted distance functions for categorical attributes, and applying them to derive new nearest neighbor classifiers. Four attribute-weighting measures are proposed, with two defined on global feature-ranking approaches while the other two on local approaches. The experimental results conducted on real categorical data sets demonstrate that all four classifiers outperform consistently the traditional methods, and show the suitability of the proposal for the real applications in terms of automated feature selection.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Expert Systems with Applications - Volume 42, Issue 6, 15 April 2015, Pages 3142-3149
نویسندگان
, ,