کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6868664 1440031 2018 37 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Continuum directions for supervised dimension reduction
ترجمه فارسی عنوان
جهت پیوسته برای کاهش اندازه نظارت
ترجمه چکیده
کاهش ابعاد داده های چند متغیره تحت نظارت بر اطلاعات کمکی در نظر گرفته شده است. مجموعه ای از مبانی برای کاهش ابعاد به عنوان مینیماتورهای معیار جدید بدست آمده است. روش پیشنهادی شبیه به رگرسیون پیوسته است و اساس نتیجه آن، جهت پیوسته است. با وجود داده های نظارت دوتایی، این دستورالعمل به طور پیوسته مولفه اصلی، تفاوت میانگین و خطوط جدایی خطی را از بین می برد، از این رو می توان از تغییرات نا منظم به طور کامل تحت نظارت اجتناب کرد. مطالعات آستانهشناختی سطحی از جهتهای پیوسته برای نظارت دوتایی، چند واقعیت جالب را نشان میدهد. شرایطی که در آن مسیرهای نمونه پیوسته متناقض هستند، اما عملکرد طبقه بندی آنها خوب است، مشخص شده است. در حالی که روش پیشنهاد شده می تواند به طور مستقیم برای طبقه بندی دوتایی و چند طبقه بندی استفاده شود، تعمیم آن ها برای ترکیب هر گونه داده های کمکی نیز ارائه می شود. روش پیشنهادی محاسبات سریع را به دست می آورد و عملکرد بهتر یا بیشتر با گزینه های رایج بیشتر است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
Dimension reduction of multivariate data supervised by auxiliary information is considered. A series of basis for dimension reduction is obtained as minimizers of a novel criterion. The proposed method is akin to continuum regression, and the resulting basis is called continuum directions. With a presence of binary supervision data, these directions continuously bridge the principal component, mean difference and linear discriminant directions, thus ranging from unsupervised to fully supervised dimension reduction. High-dimensional asymptotic studies of continuum directions for binary supervision reveal several interesting facts. The conditions under which the sample continuum directions are inconsistent, but their classification performance is good, are specified. While the proposed method can be directly used for binary and multi-category classification, its generalizations to incorporate any form of auxiliary data are also presented. The proposed method enjoys fast computation, and the performance is better or on par with more computer-intensive alternatives.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computational Statistics & Data Analysis - Volume 125, September 2018, Pages 27-43
نویسندگان
,