کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
6959865 | 1451959 | 2015 | 6 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Active data labeling for improved classifier generalizability
ترجمه فارسی عنوان
برچسب زدن داده های فعال برای بهینه سازی طبقه بندی کننده پیشرفته
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
طبقه بندی، اقدامات واگرا، انطباق دامنه، یادگیری فعال،
ترجمه چکیده
روش های یادگیری آماری موجود در هنگام ارزیابی بر روی آموزش و داده های تست از یک توزیع مشابه، خوب عمل می کنند. در عمل، با این حال، این توزیع ها همیشه یکسان نیستند. در این مقاله، یک حد بالایی قابل پیش بینی در میزان خطای آزمون وجود دارد که بستگی به اندازه گیری فاصله احتمال جدید بین آموزش و توزیع آزمون دارد. علاوه بر این، ما یک برآوردگر غیر پارامتری برای این اندازه گیری از راه دور که می تواند به طور مستقیم از داده ها محاسبه شود شناسایی کنیم. ما نشان می دهیم که چگونه این ابزار اندازه گیری فاصله احتمال جدید می تواند برای ساخت ابزارهای الگوریتمی که عملکرد را بهبود می بخشد استفاده شود. به طور خاص، با انگیزه بالایی ما، ما یک الگوریتم یادگیری فعال جدید برای انطباق دامنه پیشنهاد می کنیم. نتایج تطبیقی اثربخشی الگوریتم یادگیری فعال در یک مجموعه از وظایف طبقه بندی 12 را تایید می کند.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
پردازش سیگنال
چکیده انگلیسی
Existing statistical learning methods perform well when evaluated on training and test data drawn from the same distribution. In practice, however, these distributions are not always the same. In this paper we derive an estimable upper bound on the test error rate that depends on a new probability distance measure between training and test distributions. Furthermore, we identify a non-parametric estimator for this distance measure that can be estimated directly from data. We show how this new probability distance measure can be used to construct algorithmic tools that improve performance. In particular, motivated by our upper bound, we propose a new active learning algorithm for domain adaptation. Comparative results confirm the efficacy of the active learning algorithm on a set of 12 speech classification tasks.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Signal Processing - Volume 108, March 2015, Pages 272-277
Journal: Signal Processing - Volume 108, March 2015, Pages 272-277
نویسندگان
Visar Berisha, Douglas Cochran,