کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6959865 1451959 2015 6 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Active data labeling for improved classifier generalizability
ترجمه فارسی عنوان
برچسب زدن داده های فعال برای بهینه سازی طبقه بندی کننده پیشرفته
کلمات کلیدی
ترجمه چکیده
روش های یادگیری آماری موجود در هنگام ارزیابی بر روی آموزش و داده های تست از یک توزیع مشابه، خوب عمل می کنند. در عمل، با این حال، این توزیع ها همیشه یکسان نیستند. در این مقاله، یک حد بالایی قابل پیش بینی در میزان خطای آزمون وجود دارد که بستگی به اندازه گیری فاصله احتمال جدید بین آموزش و توزیع آزمون دارد. علاوه بر این، ما یک برآوردگر غیر پارامتری برای این اندازه گیری از راه دور که می تواند به طور مستقیم از داده ها محاسبه شود شناسایی کنیم. ما نشان می دهیم که چگونه این ابزار اندازه گیری فاصله احتمال جدید می تواند برای ساخت ابزارهای الگوریتمی که عملکرد را بهبود می بخشد استفاده شود. به طور خاص، با انگیزه بالایی ما، ما یک الگوریتم یادگیری فعال جدید برای انطباق دامنه پیشنهاد می کنیم. نتایج تطبیقی ​​اثربخشی الگوریتم یادگیری فعال در یک مجموعه از وظایف طبقه بندی 12 را تایید می کند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر پردازش سیگنال
چکیده انگلیسی
Existing statistical learning methods perform well when evaluated on training and test data drawn from the same distribution. In practice, however, these distributions are not always the same. In this paper we derive an estimable upper bound on the test error rate that depends on a new probability distance measure between training and test distributions. Furthermore, we identify a non-parametric estimator for this distance measure that can be estimated directly from data. We show how this new probability distance measure can be used to construct algorithmic tools that improve performance. In particular, motivated by our upper bound, we propose a new active learning algorithm for domain adaptation. Comparative results confirm the efficacy of the active learning algorithm on a set of 12 speech classification tasks.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Signal Processing - Volume 108, March 2015, Pages 272-277
نویسندگان
, ,