کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
4946188 | 1439277 | 2017 | 13 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
An uncertainty and density based active semi-supervised learning scheme for positive unlabeled multivariate time series classification
ترجمه فارسی عنوان
یک روش یادگیری نیمه نظارتی مبتنی بر عدم قطعیت و چگالی برای طبقه بندی سری های چند متغیره بدون برچسب
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
سری زمانی چند متغیره، طبقه بندی اولیه، داده های نامتعادل،
ترجمه چکیده
در حقیقت، تعداد داده های سری زمان مشخص شده اغلب کوچک است و تعداد زیادی از داده های بدون برچسب وجود دارد. به طور دستی نشانه گذاری این نمونه های بدون برچسب وقت گیر و گران است، و گاهی اوقات حتی غیرممکن است. در این مقاله، ما یادگیری فعال و یادگیری نیمه نظارتی را برای به دست آوردن داده های آموزشی با اعتماد به نفس و کافی برای طبقه بندی سری چند متغیری ترکیب می کنیم. ابتدا یک استراتژی نمونه برداری را با رتبه بندی اطلاعاتی از نمونه های بدون برچسب بر اساس عدم قطعیت و تراکم داده های محلی آن، پیشنهاد می کنیم. بعد، یک چارچوب یادگیری فعال نیمه نظارتی معرفی شده است تا بهترین استفاده از مزایای یادگیری فعال و یادگیری نیمه نظارتی را برای حاشیه نویسی داده ها به طور کامل استفاده کند. سرانجام، یک معیار توقف معتبر یادگیری فعال را برای فراهم آوردن یک مجموعه داده های آموزشی آموزش دیده با کیفیت و قابل اعتماد پیش بینی می کنیم که هزینه های انسانی را به حداقل ممکن کاهش می دهد. نتایج تجربی ما نشان می دهد که رویکرد ما می تواند به صورت دستی نمونه هایی را به صورت کوچک به عنوان حاشیه نویسی کند و به طور همزمان یک مجموعه داده های معتبر و قابل اطمینان به دست آورد که برای یادگیری یک طبقه بندی کارآمد کافی است.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
هوش مصنوعی
چکیده انگلیسی
In reality, the number of labeled time series data is often small and there is a huge number of unlabeled data. Manually labeling these unlabeled examples is time-consuming and expensive, and sometimes it is even impossible. In this paper, we combine active learning and semi-supervised learning to obtain a confident and sufficient labeled training data for multivariate time series classification. We first propose a sampling strategy by ranking the informativeness of unlabeled examples based on its uncertainty and its local data density. Next, an active semi-supervised learning framework is introduced to make best use of the advantage of active learning and semi-supervised learning for data annotation. Finally, we advance a valid stopping criterion of active learning to provide a sufficient and reliable labeled training dataset by costing human resources as less as possible. Our experimental results show that our approach can manually annotate examples as small as possible and simultaneously obtain a confident and informative labeled dataset, which is sufficient to learn an efficient classification.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Knowledge-Based Systems - Volume 124, 15 May 2017, Pages 80-92
Journal: Knowledge-Based Systems - Volume 124, 15 May 2017, Pages 80-92
نویسندگان
He Guoliang, Li Yifei, Zhao Wen,