کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4948136 1439609 2016 11 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Visual tracking via shallow and deep collaborative model
ترجمه فارسی عنوان
ردیابی ویژوال از طریق مدل مشکوک و کم عمق
کلمات کلیدی
ردیابی ویژوال یادگیری عمیق، یادگیری ویژگی های شفاف، ردیابی همکاری،
ترجمه چکیده
در این مقاله، ما یک روش ردیابی قوی بر اساس همکاری یک مدل مولد و یک طبقه بندی تبعیضی پیشنهاد می کنیم که در آن ویژگی ها با معماری کم عمق و عمیق یاد می گیرند. برای مدل مولد، ما یک برنامه یادگیری افزایشی مبتنی بر بلوک را معرفی می کنیم که در آن یک ماسک دوتایی محلی برای مقابله با اکولسیون ساخته شده است. درجه تقریبی بین تکه های محلی و زیرمجموعه مربوطه آنها یکپارچه سازی شده است تا یک مدل ظاهری دقیق تر را ارائه دهند. در مدل تبعیض آمیز، از پیشرفت معماری یادگیری عمیق به منظور یادگیری ویژگی های عمومی استفاده می کنیم که هر دو از مزیت های پس زمینه و تغییرات ظاهری پیشین هستند. برای این منظور، ما ابتدا یک مجموعه آموزشی جداسازی شده از توالی های ویدئویی کمکی ایجاد می کنیم. یک شبکه عصبی طبقه بندی عمیق سپس در این مجموعه آموزشی تمرین می کند. از طریق تنظیم آنلاین، هر دو ویژگی استخراج ویژگی سلسله مراتبی و طبقه بندی می تواند به تغییر ظاهر هدف برای ردیابی آنلاین موثر سازگار است. همکاری این دو مدل توازن خوبی در برخورد با تغییر شکل ظاهری و هدف قرار می دهد که دو عامل چالش برانگیز در زمینه ردیابی بصری هستند. هر دو ارزیابی کیفی و کیفی در برابر چندین الگوریتم پیشرفته ترین در توالی تصویر چالش برانگیز نشان دهنده دقت و استحکام ردیاب پیشنهادی است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
In this paper, we propose a robust tracking method based on the collaboration of a generative model and a discriminative classifier, where features are learned by shallow and deep architectures, respectively. For the generative model, we introduce a block-based incremental learning scheme, in which a local binary mask is constructed to deal with occlusion. The similarity degrees between the local patches and their corresponding subspace are integrated to formulate a more accurate global appearance model. In the discriminative model, we exploit the advances of deep learning architectures to learn generic features which are robust to both background clutters and foreground appearance variations. To this end, we first construct a discriminative training set from auxiliary video sequences. A deep classification neural network is then trained offline on this training set. Through online fine-tuning, both the hierarchical feature extractor and the classifier can be adapted to the appearance change of the target for effective online tracking. The collaboration of these two models achieves a good balance in handling occlusion and target appearance change, which are two contradictory challenging factors in visual tracking. Both quantitative and qualitative evaluations against several state-of-the-art algorithms on challenging image sequences demonstrate the accuracy and the robustness of the proposed tracker.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 218, 19 December 2016, Pages 61-71
نویسندگان
, , ,