کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4948066 1439602 2017 13 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Sparse representation combined with context information for visual tracking
ترجمه فارسی عنوان
نمایندگی انحصاری همراه با اطلاعات زمینه برای ردیابی بصری
کلمات کلیدی
ترجمه چکیده
در ردیابی تصویری، مشکل اصلی یافتن کاندیدانی است که بیشترین هدف را در فریم های متوالی داشته اند، بنابراین مهم است که یک مکانیزم مناسب برای ارزیابی این طرح طراحی شود. در این مقاله، ما یک الگوریتم ردیابی بصری مبتنی بر نمایندگی مبتکرانه ارائه می دهیم که اطلاعات اطلاعات زمانی و مکانی ردیابی را به چارچوب یکپارچه می دهد. به طور خاص، ما شباهت بین هدف و نامزدهای آن را محاسبه می کنیم که بوسیله ترکیب سه جنبه از تغییر ظاهر هدف با وزن های مختلف به دست می آید. برای قسمت اول، ما یک نمایش پراک مبتنی بر پچ برای اندازه گیری شباهت بین هدف در اولین قاب و نامزدها در فریم فعلی اعمال می کنیم. از آنجا که نتیجه ردیابی در آخرین فریم، آخرین اطلاعات متنوعی از هدف را فراهم می کند، ما روش ارزیابی کیفیت تصویر را برای بدست آوردن نمرات مشابه در بخش دوم استخدام می کنیم و اطلاعات محتویات مکانی نیز مورد سوء استفاده قرار می گیرد. به عنوان ظاهر هدف ممکن است از تغییرات رادیکال در طول دنباله ویدئو رنج می برند، ردیابی که تنها از دو بخش ذکر شده در بالا استفاده می شود از مشکلات جدی روبرو می شود و به راحتی نتایج ردیابی نادرست را تجربه می کند. برای رفع این مشکل، با استفاده از تولید یک گروه از قالب های هدف تاریخی با توجه به نتایج ردیابی قبلی، با استفاده از محاسبات شباهت ها بین هر نامزد با آنها و حداکثر در بخش سوم، ما از اطلاعات زمینه های زمانی استفاده می کنیم. در نهایت، ما این قطعات را برای محاسبه نمرات شباهت و ترکیب نامزدها با بالاترین امتیاز به عنوان اهداف جدید در فریم های فعلی، ترکیب می کنیم. آزمایش های گسترده در دوازده ترتیب ویدئویی به چالش کشیدن نشان می دهد که الگوریتم ما می تواند عملکرد رقابتی با ردیاب های پیشرفته ای را به دست آورد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
In visual tracking, the main problem is to find candidates that are most likely to be the target in successive frames, so it is important to design a proper mechanism to evaluate this. In this paper, we propose a novel sparse representation based visual tracking algorithm, which well integrates the temporal and spatial context information of tracking objects into a unified framework. Specifically, we compute the similarity between the target and its candidates, which is acquired by fusing three aspects of the target's appearance variation with different weights. For the first part, we apply a patch based sparse representation to measure the similarities between the target in the first frame and candidates in current frame. Since the tracking result in the last frame provides the latest variation information of the target, we employ an image quality assessment method to obtain the similarity scores in the second part, and the spatial context information is also exploited. As the target appearance may suffer from radical changes along the video sequence, tracking that only uses the two parts mentioned above will suffer from serious drifting problems and easily cause incorrect tracking results. In order to ease this problem, we exploit the temporal context information by generating a group of history target templates adaptively according to previous tracking results, computing similarities between each candidate with them and the maximum will be used in the third part. Finally, we combine these parts to calculate the similarity scores and take those candidates with the highest score as the new targets in current frames. The extensive experiments on twelve challenging video sequences show that our algorithm can achieve performance competitive with state-of-the-art trackers.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 225, 15 February 2017, Pages 92-102
نویسندگان
, , , , , , ,