کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4968807 1449743 2017 15 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Understanding and localizing activities from correspondences of clustered trajectories
ترجمه فارسی عنوان
درک و فعالیت محلی سازی از متناسب با مسیرهای خوشه ای
کلمات کلیدی
تشخیص عمل، محلی سازی عمل، تجزیه و تحلیل ورزشی،
ترجمه چکیده
ما یک رویکرد برای شناسایی فعالیت های انسانی بر اساس گروه بندی مسیر را ارائه می دهیم. نمایندگی ما اجازه می دهد تا تطبیق جزئی بین فیلم ها را به دست آورد که یک اندازه شباهت قوی دارند. این رویکرد در فیلم های ورزشی بسیار مفید است که در آن فعالیت های مختلف درگیر فعالیت های مختلف هستند. بسیاری از آثار موجود، تشخیص شخص، ردیابی را انجام می دهند و اغلب به کالیبراسیون دوربین نیاز دارند تا حرکت و تصویر هر بازیکن و شی در صحنه را استخراج کند. در این کار، ما بر این محدودیت ها غلبه می کنیم و رویکردی را پیشنهاد می کنیم که از ساختار فضایی و زمانی یک ویدیو بهره می برد و ویژگی های فضایی و زمانی محلی را بی نظیر دسته بندی می کند. نمایندگی قوی ما می تواند اندازه گیری شبیه سازی ویدئو ایجاد متناسب بین الگوهای دلخواه. ما نشان می دهیم که چگونه می توان خوشه های ما را برای تهیه پیشنهادهای عملی فزیکی استفاده کرد. ما از پیشنهادات برای بهبود نمایندگی ما برای مکان و تشخیص استفاده می کنیم. ما روش ما را بر روی داده های گزارش داده فعالیت های ویژه و عمومی ورزش تست گزارش نتایج بالاتر از حالت فعلی در حال حاضر.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
We present an approach for human activity recognition based on trajectory grouping. Our representation allows to perform partial matching between videos obtaining a robust similarity measure. This approach is extremely useful in sport videos where multiple entities are involved in the activities. Many existing works perform person detection, tracking and often require camera calibration in order to extract motion and imagery of every player and object in the scene. In this work we overcome this limitations and propose an approach that exploits the spatio-temporal structure of a video, grouping local spatio-temporal features unsupervisedly. Our robust representation allows to measure video similarity making correspondences among arbitrary patterns. We show how our clusters can be used to generate frame-wise action proposals. We exploit proposals to improve our representation further for localization and recognition. We test our method on sport specific and generic activity dataset reporting results above the existing state-of-the-art.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computer Vision and Image Understanding - Volume 159, June 2017, Pages 128-142
نویسندگان
, , ,