کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4948627 1439619 2016 22 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Spatial and temporal scoring for egocentric video summarization
ترجمه فارسی عنوان
نمره فضایی و زمانی برای خلاصه فیلم های انسانی
کلمات کلیدی
فیلم های اوجسنتریک، خلاصه فیلم، برنامه نویسی انعطاف پذیر،
ترجمه چکیده
ما یک رویکرد خلاصه ای برای ویدیوی خودکشی ارائه می دهیم. با توجه به ساعتهای ویدئویی، روش پیشنهادی، خلاصه ای از روزنامه نگار را تهیه می کند. بر خلاف تکنیک های انتخاب سنتی کلیدی، خلاصه ای که به دست می آید بر روی مهم ترین فیلم های ویدئویی تمرکز می کند که منعکس کننده و قابل قبول بودن بالا، تبعیض و نمایندگی است. برای رسیدن به این هدف، ما از نشانه های شخصیت های احساسی، نشانه های حرکتی و یک مدل انتخاب برای جمع آوری وزن قابل توجهی، وزن تشخیصی و وزن نمایه فیلم ویدئویی استفاده می کنیم. ما این وزنها را در چهارچوب یکپارچه ترکیب می کنیم تا امتیاز اهمیت شات را پیش بینی کنیم، که بر اساس آن، عکس های مهم برای نمایشنامه انتخاب می شوند. به طور کثیری، این رویکرد، نه خاصیت خاص دوربین و نه خاصیت خاص است. این بدان معنی است که متریک اهمیت آموخته شده برای یک کاربر یا زمینه خاص آموزش داده نمی شود و می تواند اهمیت عکس هایی را که قبلا دیده نشده است، پیش بینی کند. نتایج تجربی در سه مجموعه داده های ویدئویی در سراسر ژانرهای مختلف نشان می دهد که رویکرد پیشنهاد ما به روشنی از چندین روش پیشرفته پیشرفته تر است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
We present a summarization approach for egocentric video. Given hours of video, the proposed method produces a compact storyboard summary of the camera wearer's day. In contrast to traditional keyframe selection techniques, the resulting summary focuses on the most important video shots which reflect high stable salience, discrimination and representativeness. To accomplish this, we utilize egocentric salience cues, motion cues and a selection model to capture stable salience weight, discriminative weight and representative weight of a video shot respectively. We further combine these weights in a unified framework to predict the importance score of a shot, based on which, important shots are selected for the storyboard. Critically, the approach is neither camera-wearer-specific nor object-specific; that means the learned importance metric need not be trained for a given user or context, and it can predict the importance of shots that have never been seen previously. Experimental results on three video datasets across various genres demonstrate that our proposed approach clearly outperforms several state-of-the-art methods.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 208, 5 October 2016, Pages 299-308
نویسندگان
, , , , , ,