کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6959374 1451957 2015 12 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
An audio-visual human attention analysis approach to abrupt change detection in videos
ترجمه فارسی عنوان
یک روش تجزیه و تحلیل توجه رسانه های صوتی و تصویری به تشخیص تغییرات ناگهانی در فیلم ها
کلمات کلیدی
تعجب بیسین، تشخیص تغییرات ناگهانی، بی نظیر، صوتی و تصویری، همزمان زمان،
ترجمه چکیده
تغییرات ناگهانی در فیلم ها، مانند اجرای ناگهانی، معمولا رویدادهای غیر طبیعی را نشان می دهند و نقش مهمی در جذب توجه انسان ایفا می کنند. ما یک رویکرد برای شناسایی تغییرات ناگهانی در فیلم ها بر اساس نظریه تعجب بیسین ارائه می دهیم که هر دو روش بصری و صوتی را در نظر می گیرد. به طور خاص، پس از ایجاد منحنی های شگفت انگیز از روش های صوتی و تصویری، یک دنباله هماهنگ شده بر اساس زمان همگام سازی بین سری های صوتی و تصویری در فیلم ها به دست می آوریم. این رویکرد به طور کامل خودکار شده و هیچ اطلاعات پیشین نیازی ندارد. نتایج تجربی از آزمایشات بر رفتار انسان و مجموعه داده های ویدیویی طبیعی صحنه نشان می دهد که روش پیشنهادی قادر به تشخیص تغییرات ناگهانی مانند درگیری ناگهانی یا فروپاشی یک شی است. رویکرد پیشنهادی بیشتر بر روی تمام داده های جمع آوری شده ما ارزیابی می شود.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر پردازش سیگنال
چکیده انگلیسی
Abrupt changes in videos, such as sudden running, usually indicate abnormal events and play a significant role in attracting human attention. We propose an approach to detect abrupt changes in videos based on Bayesian surprise theory, which considers both visual and audio modalities. Specifically, after generating surprise curves from the audio and visual modalities, we obtain a synchronized sequence based on the time-synchrony between audio-visual series in videos. The approach is fully automated and does not require any prior information. Experimental results from tests on human behavior and natural scene video datasets demonstrate that the proposed method is able to detect abrupt changes like sudden running or the collapse of an object. The proposed approach is further evaluated on the entire dataset we collected.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Signal Processing - Volume 110, May 2015, Pages 143-154
نویسندگان
, , , , ,