کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4969926 1449983 2017 29 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Are all objects equal? Deep spatio-temporal importance prediction in driving videos
ترجمه فارسی عنوان
آیا تمام اشیاء برابر هستند؟ پیش بینی اهمیت فضایی و زمانی عمیق در فیلم های رانندگی
کلمات کلیدی
ترجمه چکیده
درک کردن هدف و ارتباط عوامل محیطی از طریق ویدئو، وظیفه اساسی بسیاری از برنامه های کاربردی در رباتیک و دید رایانه است. مدل سازی و ارزیابی آگاهی وضعیت موقتی، فضایی و زمانی به ویژه در زمینه وسایل نقلیه هوشمند اهمیت دارد که در آن یک ربات نیاز به هماهنگی حرکت در یک محیط پیچیده و در عین حال تعامل با انسان ها دارد. در این مقاله، ما با بررسی این وظیفه رتبه بندی اهمیت جاده در جاده از ویدیو به این مسائل می پردازیم. اولا، حاشیه نویسی اهمیت اهداف انسانی به منظور تحلیل ارتباط چندین مدال برای اهمیت پیش بینی اهمیت استفاده می شود. یک مدل شبکه عصبی کانولوشن عمیق برای ضبط کردن نشانه های فضایی و زمانی محتوا از نوع صحنه، کار رانندگی و خواص شیء مربوط به هدف مورد استفاده قرار می گیرد. دوم، حاشیه نویسی اهمیت پیشنهادی برای تولید تحلیل های جدید از انواع خطا در آشکارسازهای شیء مبتنی بر تصویر استفاده می شود. به طور خاص، ما نشان می دهیم که چگونه آموزش هزینه های حساس، با توجه به حاشیه نویسی اهمیت هدف، موجب بهبود عملکرد تشخیص در اهداف مهم می شود. این بینش برای یک برنامه کاربردی که خطاهای ناوبری ایمنی حیاتی است ضروری است و کیفیت اتوماسیون و روابط متقابل انسان مهم است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
Understanding intent and relevance of surrounding agents from video is an essential task for many applications in robotics and computer vision. The modeling and evaluation of contextual, spatio-temporal situation awareness is particularly important in the domain of intelligent vehicles, where a robot is required to smoothly navigate in a complex environment while also interacting with humans. In this paper, we address these issues by studying the task of on-road object importance ranking from video. First, human-centric object importance annotations are employed in order to analyze the relevance of a variety of multi-modal cues for the importance prediction task. A deep convolutional neural network model is used for capturing video-based contextual spatial and temporal cues of scene type, driving task, and object properties related to intent. Second, the proposed importance annotations are used for producing novel analysis of error types in image-based object detectors. Specifically, we demonstrate how cost-sensitive training, informed by the object importance annotations, results in improved detection performance on objects of higher importance. This insight is essential for an application where navigation mistakes are safety-critical, and the quality of automation and human-robot interaction is key.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Pattern Recognition - Volume 64, April 2017, Pages 425-436
نویسندگان
, ,