کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
4957415 | 1445077 | 2017 | 16 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Unsupervised understanding of location and illumination changes in egocentric videos
ترجمه فارسی عنوان
فهم ناکارآمد از تغییرات محل و نور در فیلم های خودجوش
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
فراگیری ماشین، یادگیری بی نظیر، فیلم های اوجسنتریک، دید اول شخص دوربین قابل حمل
ترجمه چکیده
دوربین های پوشیدنی به عنوان یکی از دستگاه های امیدوار کننده در سال های آینده به نظر می رسد و به همین دلیل تقاضای الگوریتم های کامپیوتری برای به طور خودکار درک فیلم های ضبط شده با آنها به سرعت در حال افزایش است. فهم اتوماتیک از این فیلم ها کار ساده ای نیست و طبیعت همراه آن چالش های مهمی را در بر می گیرد، مانند شرایط تغییر نور و مکان های نامحدود ثبت شده. این مقاله یک استراتژی بی نظیر را بر اساس ویژگی های جهانی و یادگیری چند منظوره ارائه می دهد تا دوربین های پوشیدنی را با اطلاعات متنی در ارتباط با شرایط نور و موقعیت ضبط شده، به دست آورد. نتایج نشان می دهد که روش های چند منظوره غیر خطی می توانند الگوهای متنی را از ویژگی های جهانی بدون به خطر انداختن منابع محاسباتی بزرگ جذب کنند. استراتژی پیشنهادی به عنوان یک پرونده کاربردی به عنوان یک مکانیسم سوئیچینگ برای بهبود مشکل تشخیص دست در ویدیوهای انجیل، مورد استفاده قرار می گیرد.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
شبکه های کامپیوتری و ارتباطات
چکیده انگلیسی
Wearable cameras stand out as one of the most promising devices for the upcoming years, and as a consequence, the demand of computer algorithms to automatically understand the videos recorded with them is increasing quickly. An automatic understanding of these videos is not an easy task, and its mobile nature implies important challenges to be faced, such as the changing light conditions and the unrestricted locations recorded. This paper proposes an unsupervised strategy based on global features and manifold learning to endow wearable cameras with contextual information regarding the light conditions and the location captured. Results show that non-linear manifold methods can capture contextual patterns from global features without compromising large computational resources. The proposed strategy is used, as an application case, as a switching mechanism to improve the hand-detection problem in egocentric videos.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Pervasive and Mobile Computing - Volume 40, September 2017, Pages 414-429
Journal: Pervasive and Mobile Computing - Volume 40, September 2017, Pages 414-429
نویسندگان
Alejandro Betancourt, Natalia DÃaz-RodrÃguez, Emilia Barakova, Lucio Marcenaro, Matthias Rauterberg, Carlo Regazzoni,