کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6863918 1439529 2018 22 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Bayesian optimization on graph-structured search spaces: Optimizing deep multimodal fusion architectures
ترجمه فارسی عنوان
بهینه سازی بیزی برای فضاهای جستجوی گرافیک ساختاری: بهینه سازی معماری های ترکیبی عمیق چندجملهای
کلمات کلیدی
ترجمه چکیده
یک تست عمومی برای یادگیری عمیق شناخت چندجمله ای از فعالیت های انسان یا ژست شامل ورودی های متنوع مانند ویدئو، صدا، اسکلت و تصاویر عمقی بوده است. معماری های فراگیر در این زمینه به دلیل توانایی آنها در ترکیب تجارب مدلا در سطوح مختلف استخراج ویژگی های غیرخطی، از این مشکلات پیشی گرفته اند. با این حال، طراحی یک معماری بهینه که در آن به منظور جلوگیری از چنین بازنویسی آموخته شده است، عمدتا یک تلاش مهندسی انحصاری نیست. ما بهینه سازی ساختار فیوژن را به عنوان یک جستجوی فوق العاده پارامتر می پردازیم و آن را به عنوان یک مشکل بهینه سازی گسسته در چارچوب بهینه سازی بیزی می پردازیم. ما دو روش برای تخمین ساختارهای شباهت های ساختاری در فضای جستجو معماری های چندبخش ساختار درختی ارائه می دهیم و اثربخشی آنها را در دو مسئله تشخیص فعالیت های چندملیتی انسان چالش برانگیز نشان می دهد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
A popular testbed for deep learning has been multimodal recognition of human activity or gesture involving diverse inputs like video, audio, skeletal pose and depth images. Deep learning architectures have excelled on such problems due to their ability to combine modality representations at different levels of nonlinear feature extraction. However, designing an optimal architecture in which to fuse such learned representations has largely been a non-trivial human engineering effort. We treat fusion structure optimization as a hyperparameter search and cast it as a discrete optimization problem under the Bayesian optimization framework. We propose two methods to compute structural similarities in the search space of tree-structured multimodal architectures, and demonstrate their effectiveness on two challenging multimodal human activity recognition problems.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 298, 12 July 2018, Pages 80-89
نویسندگان
, , , , ,