کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6939679 1449972 2018 37 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Topic driven multimodal similarity learning with multi-view voted convolutional features
ترجمه فارسی عنوان
یادگیری شباهت های چندجمله ای با موضوع با ویژگی های کانولوشه ای منتخب چند نمایشه موضوعی است
ترجمه چکیده
یادگیری شباهت (و متریک فاصله) نقش بسیار مهمی را در بسیاری از وظایف هوش مصنوعی ایفا می کند که هدف آنها اندازه گیری ارتباط بین اشیاء است. ما در مورد چالش یادگیری الگوهای ارتباط پیچیده از اشیاء داده ها که ویژگی های ناهمگونی را نشان می دهند، درک می کنیم و مدل یادگیری چندملیتی چندمتغیره موثر با عملکرد بسیار بهبود یافته یادگیری و تفسیرپذیری مدل را ایجاد می کنیم. روش پیشنهادی ابتدا محاسبات چند بعدی را برای دستیابی به بهبود نمایه شیء محاسبه می کند و سپس شباهت بین اشیا را با کارکردن بر انواع مختلف ارتباطات پنهان (روش ها) تجزیه و تحلیل می کند و در نهایت تمام متغیرهای مدل را با استفاده از عقب نشاندگی از دست دادن رتبه بندی لایه های کانولوشن ما یک طرح اولیه سازی موضوع را هدایت می کنیم، به طوری که هر نوع ارتباط یاد شده می تواند به عنوان یک نماینده از مفهوم معنایی اشیا تفسیر شود. برای بهبود تفسیرپذیری و تعمیم مدل، اسپارتی بر روی این روابط پنهان تحمیل شده است. روش پیشنهادی با حل وظیفه بازیابی تصویر با استفاده از مجموعه داده های تصویری چالش برانگیز مورد بررسی قرار می گیرد و با هفت الگوریتم های پیشرفته در این زمینه مقایسه می شود. نتایج تجربی نشان دهنده بهبود عملکرد قابل توجهی از روش پیشنهادی بر روی رقابت است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
Similarity (and distance metric) learning plays a very important role in many artificial intelligence tasks aiming at quantifying the relevance between objects. We address the challenge of learning complex relation patterns from data objects exhibiting heterogeneous properties, and develop an effective multi-view multimodal similarity learning model with much improved learning performance and model interpretability. The proposed method firstly computes multi-view convolutional features to achieve improved object representation, then analyses the similarities between objects by operating over multiple hidden relation types (modalities), and finally fine-tunes the entire model variables via back-propagating a ranking loss to the convolutional layers. We develop a topic-driven initialization scheme, so that each learned relation type can be interpreted as a representative of semantic topics of the objects. To improve model interpretability and generalization, sparsity is imposed over these hidden relations. The proposed method is evaluated by solving the image retrieval task using challenging image datasets, and is compared with seven state-of-the-art algorithms in the field. Experimental results demonstrate significant performance improvement of the proposed method over the competing ones.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Pattern Recognition - Volume 75, March 2018, Pages 223-234
نویسندگان
, , , ,