کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6958919 1451947 2016 6 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Multimodal video classification with stacked contractive autoencoders
ترجمه فارسی عنوان
طبقه بندی ویدئویی چندجملهای با انعطاف پذیری خودکار انقباضی
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر پردازش سیگنال
چکیده انگلیسی
In this paper we propose a multimodal feature learning mechanism based on deep networks (i.e., stacked contractive autoencoders) for video classification. Considering the three modalities in video, i.e., image, audio and text, we first build one Stacked Contractive Autoencoder (SCAE) for each single modality, whose outputs will be joint together and fed into another Multimodal Stacked Contractive Autoencoder (MSCAE). The first stage preserves intra-modality semantic relations and the second stage discovers inter-modality semantic correlations. Experiments on real world dataset demonstrate that the proposed approach achieves better performance compared with the state-of-the-art methods.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Signal Processing - Volume 120, March 2016, Pages 761-766
نویسندگان
, , ,