کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4969888 1449979 2017 40 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Enhanced skeleton visualization for view invariant human action recognition
ترجمه فارسی عنوان
تجسم اسکلت بهبود یافته برای مشاهده تشخیص عمل غیر انسانی
کلمات کلیدی
تشخیص عملیات انسانی، مشاهده غیر متناوب، دنباله اسکلت،
ترجمه چکیده
شناخت عملکرد انسان براساس اسکلت ها، کاربرد گسترده ای در تعامل انسان و کامپیوتر و نظارت هوشمند دارد. با این حال، مشاهده تغییرات و داده های پر سر و صدا باعث می شود چالش های این کار. علاوه بر این، مشکل به طور موثر نشان دادن توالی های اسکلت فضایی و زمانی است. برای حل این مشکلات در یک هدف، این کار روش پیشرفته اسکلت را برای مشاهده تشخیص عملی غیر انسانی ارائه می دهد. روش ما شامل سه مرحله است. در ابتدا، یک تغییر غیرمستقیم از دیدگاه مبتنی بر دنباله، برای از بین بردن اثر تغییرات دید در مکان های فضایی-زمانی در مفصل اسکلت ایجاد شده است. دوم، اسکلت های تبدیل شده به عنوان یک سری از تصاویر رنگی تجسم می شوند که به طور ضمنی اطلاعات مکانی و زمانی مربوط به مفاصل اسکلت را رمزگذاری می کند. علاوه بر این، روش های بهبود بصری و حرکتی بر روی تصاویر رنگی برای بهبود الگوهای محلی خود اعمال می شود. سوم، مدل مبتنی بر شبکه عصبی کانولوشه ای است که برای استخراج ویژگی های قوی و متنوع از تصاویر رنگی به کار می رود. نمرات کلاس نهایی از طریق هماهنگی تصمیم گیری از ویژگی های عمیق تولید می شود. آزمایش های گسترده در چهار مجموعه داده های چالش برانگیز، برتری روش ما را نشان می دهد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
Human action recognition based on skeletons has wide applications in human-computer interaction and intelligent surveillance. However, view variations and noisy data bring challenges to this task. What's more, it remains a problem to effectively represent spatio-temporal skeleton sequences. To solve these problems in one goal, this work presents an enhanced skeleton visualization method for view invariant human action recognition. Our method consists of three stages. First, a sequence-based view invariant transform is developed to eliminate the effect of view variations on spatio-temporal locations of skeleton joints. Second, the transformed skeletons are visualized as a series of color images, which implicitly encode the spatio-temporal information of skeleton joints. Furthermore, visual and motion enhancement methods are applied on color images to enhance their local patterns. Third, a convolutional neural networks-based model is adopted to extract robust and discriminative features from color images. The final action class scores are generated by decision level fusion of deep features. Extensive experiments on four challenging datasets consistently demonstrate the superiority of our method.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Pattern Recognition - Volume 68, August 2017, Pages 346-362
نویسندگان
, , ,