کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6937669 869000 2016 17 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
On detecting the playing/non-playing activity of musicians in symphonic music videos
ترجمه فارسی عنوان
در تشخیص فعالیت های بازی / غیر بازی کردن نوازندگان در فیلم های موسیقی سمفونی
کلمات کلیدی
تجزیه و تحلیل متقابل، بازیابی اطلاعات موسیقی، تعامل انسانی، اسهال خوشه بندی
ترجمه چکیده
اطلاعاتی در مورد اینکه آیا یک موسیقیدان در یک ارکستر سمفونیک بزرگ در زمان مشخصی از دستگاه خود استفاده می کند یا نه، برای برنامه های متنوعی کاربرد دارد که برای تقلید و غنی سازی تجربه کنسرت موسیقی کلاسیک در سیستم عامل های چندرسانه ای مدرن است. در این کار، ما یک روش جدید برای تولید برچسب های بازی / نواختن در هر نوازنده در طول زمان با کارآمد و موثر ترکیب یک تجزیه و تحلیل خودکار ضبط ویدئو کنسرت سمفونیک و حاشیه نویسی انسان پیشنهاد می کنیم. به این ترتیب، ما در مورد کمبودهای ذاتی روشهای صوتی سنتی در مورد دسته های بزرگ و همچنین روش های استاندارد تشخیص عمل انسان مبتنی بر مدل های بصری، در معرض دید قرار می گیریم. پتانسیل رویکرد ما در دو ویدیو کنسرت نمایشی (حدود 7 ساعت محتوا) با استفاده از یک نمره موسیقی نمادین هماهنگ شده به عنوان حقیقت زمین نشان داده شده است. به منظور شناسایی چالش های باز و محدودیت های روش پیشنهادی، ما بررسی دقیقی از نحوه عملکرد ماژول های مختلف سیستم را بررسی می کنیم.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
Information on whether a musician in a large symphonic orchestra plays her instrument at a given time stamp or not is valuable for a wide variety of applications aiming at mimicking and enriching the classical music concert experience on modern multimedia platforms. In this work, we propose a novel method for generating playing/non-playing labels per musician over time by efficiently and effectively combining an automatic analysis of the video recording of a symphonic concert and human annotation. In this way, we address the inherent deficiencies of traditional audio-only approaches in the case of large ensembles, as well as those of standard human action recognition methods based on visual models. The potential of our approach is demonstrated on two representative concert videos (about 7 hours of content) using a synchronized symbolic music score as ground truth. In order to identify the open challenges and the limitations of the proposed method, we carry out a detailed investigation of how different modules of the system affect the overall performance.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computer Vision and Image Understanding - Volume 144, March 2016, Pages 188-204
نویسندگان
, , ,