کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
10359459 869247 2014 8 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Automatic annotation of tennis games: An integration of audio, vision, and learning
ترجمه فارسی عنوان
حاشیه نویسی خودکار از بازی های تنیس: یکپارچه سازی صدا، دید و یادگیری
کلمات کلیدی
حاشیه نویسی تنیس، ردیابی شی، طبقه بندی رویداد صوتی، برچسب زدن، یادگیری خروجی ساختاری مدل مخفی مارکف،
ترجمه چکیده
حاشیه نویسی کاملا اتوماتیک از بازی تنیس با استفاده از پخش ویدئویی یک کار با یک پتانسیل بزرگ است، اما با چالش های عظیم. در این مقاله رویکرد ما به این کار را شرح می دهیم که دیدگاه کامپیوتر، گوش دادن به دستگاه و یادگیری ماشین را هماهنگ می کند. در پردازش سطح پایین، ما بر اساس الگوریتم ردیابی بالانس تنیس که اخیرا پیشنهاد شده ای از پیشرفته تنیس طراحی کرده ایم و تکنیک های پردازش سیگنال های صوتی را برای تشخیص رویدادهای کلیدی و ویژگی های ساختن برای طبقه بندی رویدادها استفاده می کنیم. در تجزیه و تحلیل سطح بالا، طبقه بندی رویداد را به عنوان یک مسئله نشانه گذاری توزیع مدل سازی می کنیم و چهار روش یادگیری ماشین را با استفاده از توالی های شبیه سازی شده بررسی می کنیم. سرانجام، رویکرد پیشنهادی ما را در سه بازی تنیس واقعی واقعی ارزیابی می کنیم و در مورد تعامل بین صوتی، بینایی و یادگیری بحث می کنیم. به عقیده ما، سیستم ما تنها کسی است که می تواند بازی تنیس را در چنین سطحی دقیق توضیح دهد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
Fully automatic annotation of tennis game using broadcast video is a task with a great potential but with enormous challenges. In this paper we describe our approach to this task, which integrates computer vision, machine listening, and machine learning. At the low level processing, we improve upon our previously proposed state-of-the-art tennis ball tracking algorithm and employ audio signal processing techniques to detect key events and construct features for classifying the events. At high level analysis, we model event classification as a sequence labelling problem, and investigate four machine learning techniques using simulated event sequences. Finally, we evaluate our proposed approach on three real world tennis games, and discuss the interplay between audio, vision and learning. To the best of our knowledge, our system is the only one that can annotate tennis game at such a detailed level.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Image and Vision Computing - Volume 32, Issue 11, November 2014, Pages 896-903
نویسندگان
, , , , , , ,