کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4977823 1452011 2017 10 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Two-pitch tracking in co-channel speech using modified group delay functions
ترجمه فارسی عنوان
ردیابی دو ردیف در گفتار کانال با استفاده از توابع تاخیری گروه تغییر یافته
کلمات کلیدی
طیف قدرت، تأخیر گروه اصلاح شده، فیلتر شکن برآورد طیف،
ترجمه چکیده
توابع تاخیری گروه تغییر یافته در مقیاس برای برآورد فرمن، تشخیص سخنران و تشخیص گفتار شروع به کسب اهمیت در ادبیات می کنند. به طور خاص، توابع تاخیر گروه دارای ویژگی است که آنها دارای وضوح بالاتر نسبت به طیف قدر است. در این مقاله توابع تاخیری گروه اصلاح شده برای تخمین و ردیابی دو نقطه در گفتار همزمان مورد استفاده قرار می گیرند. طیف قدرت سیگنال گفتار ابتدا برای تخریب ویژگی های سیستم، در حالی که حفظ ویژگی های منبع، مسطح می شود. تجزیه و تحلیل تاخیر گروهی از طیف مسطح انجام شده و زمین محاسبه می شود. بعد، یک فیلتر شانه طراحی شده برای حذف زمین غالب و هماهنگی آن از طیف تاخیر گروهی است. طیف باقی مانده مجددا به تجزیه و تحلیل تاخیر گروهی اعمال می شود و زمین بعدی بعدی دوباره با استفاده از پردازش تاخیری گروه تغییر می شود. مسیرهای مسیر اول و دوم با استفاده از پردازش پست تصحیح می شوند. عملکرد الگوریتم پیشنهادی در دو مجموعه داده ها با استفاده از دو معیار سنجش شد. دقت زمین و انحراف معیار خط خطی خوب. نتایج ما نشان می دهد که پردازش بر پایه فاز در قبال برآورد چند پیکه وعده داده می شود.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر پردازش سیگنال
چکیده انگلیسی
Modified group delay functions are beginning to gain significance in the literature for formant estimation, speaker recognition and speech recognition. In particular, group delay functions have the property that they possess higher resolution compared to that of the magnitude spectrum. In this paper, modified group delay functions are used for the estimation and tracking of two pitches in concurrent speech. The power spectrum of the speech signal is first flattened to annihilate the system characteristics, while retaining the source characteristics. Group delay analysis of the flattened spectrum is performed and the predominant pitch is computed. Next, a comb filter is designed to remove the predominant pitch and its harmonics from the group delay spectrum. The residual spectrum is again subjected to group delay analysis and the next candidate pitch is again estimated using modified group delay processing. The first and second pass pitch trajectories are corrected using post processing. The performance of the proposed algorithm was evaluated on two datasets using two metrics; pitch accuracy and standard deviation of fine pitch error. Our results show that phase based processing holds promise in the context of multipitch estimation.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Speech Communication - Volume 89, May 2017, Pages 37-46
نویسندگان
, ,