کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6952057 1451737 2015 5 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Spectrum enhancement with sparse coding for robust speech recognition
ترجمه فارسی عنوان
افزایش طیف با برنامه نویسی ضعیف برای تشخیص گفتار قوی
کلمات کلیدی
برنامه نویسی انعطاف پذیر، سخن گفتن، سر و صدای باقی مانده، تعقیب پایه پایانی،
ترجمه چکیده
به تازگی، یک روند تشخیص گفتار، معرفی کردن کدگذاری ضعیف برای قدرت صدا است. اگرچه چندین روش پیشنهادی ارائه شده است، عملکرد کدگذاری ضعیف در لغو گفتار، بسیار خوش بینانه نیست. یکی از مفروضات با برنامه نویسی ناقص این است که نمایش سخنرانی بیش از فرهنگ لغت سخنرانی ناقص است، در حالی که نویز، متراکم است. این فرض، واضح است که در سناریوی انعکاس سخنرانی مطرح نیست. بسیاری از سر و صدا نیز بیش از فرهنگ لغت سخنرانی است. در چنین شرایطی، نمایندگی از سخنان پر سر و صدای هنوز شامل اجزای سر و صدا است که منجر به عملکرد ضعیف شده است. برای حل این مشکل، ابتدا فرضیهی کدگذاری ضعیف را تحلیل میکنیم و سپس یک روش جدید برای افزایش طیف گفتار پیشنهاد میکنیم. این روش ابتدا اتم هایی را نشان می دهد که سر و صدای کمی دارند، و سپس به طور انتخابی آنها را در بازسازی گفتار به منظور کاهش سر و صدای باقی مانده نادیده می گیرد. سپس ویژگی های گفتاری از طیف افزایش یافته برای تشخیص گفتاری استخراج می شود. نتایج تجربی نشان می دهد که روش پیشنهادی می تواند پایداری نویز یک سیستم تشخیص گفتار را به طور قابل توجهی بهبود بخشد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر پردازش سیگنال
چکیده انگلیسی
Recently, a trend in speech recognition is to introduce sparse coding for noise robustness. Although several methods have been proposed, the performance of sparse coding in speech denoising is not so optimistic. One assumption with sparse coding is that the representation of speech over the speech dictionary is sparse, while that of the noise is dense. This assumption is obviously not sustained in the speech denoising scenario. Many noises are also sparse over the speech dictionary. In such a condition, the representation of noisy speech still contains noise components, resulting in degraded performance. To solve this problem, we first analyze the assumption of sparse coding and then propose a novel method to enhance speech spectrum. This method first finds out the atoms which represent the noise sparsely, and then selectively ignores them in the reconstruction of speech to reduce the residual noise. Speech features are then extracted from the enhanced spectrum for speech recognition. Experimental results show that the proposed method can improve the noise robustness of a speech recognition system substantially.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Digital Signal Processing - Volume 43, August 2015, Pages 59-70
نویسندگان
, , ,