کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
10326387 | 678070 | 2016 | 47 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Optimization of learned dictionary for sparse coding in speech processing
ترجمه فارسی عنوان
بهینه سازی فرهنگ لغت یادگیری برای برنامه نویسی ضعیف در پردازش گفتار
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
برنامه نویسی انعطاف پذیر، سخن گفتن، تشخیص گفتار، بهینه سازی فرهنگ لغت،
ترجمه چکیده
به عنوان یک روش امیدوار کننده، برنامه نویسی ضعیف به طور گسترده ای برای تحلیل، نمایندگی، فشرده سازی، انهدام و جداسازی گفتار مورد استفاده قرار می گیرد. این تکنیک نیاز به یک فرهنگ لغت خوب دارد که شامل اتم ها برای نشان دادن سیگنال های گفتاری است. اگرچه بسیاری از روش ها برای یادگیری چنین فرهنگ لغت پیشنهاد شده است، هنوز دو مشکل وجود دارد. اولا، اتم های بی اهمیت یک بار محاسباتی سنگین را برای تجزیه و تجزیه و تحلیل ضعیف و بازسازی فراهم می کنند که از برنامه نویسی ضعیف از برنامه زمان واقعی جلوگیری می کند. دوم، در انحلال گفتار و جداسازی، اتم های مضر هیچ مشکلی یا نادیده انگاری برای کاهش درجه انعکاس ندارند، اما سردرگمی منبع را افزایش می دهند که موجب اعوجاج شدید می شود. برای حل این دو مشکل ابتدا فرضیه های ذاتی برنامه نویسی را بررسی می کنیم و نشان می دهیم که اگر فرض ها درست نباشد، اعوجاج می تواند رخ دهد. سپس، ما دو روش برای بهینه سازی یک فرهنگ لغت داده شده با حذف از اتم های غیر مهم و اتم های مضر پیشنهاد می کنیم. آزمایش ها نشان می دهد که روش های پیشنهادی می توانند عملکرد لغت نامه ها را بهبود بخشند.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
هوش مصنوعی
چکیده انگلیسی
As a promising technique, sparse coding has been widely used for the analysis, representation, compression, denoising and separation of speech. This technique needs a good dictionary which contains atoms to represent speech signals. Although many methods have been proposed to learn such a dictionary, there are still two problems. First, unimportant atoms bring a heavy computational load to sparse decomposition and reconstruction, which prevents sparse coding from real-time application. Second, in speech denoising and separation, harmful atoms have no or ignorable contributions to reducing the sparsity degree but increase the source confusion, resulting in severe distortions. To solve these two problems, we first analyze the inherent assumptions of sparse coding and show that distortion can be caused if the assumptions do not hold true. Next, we propose two methods to optimize a given dictionary by removing unimportant atoms and harmful atoms, respectively. Experiments show that the proposed methods can further improve the performance of dictionaries.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 173, Part 3, 15 January 2016, Pages 471-482
Journal: Neurocomputing - Volume 173, Part 3, 15 January 2016, Pages 471-482
نویسندگان
Yongjun He, Guanglu Sun, Jiqing Han,