کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
485441 | 703327 | 2016 | 6 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
A Temporal Coherence Loss Function for Learning Unsupervised Acoustic Embeddings
ترجمه فارسی عنوان
تابع از دست دادن انسجام زمانی برای آموزش درونه گیریهای صوتی بدون نظارت
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
آموزش بدون نظارت؛ تعبیر سخنرانی؛ تشخیص گفتار؛ انسجام زمانی؛ چالش سخنرانی با منابع صفر؛ استخراج ویژگی
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
علوم کامپیوتر (عمومی)
چکیده انگلیسی
We train neural networks of varying depth with a loss function which imposes the output representations to have a temporal profile which looks like that of phonemes. We show that a simple loss function which maximizes the dissimilarity between near frames and long distance frames helps to construct a speech embedding that improves phoneme discriminability, both within and across speakers, even though the loss function only uses within speaker information. However, with too deep an architecture, this loss function yields overfitting, suggesting the need for more data and/or regularization.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Procedia Computer Science - Volume 81, 2016, Pages 95–100
Journal: Procedia Computer Science - Volume 81, 2016, Pages 95–100
نویسندگان
Gabriel Synnaeve, Emmanuel Dupoux,