کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
485441 703327 2016 6 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A Temporal Coherence Loss Function for Learning Unsupervised Acoustic Embeddings
ترجمه فارسی عنوان
تابع از دست دادن انسجام زمانی برای آموزش درونه گیری‌های صوتی بدون نظارت
کلمات کلیدی
آموزش بدون نظارت؛ تعبیر سخنرانی؛ تشخیص گفتار؛ انسجام زمانی؛ چالش سخنرانی با منابع صفر؛ استخراج ویژگی
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر علوم کامپیوتر (عمومی)
چکیده انگلیسی

We train neural networks of varying depth with a loss function which imposes the output representations to have a temporal profile which looks like that of phonemes. We show that a simple loss function which maximizes the dissimilarity between near frames and long distance frames helps to construct a speech embedding that improves phoneme discriminability, both within and across speakers, even though the loss function only uses within speaker information. However, with too deep an architecture, this loss function yields overfitting, suggesting the need for more data and/or regularization.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Procedia Computer Science - Volume 81, 2016, Pages 95–100
نویسندگان
, ,