کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
9952412 1451674 2019 41 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Efficient estimation and model generalization for the total variability model
ترجمه فارسی عنوان
برآورد کارایی و تعمیم مدل برای مدل متغیر کل
ترجمه چکیده
تعدادی از برنامه های پردازش سیگنال های صوتی مشخصه های مختلف منبع منبع سیگنال صوتی را با تحلیل توزیع یک دنباله از بردارهای ویژگی که از سیگنال به دست می آید، مشخص می کنند. مدل متغیر متغیر به طور گسترده ای برای این منظور به عنوان یک مکانیزم برای تطبیق تنوع در توزیع بردار ویژگی در میان سیگنال های مختلف در نمایندگی کم ابژه مورد استفاده قرار گرفته است. برای رسیدن به یک نمایش جمع و جور، تعدادی از مفروضات درون مدل در مورد خواص این توزیع ساخته شده است. در این مقاله ابتدا تحلیل روش پیش بینی پارامتر را برای مدل ارائه می دهیم که جایگزین الگوریتم به حداکثر رساندن انتظارات به طور گسترده ای مورد استفاده قرار می گیرد اما بر پایه فرضیه های مدل، با استفاده از آزمایشات بر بلندگو و زبان وظایف شناسایی برای توضیح برخی از نتایج به دست آمده با استفاده از این روش، ما یک تحلیل آماری گسترده را با هدف تایید اعتبار بعضی از مفروضات مدل ارائه می کنیم. ما نشان می دهیم که بسیاری از این فرضیه های مدل برای داده های مشاهده شده معتبر نیستند و تعمیم مدل ها را برای جایگزینی این فرضیه ها پیشنهاد می کنند. تعاریف پیشنهادی منجر به عملکرد بهتر می شود در حالیکه امکاناتی برای آموزش تبعیض آمیز مدل نیز فراهم شده است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر پردازش سیگنال
چکیده انگلیسی
A number of audio signal processing applications characterize different properties of the source underlying an audio signal by analyzing the distribution of a sequence of feature vectors obtained from the signal. The Total Variability Model has been widely used for this purpose as a mechanism for capturing the variability in the feature vector distribution across different signals within a low dimensional representation. In order to arrive at a compact representation, a number of assumptions are made within the model regarding the properties of this distribution. In this paper, we first present an analysis of a parameter estimation method for the model which offers a computationally efficient alternative to the widely used Expectation Maximization (EM) algorithm, but relies on the validity of the model assumptions, using experiments on speaker and language identification tasks. To explain some of the results obtained using this method, we present an extensive statistical analysis aimed at verifying the validity of some of the model assumptions. We show that many of these model assumptions are not valid for the observed data, and propose model generalizations to replace these assumptions. The proposed generalizations lead to a better performance while also opening up possibilities for discriminative training of the model.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computer Speech & Language - Volume 53, January 2019, Pages 43-64
نویسندگان
, ,