کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6951566 1451693 2015 13 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Interpretable parametric voice conversion functions based on Gaussian mixture models and constrained transformations
ترجمه فارسی عنوان
توابع تبدیل صوتی پارامتری قابل تعریف بر اساس مدل های مخلوط گاوسی و تحولات محدود
کلمات کلیدی
تبدیل صدا، مدل مخلوط گاوسی، انحراف فرکانس، مقیاس امپدانس، شیب طیفی،
ترجمه چکیده
توابع تبدیل صوتی بر اساس مدل های مخلوط گاوس و بیانات سیگنال پارامتریک مبهم هستند به این معنا که تفسیر معنای فیزیکی پارامترهای تبدیل آسان نیست. به دنبال خط کارهای اخیر براساس پارادایم شبیه سازی پارامترهای دامنه فرکانس به کار می رود، در این مقاله نشان می دهیم که توابع تبدیل صدا می توانند براساس محدودیت های جسمی معنی دار طراحی شوند به طوری که بسیار آموزنده باشند. روش تبدیل صدای حاصل می تواند برای تجسم تفاوت بین منبع و صدای هدف یا سبک از لحاظ موقعیت فرمن در فرکانس، شیب طیفی و دامنه در تعدادی از نوارهای طیف استفاده شود.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر پردازش سیگنال
چکیده انگلیسی
Voice conversion functions based on Gaussian mixture models and parametric speech signal representations are opaque in the sense that it is not straightforward to interpret the physical meaning of the conversion parameters. Following the line of recent works based on the frequency warping plus amplitude scaling paradigm, in this article we show that voice conversion functions can be designed according to physically meaningful constraints in such manner that they become highly informative. The resulting voice conversion method can be used to visualize the differences between source and target voices or styles in terms of formant location in frequency, spectral tilt and amplitude in a number of spectral bands.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computer Speech & Language - Volume 30, Issue 1, March 2015, Pages 3-15
نویسندگان
, , , , ,