کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4977812 1452013 2017 52 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
An acoustically-driven vocal tract model for stop consonant production
ترجمه فارسی عنوان
یک مدل صوتی آوازی برای تولید محصولات همخوان
کلمات کلیدی
ترجمه چکیده
هدف از این مطالعه، توسعه یک مدل چند سطحی از عملکرد منطقه صوتی است که در آن مدولاسیون شکل به تولید گفتار تولید شده توسط محصول یک بستر واکه و یک تابع فوق العاده همگانی است. رویکرد جدید شامل مشخص کردن پارامترهای ورودی برای همخونی هدف به عنوان مجموعه ای از تغییرات جهت در فرکانس های رزونانس بستر واکه است. با استفاده از محاسبات توابع حساسیت صوتی، این الگوریتم انحراف رزونانس؟ به شکل تغییرات زمانی مختلف از شکل صوتی آوازی تبدیل می شوند بدون هیچ گونه مشخصی مستقیم از موقعیت یا میزان انقباض همخوان در طول دستگاه صوتی. پیکربندی محدودیت ها و انبساط هایی که توسط این فرآیند تولید می شود، به صورت فیزیولوژیکی واقع گرایانه و صداهای گفتاری ایجاد می شود که به راحتی قابل تشخیص هستند. این مدل یک پیشرفت مفید برای سنتز مبتنی بر عملکرد منطقه است و می تواند به عنوان یک ابزار برای درک نحوه ایجاد صدا توسط یک گفتگو در تولید گفتار شکل بگیرد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر پردازش سیگنال
چکیده انگلیسی
The purpose of this study was to further develop a multi-tier model of the vocal tract area function in which the modulations of shape to produce speech are generated by the product of a vowel substrate and a consonant superposition function. The new approach consists of specifying input parameters for a target consonant as a set of directional changes in the resonance frequencies of the vowel substrate. Using calculations of acoustic sensitivity functions, these “resonance deflection patterns” are transformed into time-varying deformations of the vocal tract shape without any direct specification of location or extent of the consonant constriction along the vocal tract. The configuration of the constrictions and expansions that are generated by this process were shown to be physiologically-realistic and produce speech sounds that are easily identifiable as the target consonants. This model is a useful enhancement for area function-based synthesis and can serve as a tool for understanding how the vocal tract is shaped by a talker during speech production.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Speech Communication - Volume 87, March 2017, Pages 1-17
نویسندگان
, ,