کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
10368531 | 874807 | 2014 | 29 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
The listening talker: A review of human and algorithmic context-induced modifications of speech
ترجمه فارسی عنوان
سخنران گوش دادن: بازبینی تغییرات گفتاری انسان و الگوریتمی ناشی از زمینه
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
تولید سخنرانی، الگوریتم اصلاح،
ترجمه چکیده
تکنولوژی خروجی گفتار، یافتن برنامه گسترده است، از جمله در سناریوهایی که ممکن است به واسطۀ شرایط نامطلوب، حداقل برای برخی از شنوندگان، ممکن باشد. بر خلاف اکثر الگوریتم های فعلی، گفتارها به طور مداوم الگوهای گفتاری خود را به عنوان پاسخ به فضای فوری ارتباطات گفتاری تطبیق می دهند، در حالی که نوعی از مخاطبان و محیط زیست عوامل موقعیتی غالب در تولید گفتار است. مشاهدات رفتار گوینده می تواند الگوریتم های خروجی قوی تر را بیان کند. در این مقاله خلاصه ای از دسته بندی های متنوعی از اهداف ممکن برای اصلاح گفتار، مجموعه گسترده ای از یافته های رفتاری مربوط به اصلاح گفتار انسانی، شناسایی عوامل موثر بر آن، و بررسی تلاش های محاسباتی قبلی برای بهبود وضوح در سر و صدا. این بررسی با تدوین 46 تغییرات گفتاری انجام می شود، که بسیاری از آنها تا به حال به صورت ادراکی یا الگوریتمی مورد ارزیابی قرار نگرفته اند. در نتیجه، بازبینی یک نقشه راه برای کار آینده در بهبود کارایی خروجی گفتاری فراهم می کند.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
پردازش سیگنال
چکیده انگلیسی
Speech output technology is finding widespread application, including in scenarios where intelligibility might be compromised - at least for some listeners - by adverse conditions. Unlike most current algorithms, talkers continually adapt their speech patterns as a response to the immediate context of spoken communication, where the type of interlocutor and the environment are the dominant situational factors influencing speech production. Observations of talker behaviour can motivate the design of more robust speech output algorithms. Starting with a listener-oriented categorisation of possible goals for speech modification, this review article summarises the extensive set of behavioural findings related to human speech modification, identifies which factors appear to be beneficial, and goes on to examine previous computational attempts to improve intelligibility in noise. The review concludes by tabulating 46 speech modifications, many of which have yet to be perceptually or algorithmically evaluated. Consequently, the review provides a roadmap for future work in improving the robustness of speech output.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computer Speech & Language - Volume 28, Issue 2, March 2014, Pages 543-571
Journal: Computer Speech & Language - Volume 28, Issue 2, March 2014, Pages 543-571
نویسندگان
Martin Cooke, Simon King, Maëva Garnier, Vincent Aubanel,