کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6951449 1451675 2018 18 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Perception and prediction of speaker appeal - A single speaker study
ترجمه فارسی عنوان
درک و پیش بینی درخواست تجدید نظر سخنران - یک مطالعه تک سخنران
کلمات کلیدی
زبانشناسی کامپیوتری، تشخیص صوتی بلندگو، درخواست تجدید نظر سخنرانی سیاسی، پردازش گفتار،
ترجمه چکیده
در این مقاله ما پیش بینی خودکار پیش بینی سخنرانان از ضبط سخنرانی سیاسی را بررسی می کنیم. پایگاه داده مورد استفاده شامل ضبط یک سخنران تک در طیف وسیعی از موقعیت ها (مصاحبه، تظاهرات انتخاباتی و غیره) است که برای شش ویژگی سخنران شرح داده شده است: خسته کننده؛ کاریزماتیک؛ مشتاق الهام بخش؛ دوست داشتنی و متقاعد کننده هدف این مطالعه پیش بینی این رأی ها با استفاده از ویژگی های صوتی گفتار است. ما سه مقاله کلیدی در این مقاله ارائه می دهیم. در ابتدا، ما اثر محیط زیست را بر روی درک توانایی بلندگو بررسی می کنیم. ما در زمینه ادراک همه شش صفات، تعصب قابل ملاحظهای را در بر میگیریم؛ سخنرانیهای مصاحبه به طور مداوم به عنوان کمتر جذاب به نظر میرسد، و سخنرانی تظاهرات انتخاباتی بیشتر جذاب است. در دومین مشارکت ما تلاش می کنیم با استفاده از مدل سازی سخنرانی از هر وضعیت به طور جداگانه از این تعصبات بهره برداری کنیم، که به بهبود قابل توجهی در عملکرد طبقه بندی می انجامد. در نهایت، این پایگاه داده شامل 7 سال است. بنابراین، سهم سوم ما، تجزیه و تحلیل واریانس هر دو حاشیه نویسی و ویژگی های صوتی در طول زمان برای کشف روند زمانی در درخواست تجدید نظر سخنران است. ما روندهای قابل توجهی را نشان می دهیم که نشان می دهد کاهش فعالیت سخنران در طول زمان، که منجر به کاهش ادراک درخواست سخنران می شود، اندازه گیری شده توسط حاشیه نویسی های پایگاه داده است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر پردازش سیگنال
چکیده انگلیسی
In this paper we explore the automatic prediction of speaker appeal from recordings of political speech. The database used contains recordings of a single speaker in a wide range of situations (interview, election rally etc.) which has been annotated for six speaker traits: boring; charismatic; enthusiastic; inspiring; likeable; and persuasive. The aim of this study is to predict these ratings using acoustic features of the speech. We offer three key contributions in this paper. Firstly, we explore the effect of acoustic environment on the perception of speaker ability. We find significant biases in the perception of all six traits, with interview speech being consistently rated as less appealing, and election rally speech as more appealing. In our second contribution, we attempt to exploit this bias by modelling speech from each situation separately, which gives a significant improvement in classification performance. Finally, the database covers 7 years. Thus, our third contribution is an analysis of the variance in both annotations and acoustic features over time to uncover temporal trends in speaker appeal. We find significant trends which show a decline in the speaker's prosodic activity over time, which mirror a decline in the perception of speaker appeal as measured by the database annotations.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computer Speech & Language - Volume 52, November 2018, Pages 23-40
نویسندگان
, , ,