کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
10368490 874795 2014 20 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Data-driven models for timing feedback responses in a Map Task dialogue system
ترجمه فارسی عنوان
مدل های مبتنی بر داده برای زمانبندی پاسخ های بازخورد در یک سیستم گفتگو وظیفه
کلمات کلیدی
سیستم گفتگو گفتاری بازخورد زمانبندی، تبدیل شدن، ارزیابی کاربر،
ترجمه چکیده
سیستم های گفتگوی سنتی از آستانه سکوت ثابت برای شناسایی پایان چرخش کاربران استفاده می کنند. چنین مدل ساده ای می تواند منجر به رفتار سیستم شود که هر دو متوقف و غیرقابل پاسخ است، که به نوبه خود بر تجربه کاربر تاثیر می گذارد. مطالعات مختلف مشاهده کرده اند که مخاطبان انسانی از نشانه هایی از رفتار بلندگو، مانند صدای انسانی، نحو و حرکات، برای هماهنگی تبادل صحیح نوسان صحبت می کنند. با این حال، تلاش های زیادی در جهت اجرای این مدل ها در سیستم های گفتگو صورت گرفته است و تأیید شده است که چگونه رفتارهای نوبتکاری در تعاملات انسانی و کامپیوتر را به خوبی مدل می کنند. ما یک رویکرد مبتنی بر داده ها را برای ساخت مدل برای تشخیص آنلاین مکان های پاسخ بازخورد مناسب در سخنرانی کاربر ارائه می کنیم. ابتدا اطلاعات مربوط به تعامل انسان و کامپیوتر را با استفاده از یک سیستم گفتگوی گفتاری که می تواند کار نقشه را با کاربران انجام دهد (البته با استفاده از یک ترفند). بر اساس این داده ها، مدل های مختلفی را آموزش می دهیم که از ویژگی های متنباز، متنی و لاتین و نحو به صورت خودکار قابل تشخیص برای شناسایی مکان های پاسخ استفاده می کنند. بعد، ما یک مدل آموزش دیده را در همان سیستم گفتگوی اجرا کردیم و در تعامل با کاربران آن را ارزیابی کردیم. معیارهای ذهنی و عینی از ارزیابی کاربر تایید می کند که یک مدل آموزش یافته در نشانه های رفتاری سخنرانی هر دو به طور منظم انتقال و رفتار سیستم پاسخگو تر ارائه می دهد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر پردازش سیگنال
چکیده انگلیسی
Traditional dialogue systems use a fixed silence threshold to detect the end of users' turns. Such a simplistic model can result in system behaviour that is both interruptive and unresponsive, which in turn affects user experience. Various studies have observed that human interlocutors take cues from speaker behaviour, such as prosody, syntax, and gestures, to coordinate smooth exchange of speaking turns. However, little effort has been made towards implementing these models in dialogue systems and verifying how well they model the turn-taking behaviour in human-computer interactions. We present a data-driven approach to building models for online detection of suitable feedback response locations in the user's speech. We first collected human-computer interaction data using a spoken dialogue system that can perform the Map Task with users (albeit using a trick). On this data, we trained various models that use automatically extractable prosodic, contextual and lexico-syntactic features for detecting response locations. Next, we implemented a trained model in the same dialogue system and evaluated it in interactions with users. The subjective and objective measures from the user evaluation confirm that a model trained on speaker behavioural cues offers both smoother turn-transitions and more responsive system behaviour.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computer Speech & Language - Volume 28, Issue 4, July 2014, Pages 903-922
نویسندگان
, , ,