کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
6941147 | 870156 | 2015 | 7 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Towards the creation of reliable voice control system based on a fuzzy approach
ترجمه فارسی عنوان
به سوی ایجاد سیستم کنترل صدای قابل اطمینان بر اساس یک رویکرد فازی
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
ترجمه چکیده
هدف اصلی این مقاله آموزش سیستم کنترل صدا است اگر مقدار کمی از داده های گفتاری کاربر بدون نیاز به مدل صوتی عمومی در دسترس باشد اگر آن را به دلیل منبع تغذیه شناخته شده (دوران کودکی، بیماری های صوتی، غیر ناتوانی، و غیره). ما امکان افزایش میزان تشخیص را با نیاز به بلندگو برای قرار دادن استرس در تمام حروف صدادار در یک فرمان بررسی می کنیم. ما پیشنهاد اصلاح ریشه ای از روش رمزنگاری فونتی فازی را داریم که در آن هر حروف صدادار با یک اتحاد فازی مجموعه ای از سیگنال های مرجع موجود در این کلاس قرار می گیرد. ابتدا هجا شناسایی و تقسیم بندی صحیح انجام می شود. ثانیا، فرمان از گفتار خودبخودی توسط آستانه نسبت نسبت طول دوره های همگن به طول کل حیله استخراج می شود. در نهایت، هر هجایی مطابق با مجموعه فازی از حروف صدادار قرار می گیرد، و دستورات بر اساس شباهت با مجموعه فازی بیان می شود. نتایج تجربی در مجموعه داده های مصنوعی و واقعی روسیه ثابت می کند که روش ما با دقت بهتر در مقایسه با روش های شناخت شناخته شده مشخص می شود.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
The key purpose of this paper is to train a voice control system if a small amount of user speech data is available without need for general acoustic model if the latter does not fit to the user voice due to known variability sources (childhood, voice diseases, non-nativeness, etc.). We explore the possibility to increase the recognition rate by requiring the speaker to put the stress on all vowels in a command. We propose the novel modification of our fuzzy phonetic decoding method, in which each vowel is put in correspondence with a fuzzy union of sets of available reference signals from this class. A first, syllables are detected and phoneme segmentation is performed. Secondly, the command is extracted from spontaneous speech by thresholding the ratio of the duration of homogeneous segments to the duration of the whole syllable. Finally, each syllable is put in correspondence with the fuzzy set of vowels, and commands are ordered based on similarity with the fuzzy set of the utterance. The experimental results in synthetic and real Russian datasets prove that our method is characterized by better accuracy in comparison with known recognition methods.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Pattern Recognition Letters - Volume 65, 1 November 2015, Pages 145-151
Journal: Pattern Recognition Letters - Volume 65, 1 November 2015, Pages 145-151
نویسندگان
Andrey V. Savchenko, Liudmila V. Savchenko,