کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6951497 1451678 2018 50 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Localizing speakers in multiple rooms by using Deep Neural Networks
ترجمه فارسی عنوان
محلی سازی بلندگوها در چند اتاق با استفاده از شبکه های عمیق عصبی
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر پردازش سیگنال
چکیده انگلیسی
As term of comparison, two algorithms proposed in literature for the addressed applicative context are evaluated, the Crosspower Spectrum Phase Speaker Localization (CSP-SLOC) and the Steered Response Power using the Phase Transform speaker localization (SRP-SLOC). Besides providing an extensive analysis of the proposed method, the article shows how DNN-based algorithm significantly outperforms the state-of-the-art approaches evaluated on the DIRHA dataset, providing an average localization error, expressed in terms of Root Mean Square Error (RMSE), equal to 324 mm and 367 mm, respectively, for the Simulated and the Real subsets.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computer Speech & Language - Volume 49, May 2018, Pages 83-106
نویسندگان
, , , , ,