کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
485431 703327 2016 7 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Mismatched Crowdsourcing based Language Perception for Under-resourced Languages
ترجمه فارسی عنوان
ادراک زبان بر مبنای برون رفتاری غیرمستقیم برای زبان های کم منابع
کلمات کلیدی
برون سپاری ناقص، تشخیص گفتار، زبان کم منابع، ادراک گفتاری
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر علوم کامپیوتر (عمومی)
چکیده انگلیسی

Mismatched crowdsourcing is a technique for acquiring automatic speech recognizer training data in under-resourced languages by decoding the transcriptions of workers who don’t know the target language using a noisy-channel model of cross-language speech perception. All previous mismatched crowdsourcing studies have used English transcribers; this study is the first to recruit transcribers with a different native language, in this case, Mandarin Chinese. Using these data we are able to compute statistical models of cross-language perception of the tones and phonemes from transcribers based on phone distinctive features and tone features. By analyzing the phonetic and tonal variation mappings and coverages compared with the dictionary of the target language, we evaluate the different native languages’ effect on the transcribers’ performances.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Procedia Computer Science - Volume 81, 2016, Pages 23–29
نویسندگان
, , ,