کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6900384 1446488 2018 9 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Detection of Sentence Modality on French Automatic Speech-to-text Transcriptions
ترجمه فارسی عنوان
تشخیص اصطلاحات حکم در رونوشت های خودکار گفتار به متن فرانسه
کلمات کلیدی
تشخیص سوال، رونوشت سخنرانی به متن، پرونده نسبت احتمال، برچسب های بخشی از گفتار
ترجمه چکیده
در این مقاله، تشخیص نوع مدرک در فرانسوی زمانی که آن را در رونوشت های اتوماتیک گفتار به متن استفاده می شود. دو شیوه حکم (سوالات و اظهارات) با استفاده از اطلاعات اسناد و زبانی ارزیابی می شود. ویژگی های زبانشناسی، حضور الگوهای تکراری تبعیض آمیز و دو نسبت احتمال عددی بودن جمله را به عنوان یک سوال و نه یک بیانیه در نظر می گیرند: یکی براساس کلمات و دیگری بر مبنای تگ های بخشی از گفتار است. ویژگی های این نرم افزار براساس مدت زمان، انرژی و ویژگی های زمین برآورد شده در آخرین گروه فیشودیک از جمله است. طبقه بندی های مبتنی بر ویژگی های زبانی، طبقه بندی ها را براساس ویژگی های متنوعی فراتر می برند. ترکیبی از ویژگی های زبانشناختی و زبانی، بهبودی کمی در رونوشت های گفتاری اتوماتیک دارد، در حالیکه عملکرد طبقه بندی صحی به 72٪ می رسد. یک تحلیل دقیق نشان می دهد که اشتباهات کوچک در تعیین مرزهای بخش مهم نیست.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر علوم کامپیوتر (عمومی)
چکیده انگلیسی
This article analyzes the detection of sentence modality in French when it is applied on automatic speech-to-text transcriptions. Two sentence modalities are evaluated (questions and statements) using prosodic and linguistic information. The linguistic features consider the presence of discriminative interrogative patterns and two log-likelihood ratios of the sentence being a question rather than a statement: one based on words and the other one based on part-of-speech tags. The prosodic features are based on duration, energy and pitch features estimated over the last prosodic group of the sentence. The classifiers based on linguistic features outperform the classifiers based on prosodic features. The combination of linguistic and prosodic features gives a slight improvement on automatic speech transcriptions, where the correct classification performance reaches 72%. A detailed analysis shows that small errors in the determination of the segment boundaries are not critical.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Procedia Computer Science - Volume 128, 2018, Pages 38-46
نویسندگان
, ,