آشنایی با موضوع

فناوری تشخیص گفتار (Speech recognition) نرم‌افزاری است که قادر است صوت را به متن تبدیل کند. فناوری تشخیص گفتار به رایانه‌ای که توانایی دریافت صدا را دارد برای مثال به یک میکروفن مجهز است این قابلیت را می‌دهد که صحبت کاربر را متوجه شود٫این فناوری در تبدیل گفتار به متن یا به عنوان جایگزین برای ارتباط با رایانه کاربرد دارد. برقراری ارتباط گفتاری با رایانه‌ها به جای استفاده از صفحه کلید و ماوس یکی از زمینه‌های تحقیقاتی مهم چند دههٔ اخیر است و شرکت‌های بزرگی چون مایکروسافت ٫فیلیپس ٫ ای ال ای تی ٫ ای بی ام ٫سالانه هزینه‌های هنگفتی را برای این منظور پرداخت کرده و می‌کنند. هدف از تشخیص گفتار که در متون علمی بیشتر با نام بازشناسی گفتار شناخته شده‌است، طراحی و پیاده‌سازی سیستمی است که اطلاعات گفتاری را دریافت و متن و فرمان گوینده را استخراج می‌کند. فناوری بازشناسی گفتار به رایانه‌ای که توانایی دریافت صدا را دارد (برای مثال به یک میکروفن مجهز است) این قابلیت را می‌دهد که گفتار کاربر را متوجه شود. این فناوری در تبدیل گفتار به متن یا به عنوان جایگزینی برای صفحه کلید یا ماوس برای وارد کردن دستورات مورد استفاده قرار می‌گیرد. سیستم‌های واکافت کننده گفتار انواع مختلفی دارند، بعضی قادرند گفتار پیوسته را شناسایی نمایند، بعضی دیگر فقط می‌توانند گفتار گسسته (که بین کلمات سکوت وجود دارد) را شناسایی کنند. همچنین سیستم‌ها قادرند واژگان گفته شده توسط افراد مختلف یا فقط توسط یک گوینده تشخیص دهند. بهر حال ایده‌آل‌ترین سیستم آن است که بتواند گفتار پیوسته غیر وابسته به گوینده را در محیط نویزی شناسایی نماید. این سیستم‌ها با بکار گیری روش‌های مختلف طبقه‌بندی و شناسایی الگو قادرند به تشخیص واژگان هستند که البته برای افزایش دقت در شناسایی از یک فرهنگ لغات نیز در انتهای سیستم استفاده می‌شود. روشهایی مانند Hidden Markov Model یا Neural Network در بسیاری از سیستم‌های تشخیص گفتار مورد استفاده قرار می‌گیرند و در بخش‌های انتهایی سیستم از هوش مصنوعی کمک گرفته می‌شود. یکی از کاربردهای اصلی اینگونه نرم افزارها بعنوان واسط بین انسان و رایانه است از آنجائیکه خیلی از کارهای بوسیله ارتباطات بصری بهتر حل می شود، گفتار هم دارای این توانایی است که یک نوع رابطه بهتر از صفحه کلید باشد مخصوصاً برای کارهایی که بصورت ارتباط زبان طبیعی هستند و یا بجای آن دسته از صفحه کلیدهایی که مناسب یک کار خاص نیستند بسیار مفید است کاربرد سیستم تشخیص گفتار شامل آن دسته از اعمال که در آنها چشم و دست مشغول هستند نیز می شود مانند مکانهایی که کاربر مجبوراست با دست عملی را انجام دهد یا تجهیزاتی را کنترل نماید (مانند کنترل پرواز برای خلبان یک هواپیما یا هنگام عمل جراحی یک پزشک متخصص). ناحیه کاربردی دیگر که هم اکنون ازسیستم تشخیص گفتار استفاده می شود در تلفن است بعنوان مثال برای وارد کردن اعداد، تشخیص کلمه « الو» برای پذیرش تماس و. . سرانجام سیستم تشخیص گفتار در دیکته عملی شد که عبارتست از سخنرانی طولانی یک شخص ویژه. این کاربرد هم در مکانهایی مثل دادگاهها و مکانهایی که نیاز به ثبت گفتگوهای طولانی دارند عملی شد و کاربرد بسیار مهم دیگر آن فناوری تشخیص هویت شخص گوینده و کنترل امنیتی برای ورود به قلمروهای اطلاعاتی محرمانه و دسترسی از راه دور به کامپیوترهای می باشد. این فن‌آوری امکان تشخیص هویت شخص گوینده و در نتیجه امکان کنترل دسترسی او در هنگام استفاده از خدماتی همانند شماره‌گیری صوتی، بانکداری تلفنی، خرید تلفنی، خدمات دسترسی به پایگاه داده‌ها، خدمات اطلاعاتی، پست الکترونیکی صوتی، کنترل امنیتی برای ورود به قلمروهای اطلاعاتی محرمانه و دسترسی از راه دور به کامپیوترها را فراهم می‌آورد. علاوه بر موارد فوق که عموماً با کامپیوتر و کاربران آن سروکار دارند این فن‌آوری در مسائل قضایی نیز کاربردهای خاص خود را دارد.
در این صفحه تعداد 486 مقاله تخصصی درباره تشخیص گفتار که در نشریه های معتبر علمی و پایگاه ساینس دایرکت (Science Direct) منتشر شده، نمایش داده شده است. برخی از این مقالات، پیش تر به زبان فارسی ترجمه شده اند که با مراجعه به هر یک از آنها، می توانید متن کامل مقاله انگلیسی همراه با ترجمه فارسی آن را دریافت فرمایید.
در صورتی که مقاله مورد نظر شما هنوز به فارسی ترجمه نشده باشد، مترجمان با تجربه ما آمادگی دارند آن را در اسرع وقت برای شما ترجمه نمایند.
مقالات ISI ترجمه شده تشخیص گفتار
مقالات ISI تشخیص گفتار (ترجمه نشده)
مقالات زیر هنوز به فارسی ترجمه نشده اند.
در صورتی که به ترجمه آماده هر یک از مقالات زیر نیاز داشته باشید، می توانید سفارش دهید تا مترجمان با تجربه این مجموعه در اسرع وقت آن را برای شما ترجمه نمایند.
Elsevier - ScienceDirect - الزویر - ساینس دایرکت
Keywords: تشخیص گفتار; Multi-sensory interactions; Cross-modal effects; Thermal sensation; Thermal comfort; Noisiness; Loudness; Annoyance; Acoustic comfort; Speech recognition;
Elsevier - ScienceDirect - الزویر - ساینس دایرکت
Keywords: تشخیص گفتار; Histogram bin number; Bi-histogram; Marginal entropy; Joint entropy; Mutual information; Shannon entropy; Mean square error minimization; MFCC feature; Feature selection; Speech recognition; Speaker recognition;
Elsevier - ScienceDirect - الزویر - ساینس دایرکت
Keywords: تشخیص گفتار; SR; speech recognition; EMR; electronic medical record; KBM; keyboard and mouse; SUS; system usability scale; ED; emergency department; Electronic health records; Speech recognition; Integration; System usability; Learnability;
Elsevier - ScienceDirect - الزویر - ساینس دایرکت
Keywords: تشخیص گفتار; Temporal auditory processing; Objective measures; Mismatch waveform; Amplitude modulation detection; Speech recognition; ACC; acoustic change complex; AFC; alternative forced choice; AM; amplitude modulation; AMD; amplitude modulation depth; ASSR; auditor
Elsevier - ScienceDirect - الزویر - ساینس دایرکت
Keywords: تشخیص گفتار; Gujarati Speech recognition; low resource languages; speech recognition; in-ear microphone; End point detection; Energy Entropy feature; two layers and three layers neural networks; MFCC; conjugate gradient (CG); Levenberg-Marquardt (LM)
Elsevier - ScienceDirect - الزویر - ساینس دایرکت
Keywords: تشخیص گفتار; Speaker adaptation; Eigenvoice; Maximum Likelihood Linear Regression; Maximum A Posteriori; Selective eigenvoice merging; Speech recognition
Elsevier - ScienceDirect - الزویر - ساینس دایرکت
Keywords: تشخیص گفتار; 68T05; 68T10; 68T50; Recurrent neural networks; Natural language processing; Language modeling; Speech recognition; Machine translation;
Elsevier - ScienceDirect - الزویر - ساینس دایرکت
Keywords: تشخیص گفتار; Fuzzy neural networks; Noise suppression filter; ANFIS; Speech recognition; Commercial speech recognizer; Sigmoid filter; Speech enhancement
Elsevier - ScienceDirect - الزویر - ساینس دایرکت
Keywords: تشخیص گفتار; Speech encoding; Speech recognition; Attention; Informational masking; Energetic masking; Event-related potentials; Perceptual separation; Precedence effect; Active listening; Passive listening