کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
9952423 1451674 2019 34 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Language models, surprisal and fantasy in Slavic intercomprehension
ترجمه فارسی عنوان
مدل های زبان، شگفت انگیز و فانتزی در تعامل اسلاویک
کلمات کلیدی
مدلسازی آماری زبان، سورپرایز، چند زبانه پذیرش پذیر، زبان اسلاوی متن پیشنهادی، پروتکل ها فکر می کنم با صدای بلند، لهستانی، کشور چک، خواندن،
ترجمه چکیده
در پردازش زبان یک زبانه ی انسانی، پیش بینی یک کلمه با توجه به محتویات محتوی اطراف آن بسیار مهم است. با توجه به چندزبانه پذیرنده پذیرش، مشخص نیست که میزان پیش بینی بودن در چارچوب ارتباط با سایر عوامل زبانی در درک زبان مربوطه، اما ناشناخته - یک فرایند به نام درک شناختی است. ما در ابعاد بینش تفکر دو بعد را تحت تاثیر قرار می دهیم که متاثر از تلاش پردازش است: شگفت انگیز در محدوده سنتنتی و فاصله زبانشناسی. بر اساس این فرضیه، ما انتظارات مربوط به دشواری محرک های تجربی طراحی شده را با نتایج حاصل از پروتکل های متفکر آزمایشات که در آن سخنرانان بومی لهستانی با توافق در مورد ترجمه مناسب، رمزگشایی می کنند، ارائه می دهیم. از یک سو فاصله های ارتوپدی و واژگانی پیش بینی های قابل اعتماد از شباهت زبان شناسی است. از سوی دیگر، ما پیش بینی کلمات در یک جمله را با کمک مدل های ترامر زبان به دست می آوریم. ما متوجه می شویم که فاصله زبان شناختی (شباهت کدبندی) و شگفتی در زمینه (پیش بینی پذیری در زمینه) مکمل هستند و هیچ فاکتور دیگری از وزن دیگر ندارند و تمایز ما از این دو ابعاد قابل اندازه گیری برای درک اثرات غیر منتظره ای در رفتار انسانی مفید است .
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر پردازش سیگنال
چکیده انگلیسی
In monolingual human language processing, the predictability of a word given its surrounding sentential context is crucial. With regard to receptive multilingualism, it is unclear to what extent predictability in context interplays with other linguistic factors in understanding a related but unknown language - a process called intercomprehension. We distinguish two dimensions influencing processing effort during intercomprehension: surprisal in sentential context and linguistic distance. Based on this hypothesis, we formulate expectations regarding the difficulty of designed experimental stimuli and compare them to the results from think-aloud protocols of experiments in which Czech native speakers decode Polish sentences by agreeing on an appropriate translation. On the one hand, orthographic and lexical distances are reliable predictors of linguistic similarity. On the other hand, we obtain the predictability of words in a sentence with the help of trigram language models. We find that linguistic distance (encoding similarity) and in-context surprisal (predictability in context) appear to be complementary, with neither factor outweighing the other, and that our distinguishing of these two measurable dimensions is helpful in understanding certain unexpected effects in human behaviour.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computer Speech & Language - Volume 53, January 2019, Pages 242-275
نویسندگان
, , , ,