کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
571783 1439293 2016 10 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Bilingual recursive neural network based data selection for statistical machine translation
ترجمه فارسی عنوان
انتخاب داده ها بر اساس شبکه عصبی دوزبانه بازگشتی برای ترجمه ماشینی آماری
کلمات کلیدی
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی

Data selection is a widely used and effective solution to domain adaptation in statistical machine translation (SMT). The dominant methods are perplexity-based ones, which do not consider the mutual translations of sentence pairs and tend to select short sentences. In this paper, to address these problems, we propose bilingual semi-supervised recursive neural network data selection methods to differentiate domain-relevant data from out-domain data. The proposed methods are evaluated in the task of building domain-adapted SMT systems. We present extensive comparisons and show that the proposed methods outperform the state-of-the-art data selection approaches.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Knowledge-Based Systems - Volume 108, 15 September 2016, Pages 15–24
نویسندگان
, , ,