کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
557741 874777 2015 7 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Using semantic data to improve cross-lingual linking of article clusters
ترجمه فارسی عنوان
با استفاده از داده های معنایی برای بهبود ارتباط متقابل بین خوشه های مقاله
کلمات کلیدی
داده های معنایی، پردازش زبان طبیعی، متقابل زبان، تجزیه و تحلیل همبستگی کانونی
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر سیستم های اطلاعاتی
چکیده انگلیسی

This paper presents a system that uses semantic data to improve cross-lingual linking of news article clusters. Two approaches are compared. The first based on two different Canonical Correlation Analysis (CCA) feature vector definitions: MAX-CCA and SUM-CCA, whereas the second one has been developed using a better-performed CCA approach in combination with Entity vectors. The aim of the comparison was to determine whether taking into account the semantic aspect of news increases performance and improves linking. Evaluations of the aforementioned techniques on a news corpus, both against Google News and manual, revealed good performance of our system. The overall gain in precision and recall when using entity vectors was significant.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Web Semantics: Science, Services and Agents on the World Wide Web - Volume 35, Part 2, December 2015, Pages 64–70
نویسندگان
, , , , ,