کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4960612 1446503 2017 10 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Comparative study of word embedding methods in topic segmentation
ترجمه فارسی عنوان
بررسی مقایسه ای از روش های جاسازی کلمه در تقسیم بندی موضوع
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر علوم کامپیوتر (عمومی)
چکیده انگلیسی
The vector representations of words are very useful in different natural language processing tasks in order to capture the semantic meaning of words. In this context, the three known methods are: LSA, Word2Vec and GloVe. In this paper, these methods will be investigated in the field of topic segmentation for both languages Arabic and English. Moreover, Word2Vec is studied in depth by using different models and approximation algorithms. As results, we found out that LSA, Word2Vec and GloVe depend on the used language. However, Word2Vec presents the best word vector representation yet it depends on the choice of model.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Procedia Computer Science - Volume 112, 2017, Pages 340-349
نویسندگان
, , ,