کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6925842 1448876 2018 4 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A probabilistic matrix factorization algorithm for approximation of sparse matrices in natural language processing
ترجمه فارسی عنوان
الگوریتم تقسیم بندی ماتریسی احتمالاتی برای تقریب ماتریس های ضعیف در پردازش زبان طبیعی
کلمات کلیدی
ترجمه چکیده
این مقاله تنوع یک الگوریتم تقسیم بندی ماتریسی احتمالات شناخته شده را که معمولا در تجزیه و تحلیل داده ها و محاسبات علمی مورد استفاده قرار می گیرد، ارائه می دهد و اخیرا به منظور پردازش زبان طبیعی مورد استفاده قرار گرفته است. تنوع پیشنهادی به این معنی است که ماتریس هایی که در پردازش وظایف پردازش زبان طبیعی پردازش می شوند معمولا ماتریس های مستطیلی مبهم هستند که یک بعد بسیار بزرگتر از دیگری است و می تواند برای اطمینان از صحت کافی با زمان محاسبه قابل قبول استفاده شود. آزمایش های اولیه در مورد ساختارهای متنی واقعی در جهان نشان می دهد که الگوریتم پیشنهادی در مقایسه با اصل اول بهبود یافته است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نرم افزارهای علوم کامپیوتر
چکیده انگلیسی
This paper suggests a variation of a well-known probabilistic matrix factorization algorithm which is commonly used in data analysis and scientific computing, and which has been considered recently to serve natural language processing. The proposed variation is meant to take benefit from the fact that matrices processed in natural language processing tasks are normally sparse rectangular matrices with one dimension much larger than the other, and this can be used to ensure adequate accuracy with acceptable computation time. Preliminary experiments on real-world textual corpora show that the proposed algorithm achieves relevant improvements compared to the original one.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: ICT Express - Volume 4, Issue 2, June 2018, Pages 87-90
نویسندگان
, , ,