کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
6596769 | 1423849 | 2018 | 11 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Unicode-8 based linguistics data set of annotated Sindhi text
ترجمه فارسی عنوان
داده های زبان شناسی مبتنی بر یونیکد 8 مجموعه ای از متن سندی متنی است
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی شیمی
مهندسی شیمی (عمومی)
چکیده انگلیسی
Sindhi Unicode-8 based linguistics data set is multi-class and multi-featured data set. It is developed to solve the natural languages processing (NLP) and linguistics problems of Sindhi language. The data set presents information on grammatical and morphological structure of Sindhi language text as well as sentiment polarity of Sindhi lexicons. Therefore, data set may be used for information retrieving, machine translation, lexicon analysis, language modeling analysis, grammatical and morphological analysis, Semantic and sentiment analysis.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Data in Brief - Volume 19, August 2018, Pages 1504-1514
Journal: Data in Brief - Volume 19, August 2018, Pages 1504-1514
نویسندگان
Mazhar Ali Dootio, Asim Imdad Wagan,