کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
4969190 | 1449900 | 2017 | 39 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Domain-specific sentiment classification via fusing sentiment knowledge from multiple sources
ترجمه فارسی عنوان
طبقه بندی احساسات خاص دامنه از طریق متمرکز کردن دانش احساسات از منابع مختلف
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
طبقه بندی احساسات، تلفیق اطلاعات، انطباق دامنه،
ترجمه چکیده
تجزیه و تحلیل احساسات در داده های آنلاین تولید شده توسط کاربر، مانند بررسی محصول و میکروبلاگینگ، به یک موضوع تحقیق داغ تبدیل شده است. این می تواند به مشتریان، شرکت ها و سیستم های متخصص در تصمیم گیری های آگاهانه تر کمک کند. تجزیه و تحلیل احساسات به طور گسترده ای به عنوان یک مسئله وابسته به دامنه شناخته می شود. دامنه های مختلف معمولا دارای عبارات مختلف احساسات هستند و طبقه بندی کلی احساسات مناسب برای همه دامنه ها نیست. یک راه حل طبیعی برای این مشکل این است که یک طبقه بندی کننده احساسات خاص دامنه برای هر حوزه هدف آموزش دهد. با این حال، داده های برچسب شده در حوزه هدف معمولا کافی نیست، و وقت کافی برای جمع کردن نمونه های کافی است. برای مقابله با این مشکل، ما یک رویکرد جدید برای تهیه طبقه بندی های احساسات خاص دامنه را با استفاده از دانش های احساسی از منابع مختلف پیشنهاد می کنیم. اطلاعات حسابی از چهار منبع استخراج شده و در رویکرد ما تلف شده است. منبع اول، واژگان احساسی است که حاوی قطعیت های احساسات از کلمات عاطفی عمومی هستند. منبع دوم طبقه بندی های احساسات دامنه های منبع چندگانه است. منبع سوم داده های بدون برچسب در حوزه ی هدف است که از آن میان روابط احساسات خاص دامنه ی بین کلمات را استخراج می کنیم. منبع چهارم داده های برچسب شده در حوزه هدف است. ما یک چارچوب یکپارچه برای اتصال این چهار نوع دانش احساسی و طبقه بندی احساسات خاص دامنه برای دامنه هدف را پیشنهاد می کنیم. علاوه بر این، ما یک الگوریتم بهینه سازی کارآمد برای حل مدل رویکرد ما ارائه می دهیم. آزمایش های گسترده در هر دو نوع داده های بررسی محصول آمازون و مجموعه داده های توییتر انجام می شود. نتایج تجربی نشان می دهد که با همکاری اطلاعات احساساتی که از منابع مختلف استخراج شده است، رویکرد ما می تواند به طور موثر بهبود عملکرد طبقه بندی احساسات و کاهش وابستگی به داده های برچسب گذاری شده را بهبود بخشد. به عنوان مثال، رویکرد ما می تواند به صحت 87.22٪ در دامنه آشپزخانه دست یابد که تنها 200 نمونه در دامنه هدف برچسب گذاری می شوند. بهبود عملکرد رویکرد ما در مقایسه با طبقه بندی احساسات کاملا نظارت شده به ترتیب 8.98٪ و 7.92٪ در مجموعه داده های آمازون و توییتر است.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
Analyzing the sentiments in massive user-generated online data, such as product reviews and microblogs, has become a hot research topic. It can help customers, companies and expert systems make more informed decisions. Sentiment analysis is widely known as a domain dependent problem. Different domains usually have different sentiment expressions and a general sentiment classifier is not suitable for all domains. A natural solution to this problem is to train a domain-specific sentiment classifier for each target domain. However, the labeled data in target domain is usually insufficient, and it is costly and time-consuming to annotate enough samples. In order to tackle this problem, we propose a novel approach to train domain-specific sentiment classifiers by fusing the sentiment knowledge from multiple sources. Sentiment information from four sources is extracted and fused in our approach. The first source is sentiment lexicons, which contain sentiment polarities of general sentiment words. The second source is the sentiment classifiers of multiple source domains. The third source is the unlabeled data in target domain, from which we extract domain-specific sentiment relations among words. The fourth source is the labeled data in target domain. We propose a unified framework to fuse these four kinds of sentiment knowledge and train domain-specific sentiment classifier for target domain. In addition, we present an efficient optimization algorithm to solve the model of our approach. Extensive experiments are conducted on both Amazon product review dataset and Twitter dataset. Experimental results show that by fusing the sentiment information extracted from multiple sources, our approach can effectively improve the performance of sentiment classification and reduce the dependence on labeled data. For instance, our approach can achieve an accuracy of 87.22% in Kitchen domain when only 200 samples in target domain are labeled. The performance improvements of our approach compared with purely supervised sentiment classifier are 8.98% and 7.92% on Amazon and Twitter datasets respectively.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Fusion - Volume 35, May 2017, Pages 26-37
Journal: Information Fusion - Volume 35, May 2017, Pages 26-37
نویسندگان
Wu Fangzhao, Huang Yongfeng, Yuan Zhigang,