کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
10355186 867104 2015 15 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Reprint of “Supervised sentiment analysis in Czech social media”
ترجمه فارسی عنوان
بازنویسی تحلیل تحلیلی نظارت شده در رسانه های اجتماعی چ
کلمات کلیدی
تجزیه و تحلیل احساسات، زبان چک، رسانه های اجتماعی، فراگیری ماشین، انتخاب ویژگی،
ترجمه چکیده
این مقاله، تحقیق جامع در زمینه روش های یادگیری ماشین برای تحلیل احساسات رسانه های اجتماعی چک است. در حالی که در زبان انگلیسی، چینی یا اسپانیایی این رشته دارای تاریخچه طولانی و مجموعه داده های ارزیابی برای حوزه های مختلف است به طور گسترده ای در دسترس هستند، در مورد زبان چک زبان تحقیق سیستماتیک هنوز انجام نشده است. ما با این مسئله روبرو هستیم و زمینه مشترک برای تحقیق بیشتر را فراهم می کنیم با فراهم ساختن یک رسانه بزرگ رسانه های چکی از چهره های برجسته در باره انسان. علاوه بر این، ما روش های یادگیری ماشین آلات تحت نظارت دولت را برای تحلیل احساسات ارزیابی می کنیم. ما روش های پیش پردازش مختلف را مورد بررسی قرار می دهیم و از ویژگی ها و طبقه بندی های مختلف استفاده می کنیم. ما همچنین با پنج الگوریتم انتخاب الگوریتم های مختلف آزمایش می کنیم و تاثیر تأثیر نامگذاری موجودیت نام و پیش پردازش بر عملکرد طبقه بندی احساسات را بررسی می کنیم. علاوه بر این، علاوه بر مجموعه داده های رسانه ای جدید که اخیرا ایجاد شده است، ما همچنین نتایج دیگر دامنه های محبوب مانند بررسی فیلم و محصولات را گزارش می کنیم. ما بر این باوریم که این مقاله نه تنها تحقیقات تحلیلی در مورد احساسات را به خانواده های دیگر زبان گسترش می دهد، بلکه رقابت را تشویق می کند، که به طور بالقوه منجر به تولید راه حل های تجاری می شود.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نرم افزارهای علوم کامپیوتر
چکیده انگلیسی
This article describes in-depth research on machine learning methods for sentiment analysis of Czech social media. Whereas in English, Chinese, or Spanish this field has a long history and evaluation datasets for various domains are widely available, in the case of the Czech language no systematic research has yet been conducted. We tackle this issue and establish a common ground for further research by providing a large human-annotated Czech social media corpus. Furthermore, we evaluate state-of-the-art supervised machine learning methods for sentiment analysis. We explore different pre-processing techniques and employ various features and classifiers. We also experiment with five different feature selection algorithms and investigate the influence of named entity recognition and preprocessing on sentiment classification performance. Moreover, in addition to our newly created social media dataset, we also report results for other popular domains, such as movie and product reviews. We believe that this article will not only extend the current sentiment analysis research to another family of languages, but will also encourage competition, potentially leading to the production of high-end commercial solutions.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Processing & Management - Volume 51, Issue 4, July 2015, Pages 532-546
نویسندگان
, , ,