کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6855652 660831 2016 8 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Using information retrieval for sentiment polarity prediction
ترجمه فارسی عنوان
استفاده از بازیابی اطلاعات برای پیش‌بینی قطبش احساسات
کلمات کلیدی
فهرست مطالب مقاله
چکیده

کلمات کلیدی

1. مقدمه

2. آثار مرتبط

3. دسته‌بندی قطبش توئیت‌ها

شکل 1. نمای کلی SABIR.

1.3. سیستم بازیابی اطلاعات

2.3. تولید ویژگی

جدول 1. مثالی از رتبه‌بندی برای پست q.

جدول 2. ویژگی‌های مشتق از رتبه‌بندی

3.4. دسته‌بندی

4. آزمایش‌ها

جدول 3. جزئیات پایگاه‌های داده.

4.1. محیط آزمایش

4/2تحلیل ویژگی

جدول 4. ده ویژگی برتر برحسب منفعت اطلاعاتی. 

جدول 5. نتایج دسته‌بندی با مقایسه دو نسخه SABIR در برابر دسته‌کننده‌های خط مبنا. هروقت آزمون آماری نشان داد که خط مبنا بهتر، بدتر یا بی‌تفاوت در نسخه SABIR است

3.4. نتایج

4.4. حساسیت معیار F-1 در نقش تابعی از n

شکل 2. نتایج صحت برای روش‌های پیشرفته و SABIR

جدول 6. آزمایش زمان اجرا (زمان به ثانیه). اجراهایی که زمان کمتری نسبت به کل زمان برحسب SABIR می‌گیرد با   نشان داده می‌شود، در حالی که موردهایی با صرف زمان بیشتر با   نشان داده می‌شود.

شکل 3. F1 در نقش تابعی از n.

5.4. تحلیل زمان اجرا

5. نتیجه‌گیری 

 
ترجمه چکیده
امروز، میلیون‌ها نفر درباره موضوع‌های گوناگون در شبکه‌های اجتماعی مانند توئیتر نظر می‌دهند. در نتیجه، سامانه‌های تحلیل احساسات پیوسته این رسانه‌ها را تحلیل می‌کنند، هدف این سامانه‌ها دسته‌بندیِ پست‌ها به دو گروه مثبت یا منفی است. با توجه به گوناگونیِ موضوع‌های بررسی‌شده و کوتاه بودنِ پست‌ها، استفاده از کلمه‌ها در نقش ویژگی برای الگوریتم‌های یادگیری ماشینی در رویکرد استاندارد منتج به بردارهای پراکنده می‌شود. در این اثر، استفاده از ویژگی‌های مشتق از رتبه‌بندی را پیشنهاد می‌کنیم، این رتبه‌بندی در سیستم بازیابی اطلاعات در پاسخ به درخواست دسته‌بندی پست تولید می‌شود. سیستم‌مان می‌تواند کاملاً خودکار باشد، تنها 24 ویژگی دارد و به منابع گران وابسته نیست. آزمایش در پایگاه‌داده‌های واقعی نشان داد عملکردِ دسته‌کننده با اتکاء صرف بر این 24 ویژگی‌ بهتر از خط‌مبنای محقق‌شده است و این دسته‌کننده، در مقایسه با پیشرفته‌ترین رویکردهای خیلی گران، می‌تواند به نتایج صحیح برسد. © 2016 شرکت مسئولیت محدود الزویر. تمام حقوق محفوظ است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Social networks such as Twitter are used by millions of people who express their opinions on a variety of topics. Consequently, these media are constantly being examined by sentiment analysis systems which aim at classifying the posts as positive or negative. Given the variety of topics discussed and the short length of the posts, the standard approach of using the words as features for machine learning algorithms results in sparse vectors. In this work, we propose using features derived from the ranking generated by an Information Retrieval System in response to a query consisting of the post that needs to be classified. Our system can be fully automatic, has only 24 features, and does not depend on expensive resources. Experiments on real datasets have shown that a classifier that relies solely on these features outperforms established baselines and can reach accuracies comparable to the state-of-the-art approaches which are more costly.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Expert Systems with Applications - Volume 61, 1 November 2016, Pages 282-289
نویسندگان
, ,