کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6854848 1437597 2018 62 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
An improved semi-supervised dimensionality reduction using feature weighting: Application to sentiment analysis
ترجمه فارسی عنوان
کاهش جزئی بهبود یافته با نیمه تحت کنترل با استفاده از وزن بندی ویژگی: کاربرد به تجزیه و تحلیل احساس
ترجمه چکیده
تجزیه و تحلیل تعداد زیادی از اسناد برای تجزیه و تحلیل احساسات مستلزم پیچیدگی و هزینه های زیادی است. برای رفع این بار، کاهش ابعاد به اسناد به عنوان یک مرحله پیش پردازش اعمال شده است. در میان الگوریتم های کاهش ابعاد، در مقایسه با انتخاب ویژگی، استخراج ویژگی می تواند کاهش اطلاعات را کاهش دهد و قدرت تفکیک پذیری بالاتری را در طبقه بندی احساسات کاهش دهد. با این حال، استخراج ویژگی از فقدان تفسیری رنج می برد و بسیاری از روش های استخراج غیرخطی که عموما بهتر از روش های خطی هستند، برای طبقه بندی احساسات به دلیل ویژگی هایی هستند که تنها مختصات مختصات کم بعدی را بدون نقشه برداری فراهم نمی کنند. بنابراین، این تحقیق، یک چارچوب کاهش یافته نیمه نظارت بهبود یافته را ارائه می دهد که به طور همزمان مزایای استفاده از استخراج ویژگی ها را حفظ کرده و اشکالاتی را برای طبقه بندی احساسات در نظر می گیرد. چارچوب پیشنهادی عمدتا بر اساس ویژگی استخراج خطی است که نقشه برداری و وزن گذاری قبل از استخراج ویژگی ها اعمال می شود. وزن بندی و استخراج ویژگی ها به روش نیمه نظارتی انجام می شود تا هر دو اطلاعات برچسب و اطلاعات ساختاری داده ها را در نظر بگیرند. برتر بودن هر دو ویژگی وزن گیری و استخراج ویژگی با انجام آزمایش های گسترده در 6 مجموعه داده های معیار سنجش شد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Analyzing a large number of documents for sentiment analysis entails huge complexity and cost. To alleviate this burden, dimensionality reduction has been applied to documents as a preprocessing step. Among dimensionality reduction algorithms, compared with feature selection, feature extraction can reduce information loss and achieve a higher discriminating power in sentiment classification. However, feature extraction suffers from lack of interpretability and many nonlinear extraction methods, which generally outperform linear methods, are not applicable for sentiment classification because of the characteristics that only provide corresponding low-dimensional coordinates without mapping. Therefore, this research proposes an improved semi-supervised dimensionality reduction framework that simultaneously preserves the advantages of feature extraction and addresses the drawbacks for sentiment classification. The proposed framework is mainly based on linear feature extraction providing mapping and feature weighting is applied before feature extraction. Feature weighting and extraction are conducted in a semi-supervised manner so that both label information and structural information of data can be considered. The superiority of both feature weighting and feature extraction was verified by conducting extensive experiments in six benchmark datasets.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Expert Systems with Applications - Volume 109, 1 November 2018, Pages 49-65
نویسندگان
,