کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
10321935 660776 2015 15 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Learning to classify short text from scientific documents using topic models with various types of knowledge
ترجمه فارسی عنوان
یادگیری طبقه بندی متن کوتاه از اسناد علمی با استفاده از مدل های موضوعی با انواع مختلف دانش
ترجمه چکیده
طبقه بندی متن کوتاه با توجه به کمبود داده ها به چالش کشیده می شود که یک ویژگی معمول متن کوتاه است. در این مقاله، روش هایی برای ارتقاء ویژگی ها با استفاده از مدل های موضوعی پیشنهاد می شود که متن کوتاه به نظر می رسد کمیاب تر و موضوع بندی تر برای طبقه بندی است. ما با استفاده از تجزیه و تحلیل مدل موضوعی براساس تخصیص منابع نامعتبر برای مجموعه داده های غنی شده سوء استفاده کردیم و سپس روش های جدیدی را برای ارتقاء ویژگی ها با ترکیب متون خارجی از مدل های موضوعی که اسناد را برای طبقه بندی موثر تر می بریم ارائه دادیم. در آزمایشات ما مقادیر عنوان مقالات علمی را به عنوان اسناد متن کوتاه مورد استفاده قرار دادیم و سپس این اسناد را با استفاده از مدل های موضوعی از انواع مختلف مجموعه داده های جهانی برای طبقه بندی به منظور نشان دادن رویکرد ما به طور موثر، غنی سازی کردیم.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Classification of short text is challenging due to data sparseness, which is a typical characteristic of short text. In this paper, we propose methods for enhancing features using topic models, which make short text seem less sparse and more topic-oriented for classification. We exploited topic model analysis based on Latent Dirichlet Allocation for enriched datasets, and then we presented new methods for enhancing features by combining external texts from topic models that make documents more effective for classification. In experiments, we utilized the title contents of scientific articles as short text documents, and then enriched these documents using topic models from various types of universal datasets for classification in order to show that our approach performs efficiently.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Expert Systems with Applications - Volume 42, Issue 3, 15 February 2015, Pages 1684-1698
نویسندگان
, ,