کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6948319 1451031 2018 13 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
By the numbers: The magic of numerical intelligence in text analytic systems
ترجمه فارسی عنوان
با شماره: جادوی هوش عددی در سیستم های تحلیلی متن
کلمات کلیدی
تجزیه و تحلیل متن، بازیابی اطلاعات، صفات عددی، کشف نقص،
ترجمه چکیده
در میان محققین و متخصصان اطلاعات بین المللی، شناخت رو به رشدی وجود دارد که رسانه های اجتماعی منابع ارزشمندی از اطلاعات کسب و کار را ارائه می دهند. با این وجود، چالش باقی مانده اطلاعات مربوطه و مفید در میان ارسال های بزرگ باقی مانده است. روش های خودکار مبتنی بر مین گذاری متن در سال های اخیر با کشف انواع روش ها و ویژگی های پیشرفت قابل توجهی داشته اند. این مطالعه به وسیله معرفی یک روش جدید استخراج متن متمرکز بر عبارات عددی موجود در اسناد متنی به این جریان افزوده می شود. در این روش، عبارات عددی استخراج، طبقه بندی شده و باینند و حضور و اندازه آنها به عنوان ویژگی های سند ذخیره می شود. ما با استفاده از یک مطالعه موردی از صنعت خودرو، نشان می دهیم که عبارات عددی قابل اطمینان می تواند شناسایی شود و این ویژگی های عددی باعث پیشرفت در طبقه بندی سند می شود. به عنوان یک پیشرفت در این مطالعه مورد، ما یک سیستم پشتیبانی تصمیم برای مدیریت کیفیت محصول با استفاده از ویژگی های متنی و عددی کمک می کنیم.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر سیستم های اطلاعاتی
چکیده انگلیسی
There is a growing recognition among MIS researchers and practitioners that social media provide a valuable source of business intelligence. Unearthing relevant and useful information among the voluminous postings remains a challenge, however. Automated methods based on text mining have made significant progress in recent years by discovering a variety of new methods and features. This study adds to this stream by introducing a novel text mining procedure centered around numerical expressions contained in text documents. In this method, numerical expressions are extracted, categorized, and binned, and their presence and magnitude are stored as document features. We demonstrate, using a case study from the automotive industry, that numerical expressions can be reliably identified, and that these numerical features enable improvements in document classification. As an extension to this case study, we contribute a decision support system for managing product quality using both textual and numerical attributes.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Decision Support Systems - Volume 113, September 2018, Pages 86-98
نویسندگان
, , , ,