کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6856305 1437951 2018 41 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
How “small” reflects “large”?-Representative information measurement and extraction
ترجمه فارسی عنوان
چطور؟ بزرگنمایی را نشان می دهد - اندازه گیری و استخراج اطلاعات نماینده
کلمات کلیدی
ترجمه چکیده
در حالی که خدمات وب رشد سریع داده ها را برای استفاده انجام می دهند، شناسایی اطلاعات مفید از ارزش بسیار بالایی برخوردار است، به ویژه هنگامی که کاربران با ناخوشایند از اطلاعات مواجه می شوند. بنابراین، مناسب و معنی دار است که کاربران با یک زیرمجموعه نماینده (به عنوان مثال مجموعه کوچکی) ارائه دهند که بتواند کپچر اطلاعات اصلی (یعنی مجموعه بزرگ) را بازتاب دهد. در چنین زمینه ای بزرگ، این مقاله به بررسی مسائل نمایندگی در زمینه اندازه گیری و استخراج با بررسی تلاش های قبلی ما می پردازد. به طور خاص، ما ابتدا معیارهای مختلف را از دیدگاه های مختلف نمایندگی مورد بحث قرار می دهیم، سپس مجموعه ای از روش های استخراج پذیری مربوطه را ارائه می دهیم. در نهایت به عنوان یک مکمل و فرمت، یک تلاش اخیر معرفی شده است که هدف آن، ایجاد کیفیت زیر مجموعه ای است که با توجه به کیفیت اطلاعات مورد توجه قرار می گیرد. روش استخراج پیشنهاد شده توسط آزمایشات داده های گسترده در دنیای واقعی توجیه شده است، و برتری آن را به دیگران در اثربخشی و کارایی نشان می دهد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
While web services avail a rapid growth of data volume for use, identifying helpful information is of great value, especially when users face with an unwilling glut of information. Thus, it is deemed relevant and meaningful to provide users with a representative subset (i.e., small set) that could well reflect the original information corpus (i.e., large set). In such a large-small context, this paper addresses the issues of representativeness in light of measurement and extraction by reviewing our previous efforts. Specifically, we first discuss various metrics from different perspectives of representativeness, then present a series of related representativeness extraction methods. Finally as a supplement and extension, a recent effort is introduced, which aims to take information quality into account in deriving a ranked subset. The proposed extraction method is justified by extensive real-world data experiments, showing its superiority to others in both effectiveness and efficiency.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volumes 460–461, September 2018, Pages 519-540
نویسندگان
, , , , ,