کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4945146 1438298 2017 28 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Result Merging for Structured Queries on the Deep Web with Active Relevance Weight Estimation
ترجمه فارسی عنوان
نتیجه ادغام پرسشهای ساخت یافته بر روی وب عمیق با برآورد وزن واقعی مربوط به فعال
کلمات کلیدی
رتبه بندی وب عمیق، نمایش داده شده ساختار یافته، ادغام اطلاعات،
ترجمه چکیده
سیستم های یکپارچه سازی داده ها در شبکه عمیق، یک ابزار شفاف برای پرس و جو چندین منبع داده در یک بار است. ادغام نتایج - تولید یک لیست کلی رتبه بندی نتایج از منابع مختلف در پاسخ به پرس و جو - یک جزء کلیدی از یک سیستم ادغام داده است. در این کار ما یک مدل ادغام یافته ای را ارائه می دهیم که مدل برآورد وزن واقعی مربوط به آن است. از تکنیک های موجود برای تلفیق نتیجه متفاوت است، ارتباط یک منبع داده را در پاسخ دادن به پرس و جو در زمان پرس و جو بررسی می کنیم. ربط ها برای مجموعه ای از منابع داده ها با یک طرح (وزن نرمال شده) بیان می شود: هرچه وزن برای یک منبع داده بیشتر باشد، منبع در جواب دادن به پرس و جو است. ما مقادیر یک منبع داده را در هر زیر مجموعه منابع داده درگیر در یک پرس و جو آموزش تخمین می زنیم. از آنجا که یک پرس و جو آنلاین ممکن است دقیقا با هر پرس و جو آموزشی مطابقت نداشته باشد، ما روش هایی را برای بدست آوردن یک زیرمجموعه از پرس و جو آموزش هایی که مربوط به پرس و جو آنلاین است، طراحی می کنیم. ما مقادیر مربوطه از پرس و جو آنلاین را از وزن این زیر مجموعه از پرسشنامه های آموزش محاسبه می کنیم. آزمایشات ما نشان می دهد که روش ما بهتر از الگوریتم های ادغام پیشرو با زمان پاسخ قابل مقایسه است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Data integration systems on the Deep Web offer a transparent means to query multiple data sources at once. Result merging- the generation of an overall ranked list of results from different sources in response to a query- is a key component of a data integration system. In this work we present a result merging model, called Active Relevance Weight Estimation model. Different from the existing techniques for result merging, we estimate the relevance of a data source in answering a query at query time. The relevances for a set of data sources are expressed with a (normalized) weighting scheme: the larger the weight for a data source the more relevant the source is in answering a query. We estimate the weights of a data source in each subset of the data sources involved in a training query. Because an online query may not exactly match any training query, we devise methods to obtain a subset of training queries that are related to the online query. We estimate the relevance weights of the online query from the weights of this subset of training queries. Our experiments show that our method outperforms the leading merging algorithms with comparable response time.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Systems - Volume 64, March 2017, Pages 93-103
نویسندگان
, , , , ,