کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6856842 1437971 2018 37 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
On the selection of the correct number of terms for profile construction: Theoretical and empirical analysis
ترجمه فارسی عنوان
در انتخاب تعدادی از اصطلاحات ساختاری مشخصات: تجزیه و تحلیل تئوری و تجربی
کلمات کلیدی
تجزیه و تحلیل محتوا، انتخاب دوره پروفایل های مبتنی بر سند، جستجوگر متخصص
ترجمه چکیده
در این مقاله، مسئله ساخت یک نمایه کاربر را از مجموعه ای از اسناد بررسی می کنیم. این نمایه شامل یک زیرمجموعه ترین نماینده ترین شرایط در اسناد است که بهترین نشان دهنده ترجیحات یا منافع کاربر است. با الهام از تئوری غلظت گسسته ما یک مطالعه محوری از هفت ویژگی انجام دادیم که یک تابع انتخاب باید انجام شود: اصل حداکثر و حداکثر عدم اطمینان، بدون تغییر صفر، غیر ممکن به تحولات مقیاس، اصل افزایش اسمی، اصل انتقال و ثروتمندترین نابرابری غنی تر. ما همچنین یک تابع انتخاب جدید بر اساس استفاده از معیارهای شباهت و بویژه اندازه گیری کسینوس که معمولا در بازیابی اطلاعات استفاده می شود ارائه می دهیم و نشان می دهیم که این شش ویژگی را علاوه بر یک نوع ضعیف اصل انتقال نیز تایید می کند نمایندگی یک رویکرد انتخاب خوب. مطالعه نظری با یک مطالعه تجربی به منظور مقایسه عملکرد معیارهای گوناگون انتخاب (وزن و وزن مبتنی بر) با استفاده از داده های واقعی در یک محیط پارلمانی تکمیل شد. در این مطالعه، عملکرد توابع مختلف را با تمرکز بر دو عامل اصلی که بر روند فرایند انتخاب شده اند، تحلیل می کنیم: اندازه پروفایل (تعداد اصطلاحات) و توزیع وزن. سپس این پروفیل ها در یک کار فیلترینگ سند مورد استفاده قرار می گیرند تا نشان دهند که رویکرد مبتنی بر شباهت ما در شرایط نه تنها از دقت توصیه، بلکه همچنین بهره وری (پروفیل های کوچکتر و در نتیجه توصیه های سریعتر) به دست می آید.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
In this paper, we examine the problem of building a user profile from a set of documents. This profile will consist of a subset of the most representative terms in the documents that best represent user preferences or interests. Inspired by the discrete concentration theory we have conducted an axiomatic study of seven properties that a selection function should fulfill: the minimum and maximum uncertainty principle, invariant to adding zeros, invariant to scale transformations, principle of nominal increase, transfer principle and the richest get richer inequality. We also present a novel selection function based on the use of similarity metrics, and more specifically the cosine measure which is commonly used in information retrieval, and demonstrate that this verifies six of the properties in addition to a weaker variant of the transfer principle, thereby representing a good selection approach. The theoretical study was complemented with an empirical study to compare the performance of different selection criteria (weight- and unweight-based) using real data in a parliamentary setting. In this study, we analyze the performance of the different functions focusing on the two main factors affecting the selection process: profile size (number of terms) and weight distribution. These profiles are then used in a document filtering task to show that our similarity-based approach performs well in terms not only of recommendation accuracy but also efficiency (we obtain smaller profiles and consequently faster recommendations).
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volumes 430–431, March 2018, Pages 142-162
نویسندگان
, , ,