کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4944824 1438009 2017 40 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Experts community memory for entity similarity functions recommendation
ترجمه فارسی عنوان
حافظه جامعه کارشناسان برای توصیف عملکرد شباهت حوضه
کلمات کلیدی
تطابق سازنده، تابع شباهت، کسب دانش افزایی، جستجوی مشابه اندازه گیری مشابهی توصیه ها،
ترجمه چکیده
جستجوی مشابه (یا جستجو در یک سازمان مشابه) فرآیند یافتن تمام اشخاصی است که به یک نهاد داده شده (به عنوان مثال، یک فرد، یک سند یا یک تصویر) یافت می شود. اگرچه در گذشته تکنیک های تجزیه و تحلیل شباهت ها پیشنهاد شده است، اما کار کمی در مورد اینکه کدام تکنیک های ارائه شده برای یک کار جستجو برای تشخیص دقیق تر مناسب هستند، انجام شده است. دانستن عملکرد شباهت درست مهم است، زیرا وظیفه بسیار وابسته به دامنه و داده است. در این مقاله، ما یک رویکرد برای پیشنهاد اینکه توابع مشابه (برای مثال، ویرایش فاصله یا شباهت مجدد) باید پیشنهاد شود، برای اندازه گیری شباهت بین دو نهاد استفاده می شود. این رویکرد یک تکنیک تکمیل دانش برای استخراج دانش کارشناسان دامنه در مورد توابع تشریح و زمینه های استفاده از آنها (به عنوان مثال، کلاس نهاد، نام ویژگی و برخی از کلمات کلیدی) استفاده می کند. علاوه بر این، برای شرایطی که کارشناسان دامنه اطلاعات کمی درباره مجموعه داده ها دارند یا نه، ما ویژگی های مجموعه داده ها را تجزیه و تحلیل می کنیم و سپس تابع شباهت را براساس ویژگی های شناسایی ارائه می کنیم. ما همچنین امکان و اثربخشی رویکرد پیشنهادی ما را در چندین مجموعه داده های دنیای واقعی از حوزه های مختلف نشان می دهیم.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Similarity search (or similar entity search) is the process of finding all entities similar to a given entity (e.g., a person, a document, or an image). Although many techniques for similarity analysis have been proposed in the past, little work has been done on the question of which of the presented techniques are most suitable for a given similarity search task. Knowing the right similarity function is important as the task is highly domain- and data-dependent. In this article, we provide an approach for recommending which similarity functions (e.g., edit distance or jaccard similarity) should be used for measuring the similarity between two entities. The approach employs an incremental knowledge acquisition technique for capturing domain experts' knowledge about similarity functions and their usage contexts (e.g., entity class, attribute name and some keywords). In addition, for situations where domain experts have little or no knowledge about datasets, we analyze the features of the datasets and then suggest similarity functions based on the identified features. We also demonstrate the feasibility and effectiveness of our proposed approach on several real-world datasets from different domains.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volume 379, 10 February 2017, Pages 338-355
نویسندگان
, ,