کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
10358404 868272 2015 12 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Problems and challenges of information resources producers' clustering
ترجمه فارسی عنوان
مشکلات و چالش های خوشه بندی تولیدکنندگان منابع اطلاعاتی
کلمات کلیدی
ترجمه چکیده
به طور کلاسیک، تکنیک های یادگیری ماشین بی نظیر در مجموعه داده ها با تعداد ثابت از صفات (متغیرها) اعمال می شود. با این حال، بسیاری از مشکلات موجود در زمینه اطلاعرسانی با ما مواجه می شوند و نیاز به گسترش این روش ها را به طوری که آنها را می توان بر روی یک مجموعه ای از بردارهای مرتب نشده از طول نابرابر محاسبه کرد. بنابراین، در این مقاله، برخی از اقدامات جدید عدم همبستگی (معیارهای) معرفی و مطالعه می شود. به همین دلیل ما ممکن است از مثال استفاده کنیم الگوریتم خوشه بندی سلسله مراتبی به منظور تعیین پارتیشن مجموعه داده ورودی متشکل از مجموعه تولید کنندگان که نه تنها با توجه به کیفیت منابع اطلاعاتی بلکه همچنین میزان آنها همگن هستند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نرم افزارهای علوم کامپیوتر
چکیده انگلیسی
Classically, unsupervised machine learning techniques are applied on data sets with fixed number of attributes (variables). However, many problems encountered in the field of informetrics face us with the need to extend these kinds of methods in a way such that they may be computed over a set of nonincreasingly ordered vectors of unequal lengths. Thus, in this paper, some new dissimilarity measures (metrics) are introduced and studied. Owing to that we may use, e.g. hierarchical clustering algorithms in order to determine an input data set's partition consisting of sets of producers that are homogeneous not only with respect to the quality of information resources, but also their quantity.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Journal of Informetrics - Volume 9, Issue 2, April 2015, Pages 273-284
نویسندگان
, , ,