کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
8941771 1645027 2018 17 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A soft computing approach to big data summarization
ترجمه فارسی عنوان
رویکرد محاسباتی نرم به خلاصه بزرگ داده ها
کلمات کلیدی
شخصی سازی داده ها، خلاصه زبانی، محاسبات نرم، استخراج دانش، تجسم، اندازه گیری دقیق،
ترجمه چکیده
ارزش افزوده یک مجموعه داده در دانش است که یک متخصص دامنه می تواند از آن استخراج کند. با توجه به حجم و سرعت در حال افزایش این مجموعه داده ها، باید ابزارهای کارآمد برای تولید بازخورد معنی دار، چگالنده و قابل تفسیر انسان از مجموعه داده های بزرگ تعریف شود. در رویکرد پیشنهادی، تکنیک های محاسبات نرم برای تعریف یک رابط بین فضای عددی و قطعی تعریف داده ها و فضای زبانی منطق فکری استفاده می شود. بر اساس واژگان متخصص خود در مورد داده ها، یک خلاصه شخصی متشکل از اصطلاحات زبانی به طور موثری تولید شده و به صورت ابر گرافیکی نمایش داده می شود که یک دید مصنوعی از خواص داده ها را نشان می دهد. با استفاده از استراتژی های نمایه سازی اختصاصی که داده های مربوط به آنها و بازنویسی زبان های ذهنی خود را مرتبط می شوند، ویژگی های اکتشافی در بالای خلاصه قرار می گیرند تا کاربر را قادر به مرور داده ها کند. آزمایشات ثابت می کنند که تغییر فضای در زمان خطی عمل می کند. اندازه مجموعه داده ها روشی را که در داده های مقیاس بزرگ قابل ردیابی است، می گیرد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
The added value of a dataset lies in the knowledge a domain expert can extract from it. Considering the continuously increasing volume and velocity of these datasets, efficient tools have to be defined to generate meaningful, condensed and human-interpretable representations of big datasets. In the proposed approach, soft computing techniques are used to define an interface between the numerical and categorical space of data definition and the linguistic space of human reasoning. Based on the expert's own vocabulary about the data, a personal summary composed of linguistic terms is efficiently generated and graphically displayed as a term cloud offering a synthetic view of the data properties. Using dedicated indexing strategies linking data and their subjective linguistic rewritings, exploration functionalities are provided on top of the summary to let the user browse the data. Experimentations confirm that the space change operates in linear time wrt. the size of the dataset making the approach tractable on large scale data.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Fuzzy Sets and Systems - Volume 348, 1 October 2018, Pages 4-20
نویسندگان
, , , ,