کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6856401 1437956 2018 14 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Characteristic sets and generalized maximal consistent blocks in mining incomplete data
ترجمه فارسی عنوان
مجموعه های مشخصه و بلوک های سازگار حداکثر تعمیم یافته در داده های ناقص معدن
کلمات کلیدی
استخراج اطلاعات ناقص، مجموعه های مشخص بلوک های حداکثر سازگار، نظریه مجموعه خشن، تقریبی احتمالاتی،
ترجمه چکیده
داده های ناقص استخراج معادن با استفاده از تقریبی بر اساس مجموعه های مشخصه یک روش خوب است. این برای مجموعه داده های ناقص با چند تفسیر از ارزش های مشخص شده از دست رفته، به عنوان مثال، ارزش های از دست رفته و نه ؟؟ مراقبت ؟؟ شرایط از سوی دیگر، بلوک های سازگار حداکثر برای مجموعه داده های ناقص معرفی شده بود که تنها به آن توجه نمی شد؟ شرایط، با استفاده از تقریب های پایین تر و بالاتر. در این مقاله ضمیمه بلوک های حداکثر سازنده به مجموعه داده های ناقص با هر تفسیری از ارزش های معیوب گمشده و تقریبی احتمالاتی معرفی می کنیم. ما نتایج جدیدی را در تقریب احتمالاتی بر اساس بلوک های سازگار حداکثر سازگار ثابت می کنیم. علاوه بر این، ما نتایج آزمایشات مربوط به داده های ناقص استخراج را با استفاده از هر دو مجموعه مشخصه و بلوک های حداکثر سازگار ارائه می کنیم و با استفاده از دو تفسیر از ارزش های معیوب گمشده: ارزش های از دست رفته و مراقبت نمی کنیم شرایط ما نشان می دهیم که شواهدی وجود دارد که بهترین روش استفاده از تقریب های احتمالی محدوده بر اساس مجموعه های مشخصه یا بلوک های حداکثر سازگار است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Mining incomplete data using approximations based on characteristic sets is a well-established technique. It is applicable to incomplete data sets with a few interpretations of missing attribute values, e.g., lost values and “do not care” conditions. On the other hand, maximal consistent blocks were introduced for incomplete data sets with only “do not care” conditions, using only lower and upper approximations. In this paper we introduce an extension of the maximal consistent blocks to incomplete data sets with any interpretation of missing attribute values and with probabilistic approximations. We prove new results on probabilistic approximations based on generalized maximal consistent blocks. Additionally, we present results of experiments on mining incomplete data using both characteristic sets and maximal consistent blocks and using two interpretations of missing attribute values: lost values and “do not care” conditions. We show that there is some evidence that the best approach is using middle probabilistic approximations based on characteristic sets or on maximal consistent blocks.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volume 453, July 2018, Pages 66-79
نویسندگان
, , , ,