کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6883153 1444129 2018 16 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Intelligent assistance for data pre-processing
ترجمه فارسی عنوان
کمک هوشمند برای پیش پردازش اطلاعات
کلمات کلیدی
ترجمه چکیده
الگوریتم داده کاوی ممکن است بر روی داده های مجموعه ای با ویژگی های مختلف متفاوت عمل کند، مثلا ممکن است در یک مجموعه داده با ویژگی های پیوسته بهتر از ویژگی های طبقه بندی شده یا در اطراف دیگر بهتر عمل کند. به طور معمول، قبل از معدن، یک مجموعه داده نیاز به پردازش دارد. با در نظر گرفتن تمام اپراتورهای پیش پردازش احتمالی، تعداد زیادی جایگزین وجود دارد. به عنوان یک نتیجه، کاربران غیر مجاز با گزینه های پیش پردازش غرق می شوند. در این مقاله، ما نشان می دهیم که با خودکار سازی پیش پردازش با پشتیبانی فرا یادگیری می توان مشکل را حل کرد. برای این منظور، طیف گسترده ای از تکنیک های پیش پردازش داده ها و مجموعه ای از الگوریتم های طبقه بندی را تحلیل کردیم. برای هر الگوریتم طبقه بندی که ما در نظر می گیریم و یک مجموعه داده اختصاص داده شده، ما قادر به طور خودکار تغییرات را پیشنهاد می کنیم که کیفیت نتایج الگوریتم در مجموعه داده ها را بهبود می بخشد. رویکرد ما به کاربران غیر متخصص کمک می کند تا به طور موثر تر تبدیل به برنامه های کاربردی خود را شناسایی کنند و از این رو برای دستیابی به نتایج بهبود یافته.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر شبکه های کامپیوتری و ارتباطات
چکیده انگلیسی
A data mining algorithm may perform differently on datasets with different characteristics, e.g., it might perform better on a dataset with continuous attributes rather than with categorical attributes, or the other way around. Typically, a dataset needs to be pre-processed before being mined. Taking into account all the possible pre-processing operators, there exists a staggeringly large number of alternatives. As a consequence, non-experienced users become overwhelmed with pre-processing alternatives. In this paper, we show that the problem can be addressed by automating the pre-processing with the support of meta-learning. To this end, we analyzed a wide range of data pre-processing techniques and a set of classification algorithms. For each classification algorithm that we consider and a given dataset, we are able to automatically suggest the transformations that improve the quality of the results of the algorithm on the dataset. Our approach will help non-expert users to more effectively identify the transformations appropriate to their applications, and hence to achieve improved results.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computer Standards & Interfaces - Volume 57, March 2018, Pages 101-109
نویسندگان
, , , ,