کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4943434 1437634 2017 33 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A framework for data transformation in Credit Behavioral Scoring applications based on Model Driven Development
ترجمه فارسی عنوان
چارچوبی برای تبدیل داده ها در برنامه های اعتبار سنجی رفتاری مبتنی بر توسعه مدل رانده شده است
کلمات کلیدی
داده کاوی، طبقه بندی نسبی، نمره رفتاری اعتباری، مدل رانده توسعه، 00-01، 99-00،
ترجمه چکیده
مرحله پیش پردازش در پروژه های کشف دانش هزینه زیادی دارد، معمولا بین 50 تا 80 درصد کل زمان پروژه را می گیرد. در این مرحله، داده ها در یک پایگاه داده رابطه ای برای استفاده از تکنیک داده کاوی تغییر می کنند. این مرحله یک کار پیچیده است که از طراحان پایگاه داده یک تعامل قوی با کارشناسان که دانش گسترده ای در مورد دامنه برنامه دارند، از طراحان می خواهد. چارچوب هایی که به منظور ساماندهی این مرحله محدودیت های قابل توجهی در هنگام استفاده از راه حل های اعتبار سنجی رفتاری دارند محدودیت هایی دارند. این مقاله یک چارچوب مبتنی بر رویکرد توسعه مدرن را برای ساماندهی مراحل ذکر شده ارائه می دهد. این کار سه اصل اصلی دارد: 1) بهبود قدرت تفکیک تکنیک های داده کاوی با استفاده از ساختن متغیرهای ورودی جدید که دانش زمانی را برای تکنیک جاسازی می کند؛ 2) کاهش زمان انتقال داده ها با استفاده از تولید خودکار کد؛ و 3) اجازه دادن به هوش مصنوعی و مدل سازان آمار برای انجام تبدیل داده ها بدون کمک متخصصان پایگاه داده. به منظور تأیید چارچوب پیشنهادی، دو مطالعه تطبیقی انجام شد. آزمایشات نشان دادند که چارچوب پیشنهادی یک عملکرد مشابه یا برتر از چارچوب های موجود را فراهم می کند و زمان انتقال داده ها را با سطح اطمینان 95٪ کاهش می دهد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
The preprocessing stage in knowledge discovery projects is costly, normally taking between 50% and 80% of the total project time. It is in this stage that data in a relational database are transformed for applying a data mining technique. This stage is a complex task that demands from database designers a strong interaction with experts having a broad knowledge about the application domain. Frameworks aiming to systemize this stage have significant limitations when applied to Credit Behavioral Scoring solutions. This paper proposes a framework based on the Model Driven Development approach to systemize the mentioned stage. This work has three main contributions: 1) improving the discriminant power of data mining techniques by means of the construction of new input variables which embed temporal knowledge for the technique; 2) reducing the time of data transformation using automatic code generation, and 3) allowing artificial intelligence and statistics modelers to perform the data transformation without the help of database experts. In order to validate the proposed framework, two comparative studies were conducted. Experiments showed that the proposed framework delivers a performance equivalent or superior to those of existing frameworks and reduces the time of data transformation with a confidence level of 95%.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Expert Systems with Applications - Volume 72, 15 April 2017, Pages 293-305
نویسندگان
, , ,