کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6948490 1451065 2015 12 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Process mining on noisy logs - Can log sanitization help to improve performance?
ترجمه فارسی عنوان
استخراج فرایند در سیاهههای آهنی - آیا می توانم به منظور بهبود عملکردها، سونیتیزاسیون را امتحان کنم؟
کلمات کلیدی
معدن فرایند، معیار سنجش، داده های پر سر و صدا، بهداشت دهان و دندان معیارهای، قوانین،
ترجمه چکیده
تکنیک های استخراج فرآیند برای خواندن پروسه های پردازش طراحی شده و مدل های فرآیند را از آنها استخراج می کنند. با این حال، سیاهههای مربوط به دنیای واقعی اغلب پر سر و صدا هستند و چنین سیاهههای مربوط تولید مدل های فرآیند مشابه و مشابه اسپاگتی را تولید می کند. ما پیشنهاد می کنیم یک تکنیک برای پاکسازی سیاهههای مربوط به سر و صدا با ایجاد یک طبقه بندی در یک زیر مجموعه از ورود به سیستم، و اعمال قوانین طبقه بندی برای حذف ردیابی های پر سر و صدا از ورود به سیستم. بهبود کیفیت مدل های حاصل از فرآیند در مصارف ورودی از مدل های معیار افزایش پیچیدگی در مورد فراخوانی رفتاری و ساختاری و معیارهای دقیق ارزیابی می شود. نتایج نشان می دهد که مدل های استخراج شده از این قبیل پردازش های پیش پردازنده بر روی چندین معیار ارزیابی برتر هستند. آنها نسبت به مدل های مرجع، وفاداری بیشتری نشان می دهند، و همچنین با عناصر کمتری جمع می شوند. یک ویژگی خوب از رویکرد مبتنی بر قانون، این است که آن را به هر الگوی نویز تعمیم می دهد، زیرا ماهیت نویز متفاوت است از یک ورود به سیستم دیگر. قوانین نیز قابل توضیح هستند و ممکن است به صورت دستی تغییر داده شوند. ما همچنین نتایج آزمایشات را با یک مجموعه داده واقعی ارائه می دهیم.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر سیستم های اطلاعاتی
چکیده انگلیسی
Process mining techniques are designed to read process logs and extract process models from them. However, real world logs are often noisy and such logs produce bad, spaghetti-like process models. We propose a technique to sanitize noisy logs by first building a classifier on a subset of the log, and applying the classifier rules to remove noisy traces from the log. The improvement in the quality of the resulting process models is evaluated on synthetic logs from benchmark models of increasing complexity on both behavioral and structural recall and precision metrics. The results show that mined models produced from such preprocessed logs are superior on several evaluation metrics. They show better fidelity to the reference models, and are also more compact with fewer elements. A nice feature of the rule based approach is that it generalizes to any noise pattern since the nature of noise varies from one log to another. The rules can also be explained and may be further modified manually. We also give results from experiments with a real dataset.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Decision Support Systems - Volume 79, November 2015, Pages 138-149
نویسندگان
, ,