کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
6857073 | 664772 | 2016 | 21 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Towards automation of knowledge understanding: An approach for probabilistic generative classifiers
ترجمه فارسی عنوان
به سوی اتوماسیون به درک دانش: یک رویکرد برای طبقه بندی های احتمالی مولد
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
داده کاوی، درک دانش، طبقه بندی های احتمالی، طبقه بندی تولیدی، جالب
ترجمه چکیده
پس از انتخاب داده ها، پیش پردازش، تحول و استخراج ویژگی، استخراج دانش مرحله نهایی در فرایند استخراج داده ها نیست. پس از آن لازم است که این دانش را درک کنیم تا آن را به طور موثر و کارآمد مورد استفاده قرار دهیم. تا کنون کمبود تکنیک های مناسب وجود دارد که از این گام مهم پشتیبانی می کند. این امر تا حدی به دلیل این واقعیت است که ارزیابی دانش اغلب بسیار ذهنی است، مثلا در مورد جنبه هایی مانند نوآوری یا مفید بودن. این جنبه ها به دانش خاص و الزامات معدنچی داده وابسته است. با این حال، تعدادی از جنبه هایی که هدفمند هستند و برای آن امکان پذیر است اقدامات مناسب وجود دارد. در این مقاله ما بر روی مشکلات طبقه بندی و استفاده از طبقه بندی های تولید کننده احتمالی بر اساس مدل های چگالی مخلوط که در برنامه های کاربردی داده کاوی معمول هستند، تمرکز می کنیم. ما تعاریف عینی را برای ارزیابی اطالعات، منحصر به فرد، اهمیت، تبعیض، نمایندگی، عدم قطعیت و تمایز قواعد موجود در این طبقه بندی ها به صورت عددی تعریف می کنیم. این اقدامات نه تنها از یک معدنچی داده پشتیبانی می کند در ارزیابی نتایج فرآیند استخراج داده ها بر اساس چنین طبقه بندی ها. همانطور که در مطالعات موردی نشان داده شده است، آنها همچنین می توانند برای بهبود فرآیند داده کاوی خود و یا حمایت از کاربرد بعدی دانش مورد استفاده قرار گیرند.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
هوش مصنوعی
چکیده انگلیسی
After data selection, pre-processing, transformation, and feature extraction, knowledge extraction is not the final step in a data mining process. It is then necessary to understand this knowledge in order to apply it efficiently and effectively. Up to now, there is a lack of appropriate techniques that support this significant step. This is partly due to the fact that the assessment of knowledge is often highly subjective, e.g., regarding aspects such as novelty or usefulness. These aspects depend on the specific knowledge and requirements of the data miner. There are, however, a number of aspects that are objective and for which it is possible to provide appropriate measures. In this article we focus on classification problems and use probabilistic generative classifiers based on mixture density models that are quite common in data mining applications. We define objective measures to assess the informativeness, uniqueness, importance, discrimination, representativity, uncertainty, and distinguishability of rules contained in these classifiers numerically. These measures not only support a data miner in evaluating results of a data mining process based on such classifiers. As we will see in illustrative case studies, they may also be used to improve the data mining process itself or to support the later application of the extracted knowledge.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volumes 370â371, 20 November 2016, Pages 476-496
Journal: Information Sciences - Volumes 370â371, 20 November 2016, Pages 476-496
نویسندگان
Dominik Fisch, Christian Gruhl, Edgar Kalkowski, Bernhard Sick, Seppo J. Ovaska,