کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4943015 1437614 2018 37 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A scheme for high level data classification using random walk and network measures
ترجمه فارسی عنوان
یک طرح طبقه بندی داده با سطح بالا با استفاده از روش های تصادفی پیاده روی و شبکه
کلمات کلیدی
نظارت بر یادگیری، طبقه بندی داده ها، یادگیری مبتنی بر شبکه، طبقه بندی بالا، زنجیره مارکوف، پیاده روی تصادفی، محدود کردن احتمالات، حالت دائمی،
ترجمه چکیده
نظارت بر روش های طبقه بندی شده است که از اطلاعات فیزیکی داده های تجزیه و تحلیل شده، از قبیل شباهت، توزیع و سایر ویژگی های سطح پایین استفاده می کنند. علیرغم ارتباط این ویژگی ها، آثار اخیر نشان داده است که با ترکیب ویژگی های سطح پایین و سطح بالا می توان انواع مختلف الگوهای را شناسایی کرد. در این مقاله، یک روش طبقه بندی تحت نظارت ارائه می شود که احتمال محدود شدن تئوری راه رفتن تصادفی را بر روی شبکه های زیرین ساخته شده از داده های حاوی اطلاعات وارد می کند. ویژگی جذاب روش پیشنهادی این است که ماتریس مجاورت که اطلاعات فیزیکی و ساختاری را در مورد داده ها حمل می کند. اطلاعات ساختاری توسط ویژگی های استخراج شده از اتصالات شبکه داده می شود. کلاس یک نمونه بدون برچسب مشخص شده توسط یک اکتشافی به نام "سهولت دسترسی" محاسبه می شود که توسط روش پیاده روی تصادفی بر روی ماتریس مجاورت اندازه گیری می شود. چنین رویکردی تکنیکی را به طور کلی به کار می برد، زیرا می تواند داده های متمایز داده ای مورد علاقه در ماتریس اتصال شبکه داده های زیر را برای هدایت واکر تصادفی ایجاد کند. به طور خاص، ما نمونه هایی از ترکیبی از ویژگی های پایین و سطح بالا در طرح طبقه بندی پیشنهاد شده را نشان می دهد. نتایج شبیه سازی با استفاده از مجموعه داده های مصنوعی و واقعی نشان می دهد که تکنیک پیشنهادی نه تنها رقابتی با تکنیک های طبقه بندی فعلی و سازگار است، بلکه می تواند الگوهای ساختاری ذاتی شکل داده شده توسط داده های ورودی را نیز نشان دهد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Supervised classification techniques are known to exploit physical information of the analysed data, such as similarity, distribution and other low level features. Despite the relevance of such features, recent works have showed that a higher variety of patterns can be detected by combining low level and high level features. In this paper, it is proposed a supervised classification technique which applies limiting probabilities of the random walk theory over underlying networks constructed from input labeled data. The appealing feature of the proposed approach is that the adjacency matrix which carries both physical and structural information about the data. Structural information are given by features extracted from network connections. The class of a given unlabeled sample is estimated by a heuristic called ease of access, which is measured by the random walk process over the adjacency matrix. Such approach makes the technique quite general as one can put distinct data measures of interest in the connection matrix of the underlying data network to guide the random walker. Specifically, we show examples of combining low and high level features in the proposed classification scheme. Simulation results using artificial and real data sets suggest that the proposed technique is not only competitive with current and established classification techniques, but it also can reveal intrinsic structural patterns formed by the input data.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Expert Systems with Applications - Volume 92, February 2018, Pages 289-303
نویسندگان
, , , , ,