کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4946650 1439409 2017 33 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Effects of additional data on Bayesian clustering
ترجمه فارسی عنوان
اثر داده های اضافی در خوشه بندی بیزی
کلمات کلیدی
یادگیری بی نظیر، یادگیری نیمه نظارتی، مدل های پارامتری سلسله مراتبی، برآورد متغیر نامحدود،
ترجمه چکیده
مدل های احتمالاتی سلسله مراتبی مانند مدل های مخلوط برای تجزیه خوشه ای استفاده می شود. این مدل ها دارای دو نوع متغیر هستند: قابل مشاهده و پنهان. در تجزیه خوشه، متغیر پنهان تخمین زده می شود و انتظار می رود که اطلاعات اضافی دقت برآورد متغیر پنهان را بهبود بخشد. بسیاری از روش های یادگیری پیشنهادی قادر به استفاده از اطلاعات اضافی هستند. این شامل یادگیری نیمه نظارت و انتقال است. با این حال، از لحاظ آماری، یک مدل احتمالاتی پیچیده که شامل اطلاعات ابتدایی و اضافی می شود، به دلیل داشتن یک پارامتر بالاتر، کمتر دقیق است. مقاله حاضر، تحلیل نظری دقت مدل را ارائه می دهد و مشخص می کند که کدام عامل دارای بیشترین تاثیر بر دقت آن، مزایای به دست آوردن اطلاعات اضافی و معایب افزایش پیچیدگی است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Hierarchical probabilistic models, such as mixture models, are used for cluster analysis. These models have two types of variables: observable and latent. In cluster analysis, the latent variable is estimated, and it is expected that additional information will improve the accuracy of the estimation of the latent variable. Many proposed learning methods are able to use additional data; these include semi-supervised learning and transfer learning. However, from a statistical point of view, a complex probabilistic model that encompasses both the initial and additional data might be less accurate due to having a higher-dimensional parameter. The present paper presents a theoretical analysis of the accuracy of such a model and clarifies which factor has the greatest effect on its accuracy, the advantages of obtaining additional data, and the disadvantages of increasing the complexity.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neural Networks - Volume 94, October 2017, Pages 86-95
نویسندگان
,