کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4949206 1440040 2017 16 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Identification of relevant subtypes via preweighted sparse clustering
ترجمه فارسی عنوان
شناسایی زیرمجموعه های مربوطه از طریق خوشه بندی پر از ضخامت قبل
ترجمه چکیده
روش های تجزیه و تحلیل خوشه ای برای شناسایی زیرگروه های همگن در یک مجموعه داده استفاده می شود. در برنامه های کاربردی پزشکی، اغلب تجزیه و تحلیل خوشه ای به منظور شناسایی زیر گروه های جالب توجه بیولوژیکی انجام می شود. به طور خاص، ممکن است بخواهید زیرگروه هایی را شناسایی کنید که با یک نتیجه خاص از علاقه مرتبط است. به طور کلی روش های خوشه بندی متعارف چنین زیر گروه هایی را شناسایی نمی کنند، به ویژه هنگامی که تعداد زیادی از ویژگی های واریانس بالا در مجموعه داده ها وجود دارد. روش های متعارف می توانند خوشه های مرتبط با این ویژگی های واریانس بسیار بالا را شناسایی کنند، زمانی که خواسته می شود خوشه های ثانویه را که جالب تر از زیست شناختی هستند یا بیشتر با نتایج خاص مورد توجه قرار می گیرند، به دست آورند. اصلاح خوشه بندی نادر می تواند برای شناسایی خوشه های ثانویه یا خوشه های مرتبط با نتیجه مورد علاقه استفاده شود. این روش به درستی خوشه های مورد علاقه در چندین سناریو شبیه سازی را درست شناسایی می کند. این روش همچنین به یک مطالعه کوهورت چشمگیر در مورد اختلالات تمپوروماندیبولار و یک مجموعه داده های ریزماهواره لوسمی اعمال شده است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
Cluster analysis methods are used to identify homogeneous subgroups in a data set. In biomedical applications, one frequently applies cluster analysis in order to identify biologically interesting subgroups. In particular, one may wish to identify subgroups that are associated with a particular outcome of interest. Conventional clustering methods generally do not identify such subgroups, particularly when there are a large number of high-variance features in the data set. Conventional methods may identify clusters associated with these high-variance features when one wishes to obtain secondary clusters that are more interesting biologically or more strongly associated with a particular outcome of interest. A modification of sparse clustering can be used to identify such secondary clusters or clusters associated with an outcome of interest. This method correctly identifies such clusters of interest in several simulation scenarios. The method is also applied to a large prospective cohort study of temporomandibular disorders and a leukemia microarray data set.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computational Statistics & Data Analysis - Volume 116, December 2017, Pages 139-154
نویسندگان
, ,