کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
8919518 1642893 2017 19 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Evolutionary clustering for categorical data using parametric links among multinomial mixture models
ترجمه فارسی عنوان
خوشه تکاملی برای داده های طبقه بندی شده با استفاده از رابطه پارامتری در میان مدل های ترکیبی چندجملهای
کلمات کلیدی
خوشه تکاملی، توزیع چندجملهای، مدل مخلوط، خوشه بندی مبتنی بر مدل، اطلاعات توییتر،
ترجمه چکیده
یک روش جدید خوشه بندی تکاملی برای داده های طبقه بندی موقتی براساس پیوندهای پارامتری بین مدل های ترکیبی چندجملهای پیشنهاد شده است. به علاوه خوشه بندی، هدف اصلی تفسیر تکامل خوشه ها در طول زمان است. برای این منظور ابتدا فرمول یک مدل عمومی که پیوندهای پارامتری را در میان دو مدل ترکیبی چندجملهای ایجاد می کند پیشنهاد شده است. پس از آن، مدلهای فرعی پارامترهای مختلف به منظور مدلسازی تکامل معمول ساختار خوشه بندی تعریف می شوند. معیارهای انتخاب مدل اجازه می دهد تا بهترین مدل زیر را انتخاب کرده و بنابراین تکامل خوشه ای را حدس بزنید. برای آزمایشات، روش پیشنهادی ابتدا با داده های زمان مصنوعی ارزیابی می شود. بعد، آن را برای تجزیه و تحلیل داده های رسانه های اجتماعی حاوی اطلاعات اعمال می شود. نتایج نشان می دهد که روش پیشنهادی بر اساس معیارهای ارزیابی مشترک بهتر از حالت پیشرفته است. علاوه بر این، می تواند تفسیری درباره تکامل زمانی خوشه ها ارائه دهد.
موضوعات مرتبط
مهندسی و علوم پایه ریاضیات آمار و احتمال
چکیده انگلیسی
A novel evolutionary clustering method for temporal categorical data based on parametric links among the Multinomial mixture models is proposed. Besides clustering, the main goal is to interpret the evolution of clusters over time. To this aim, first the formulation of a generalized model that establishes parametric links among two Multinomial mixture models is proposed. Afterward, different parametric sub-models are defined in order to model the typical evolution of the clustering structure. Model selection criteria allow to select the best sub-model and thus to guess the clustering evolution. For the experiments, the proposed method is first evaluated with synthetic temporal data. Next, it is applied to analyze the annotated social media data. Results show that the proposed method is better than the state-of-the-art based on the common evaluation metrics. Additionally, it can provide interpretation about the temporal evolution of the clusters.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Econometrics and Statistics - Volume 3, July 2017, Pages 141-159
نویسندگان
, , , ,