کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
4950550 | 1440647 | 2017 | 8 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Clustering of trending topics in microblogging posts: A graph-based approach
ترجمه فارسی عنوان
خوشه بندی موضوعات مورد نظر در پست های میکروبلاگینگ: رویکرد مبتنی بر گراف
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
خوشه بندی تشخیص جوامع، توییتر، میکروبلاگینگ، نمودار اجتماعی، رسانه های اجتماعی،
ترجمه چکیده
در این مقاله روش جدیدی ارائه می کنیم که شبکه اجتماعی را به عنوان یک شبکه حساب های میکروبلاگینگ تجزیه می کند. بر اساس هشتگ ها در پست های کاربران، ما نه تنها محبوب ترین موضوعات را تشخیص می دهیم، کاربران در حال دادن نظرات در مورد بلکه گروه هایی از افرادی که در مورد خوشه های مباحث خاص صحبت می کنند. برای حل این وظیفه، ما پیشنهاد می دهیم که مدل فیلتراسیون جدید هشتاگ ها و رویکرد تولید گراف گرافیکی که بعدها توسط الگوریتم تشخیص ساختار سازه ها استفاده می شود، پیشنهاد می شود. ما رویکرد ما را در سه مجموعه داده های بسیار بزرگ زندگی واقعی (نه مصنوعی) معتبر می دانیم. هر یک از آنها دارای بیش از 107 پست پست میکروبلاگینگ با حدود 106 مشخصه اختصاصی است. ما همچنین مقیاس پذیری مدل را بررسی کردیم که چگونه رفتار خواهد کرد در حالی که برای تجزیه و تحلیل تعداد محدودی از زیر مجموعه های تصادفی انتخاب شده در مقایسه با مجموعه داده های کامل مورد استفاده قرار می گیرد. روش ما یک روش فیلترینگ قابل مقیاس پذیر است که قادر به ایجاد نمودارهایی است که در آن جوامعی که دارای منافع مشترک هستند شناسایی شوند. نکته مهم این است که در مجموعه داده های ما، آستانه حداقل نمونه تصادفی که می توان آن را توزیع بسیار مشابهی از رأس ها و وزن های لبه ها را مشاهده کرد، 10٪ از پیروان اصلی است. این مقاله دارای بخش اختصاصی در مورد مدلسازی داده ها است و ضمیمه مقاله ما شامل اجرای مثال های حیاتی از روش ما است.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
نظریه محاسباتی و ریاضیات
چکیده انگلیسی
In this paper we will propose novel method that analyze a social network represented as a net of microblogging accounts. Based on hashtags in users posts we will detect not only the most popular topics users are giving opinions about but also what are the groups of people that talk about certain topics clusters. To solve this task we propose novel hashtags filtration model and community graph generation approach which is later used by community structures detection algorithm. We validate our approach on three very large real-life (not synthetic) datasets. Each of them contains more than 107 microblogging posts with about 106 distinct hashtags. We have also examined the scalability of the model checking how it will behave while applied to the analysis of limited number of randomly chosen subsets in comparison to full dataset. Our methodology is a nicely scalable filtering method that is capable to create graphs in which communities that share common interest might be detected. The important remark is that in our datasets the threshold on minimal random sample above which we can observe very similar distribution of vertices and edges weights is 10% of original followers. The manuscript has a dedicated section about data modeling and the appendix of our article contains the example implementation of vital fragments of our methodology.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Future Generation Computer Systems - Volume 67, February 2017, Pages 297-304
Journal: Future Generation Computer Systems - Volume 67, February 2017, Pages 297-304
نویسندگان
Tomasz Hachaj, Marek R. Ogiela,