کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
7379697 1480157 2014 9 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Burst topic discovery and trend tracing based on Storm
ترجمه فارسی عنوان
کشف موضوع و ردیابی روند بر اساس طوفان
کلمات کلیدی
فرایند پواسون غیر همگن، طوفان، موضوع بردار، روند،
ترجمه چکیده
با رشد سریع اینترنت و ارتقاء اینترنت تلفن همراه، میکروبلاگها یک منبع عمده و مسیری برای انتقال افکار عمومی، از جمله مباحث پشت سر هم که ناشی از شرایط اضطراری هستند، تبدیل شده است. برای تسهیل زمان واقعی معدنچیان از طیف وسیعی از مباحث پشت سر هم، در این مقاله، ما یک روش برای کشف موضوعات مبهم در زمان واقعی و ردیابی روند خود را بر اساس روند تغییرات فرکانس کلمه پیشنهاد شده است. اول، برای روند تنوع کلمات در میکروبلاگ ها، مدل فرایند پوآسون غیر همگن را برای متناسب با داده ها اتخاذ می کنیم. برای نشان دادن گرما و روند واژگان، فاکتور درجه حرارت و ضریب درجه روند را معرفی می کنیم و کشف زمان واقعی و ردیابی روند مبحث پشت سر هم بر اساس این دو عامل را درک می کنیم. دوم، برای بهبود عملکرد محاسبات، این مقاله بر اساس چارچوب محاسبات جریان طوفان برای محاسبات زمان واقعی بود. در نهایت، نتایج تجربی نشان می دهد که با تنظیم اندازه پنجره مشاهده و درجه آستانه روند، موضوعات با چرخه های مختلف و قدرت های مختلف پشت سر هم می تواند کشف شود.
موضوعات مرتبط
مهندسی و علوم پایه ریاضیات فیزیک ریاضی
چکیده انگلیسی
With the rapid development of the Internet and the promotion of mobile Internet, microblogs have become a major source and route of transmission for public opinion, including burst topics that are caused by emergencies. To facilitate real time mining of a large range of burst topics, in this paper, we proposed a method to discover burst topics in real time and trace their trends based on the variation trends of word frequencies. First, for the variation trend of the words in microblogs, we adopt a non-homogeneous Poisson process model to fit the data. To represent the heat and trend of the words, we introduce heat degree factor and trend degree factor and realise the real time discovery and trend tracing of the burst topics based on these two factors. Second, to improve the computing performance, this paper was based on the Storm stream computing framework for real time computing. Finally, the experimental results indicate that by adjusting the observation window size and trend degree threshold, topics with different cycles and different burst strengths can be discovered.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Physica A: Statistical Mechanics and its Applications - Volume 416, 15 December 2014, Pages 331-339
نویسندگان
, , ,