کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6900014 1446486 2018 8 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Filter hashtag context through an original data cleaning method
ترجمه فارسی عنوان
فیلتر هشتگ را از طریق یک روش تمیز کردن داده اصلی
کلمات کلیدی
ترجمه چکیده
امروزه شبکه های اجتماعی یکی از وسیع ترین روش های برقراری ارتباط هستند. به عنوان مثال، شبکه اجتماعی شبکه توییتر نزدیک به 100 میلیون کاربر فعال دارد که روزانه حدود 500 میلیون پیام ارسال می کند. به اشتراک گذاری اطلاعات در این پلت فرم منحصر به فرد است زیرا پیام ها در تعداد کاراکتر محدود می شوند. در مواجهه با این محدودیت، کاربران به طور خلاصه خود را بیان می کنند و گاهی اوقات یک هشتگ استفاده می کنند که ایده کلی پیام را خلاصه می کند. با این وجود، هشتگ ها داده های پر سر و صدا هستند زیرا آنها به هیچ یک از قوانین زبانی احترام نمی گذارند، ممکن است چندین معنی داشته باشند و استفاده آنها تحت کنترل نیست. در این کار، ما با مشکلاتی از زمینه هشتگ برخورد می کنیم که ممکن است کاربردهای مفیدی در زمینه های مختلف مانند توصیه های اطلاعات یا طبقه بندی اطلاعات داشته باشد. در این مقاله، ما یک روش تمیز کردن داده اصلی را برای استخراج مرتبطترین همسایههای یک هشتگ پیشنهاد می کنیم. ما روش ما را با یک مجموعه داده ای حاوی هشتگ های مربوط به چند موضوع (مانند ورزش، موسیقی، تکنولوژی و غیره) برای نشان دادن کارایی و استحکام رویکرد ما، آزمایش می کنیم.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر علوم کامپیوتر (عمومی)
چکیده انگلیسی
Nowadays, social networks are one of the most used means of communication. For example, the social network Twitter has nearly 100 million active users who post about 500 million messages per day. Sharing information on this platform is unique because messages are limited in characters number. Faced with this limitation, users express themselves briefly and use sometimes a hashtag that summarizes the general idea of the message. Nevertheless, hashtags are noisy data because they do not respect any linguistic rule, may have several meanings, and their use is not under control. In this work, we tackle the problem of hashtag context which may have useful applications in several fields like information recommendation or information classification. In this paper, we propose an original data cleaning method to extract the most relevant neighbor hashtags of a hashtag. We test our method with a dataset containing hashtags related to several topics (such as sport, music, technology, etc.) in order to show the efficacy and the robustness of our approach.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Procedia Computer Science - Volume 130, 2018, Pages 464-471
نویسندگان
, , ,