کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4948062 1439602 2017 9 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Discovering social spammers from multiple views
ترجمه فارسی عنوان
کشف اسپم های اجتماعی از دیدگاه های مختلف
کلمات کلیدی
تشخیص اسپمر اجتماعی، آموزش چندرسانه ای، اصطلاح اصلاح اجتماعی،
ترجمه چکیده
شبکه های اجتماعی آنلاین تبدیل شده اند به سیستم های محبوب برای اسپم ها برای گسترش محتوای مخرب و لینک. روشهای بهینه سازی موجود در حال حاضر به طور عمده از یک نوع اطلاعات تولید شده توسط کاربر (به عنوان مثال نمایش تک) استفاده می کنند تا یک مدل طبقه بندی برای شناسایی اسپم ها یاد بگیرند. با توجه به تنوع و تنوع استراتژی های اسپم، رفتار اسپم ها تنها با اطلاعات تک نمایشی مشخص نمی شود. برای مقابله با این چالش، برای اولین بار از لحاظ آماری، اهمیت بررسی اطلاعات چندگانه را برای وظیفه شناسایی هرزنامه در دیتابیس داده های توییتر دنیای واقعی بررسی می کنیم. بر این اساس، ما یک چارچوب تشخیص هرزنامه اجتماعی عمومی را با همکاری ادغام اطلاعات چندگانه و اصطلاح اصلاح اجتماعی جدید به یک مدل طبقه بندی پیشنهاد می کنیم. برای حفظ کامل مجموعه داده اصلی و شناسایی اسپم های بیشتر توسط روش پیشنهادی، ما یک استراتژی ساده برای پر کردن داده های گم شده برای هر نمایه معرفی می کنیم. نتایج تجربی در یک دیتاست دیتا در دنیای واقعی نشان می دهد که روش پیشنهادی به طور قابل توجهی از روش های موجود برتر است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Online social networks have become popular platforms for spammers to spread malicious content and links. Existing state-of-the-art optimization methods mainly use one kind of user-generated information (i.e., single view) to learn a classification model for identifying spammers. Due to the diversity and variability of spammers' strategies, spammers' behavior may not be completely characterized only by single view's information. To tackle this challenge, we first statistically analyze the importance of considering multiple view information for spammer detection task on a large real-world Twitter dataset. Accordingly, we propose a generalized social spammer detection framework by jointly integrating multiple view information and a novel social regularization term into a classification model. To keep the completeness of the original dataset and detect more spammers by the proposed method, we introduce a simple strategy to fill the missing data for each view. Experimental results on a real-world Twitter dataset show that the proposed method outperforms the existing methods significantly.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 225, 15 February 2017, Pages 49-57
نویسندگان
, , , , , ,