کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6858076 661917 2014 24 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Study on the effectiveness of anomaly detection for spam filtering
ترجمه فارسی عنوان
بررسی اثربخشی تشخیص ناهنجاری برای فیلتر کردن هرزنامه
کلمات کلیدی
فیلتر کردن هرزنامه، تشخیص آنومالی، ایمن تجارت الکترونیک، امنیت رایانه،
ترجمه چکیده
هرزنامه یک مشکل مهم برای امنیت رایانه است؛ زیرا این یک کانال برای گسترش تهدیدات، از جمله ویروس های کامپیوتری، کرم ها و فیشینگ است. در حال حاضر، بیش از 85٪ از ایمیل های دریافت شده، هرزنامه است. رویکردهای تاریخی برای مبارزه با این پیام ها، از جمله تکنیک های ساده مانند فرستادن لیست سیاه یا استفاده از امضای ایمیل، دیگر به طور کامل قابل اعتماد نیستند. بسیاری از راه حل ها از روش های یادگیری ماشین آموزش دیده با نمایه های آماری از اصطلاحات که معمولا در ایمیل ها ظاهر می شود. با این وجود، این روش ها نیاز به یک گام تمرین وقت با داده های برچسب دار دارند. برخورد با دسترسی محدود به نمونه های آموزش برچسب دار، پیشرفت سیستم های فیلترینگ را تضعیف می کند و مزایای اسپم ها را به همراه می آورد. در این مقاله، ما یک مطالعه از اثربخشی تشخیص آنومالی را برای فیلتر کردن هرزنامه ارائه می کنیم، که ضرورت نامه های هرزنامه را کاهش می دهد و تنها نمایش یک طبقه از ایمیل ها (به عنوان مثال، مشروع یا اسپم) را مورد استفاده قرار می دهد. این مطالعه شامل ارائه اولین سیستم فیلتر کردن هرزنامه مبتنی بر انحراف است، افزایش این سیستم که یک الگوریتم کاهش اطلاعات را به مجموعه داده های برچسب دار اعمال می کند تا زمان پردازش را کاهش دهد و در عین حال حفظ میزان تشخیص و تجزیه و تحلیل مناسب بودن انتخاب ایمیل های قانونی یا هرزنامه به عنوان نمایندگی از عادی.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Spam has become an important problem for computer security because it is a channel for spreading threats, including computer viruses, worms and phishing. Currently, more than 85% of received emails are spam. Historical approaches to combating these messages, including simple techniques such as sender blacklisting or using email signatures, are no longer completely reliable on their own. Many solutions utilise machine-learning approaches trained with statistical representations of the terms that usually appear in the emails. Nevertheless, these methods require a time-consuming training step with labelled data. Dealing with the limited availability of labelled training instances slows down the progress of filtering systems and offers advantages to spammers. In this paper, we present a study of the effectiveness of anomaly detection applied to spam filtering, which reduces the necessity of labelling spam messages and only employs the representation of one class of emails (i.e., legitimate or spam). This study includes a presentation of the first anomaly based spam filtering system, an enhancement of this system that applies a data reduction algorithm to the labelled dataset to reduce processing time while maintaining detection rates and an analysis of the suitability of choosing legitimate emails or spam as a representation of normality.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volume 277, 1 September 2014, Pages 421-444
نویسندگان
, , , , , ,