کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6883979 1444211 2018 39 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
From big data to knowledge: A spatio-temporal approach to malware detection
ترجمه فارسی عنوان
از داده های بزرگ به دانش: یک رویکرد فضایی-زمانی به تشخیص نرم افزارهای مخرب
ترجمه چکیده
استقرار حفاظت از نقطه پایانی به تدریج از مشتریان فردی به سرورهای ابر از راه دور منتقل شده است که به عنوان سرویس امنیتی مبتنی بر ابر نامیده می شود. پارادایم جدید امنیتی امنیتی مقدار زیادی از داده ها و فایل های ورود را تولید می کند و تکنیک های داده شده را برای تشخیص نرم افزارهای مخرب ایجاد می کند. این مقاله یک مطالعه تجربی بر روی ورود به سیستم یک سرویس امنیتی مبتنی بر ابر واقعی را برای مشخص کردن وقوع فایلهای اجرایی در میزبان های پایانی، انجام می دهد که مربوط به 124،782 فایل خوشآمدنی و 113،305 فایل اجرایی مخرب در 165،549،417 میزبان انتهایی رخ داده است. میزبان های انتها و نشانه های زمانی که یک فایل اجرایی اتفاق می افتد، به ترتیب بینش های مربوط به توزیع نرم افزار وحشی را از دیدگاه های فضایی و زمانی می دهد. در ضمن، ما استراتژی هایی را در پشت ویژگی ها بررسی می کنیم، و روند پیوستگی ترجیحی و دوره ای از وقوع فایل در میزبان های پایانی را مشاهده می کنیم. الگوهای مختلف رخداد مشاهده شده از فایلهای خوشخیم و مخرب در میزبانها، روشی جدید برای مقابله با تشخیص بدافزار را به ما القا می کنند. از خصوصیات یاد می گیریم که فایل های مربوطه اطلاعات فضایی و زمانی بیشتری را به اشتراک می گذارند بیشتر احتمال دارد که در برچسب های آنها، هم خوش بینانه و هم بدبین باشند. بنابراین، ما یک الگوریتم یادگیری نیمه نظارتی مبتنی بر گراف برای تشخیص بدافزار در زمان واقعی را با در نظر گرفتن اطلاعات فضایی و زمانی توزیع فایل های اجرایی طراحی می کنیم. نتایج تجربی نشان می دهد که رویکرد ما عملکرد متوسط ​​تشخیص بدافزار را به میزان 14.7٪ در مقایسه با تکنیک های قبلی افزایش می دهد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر شبکه های کامپیوتری و ارتباطات
چکیده انگلیسی
The deployment of endpoint protection has been gradually migrated from individual clients to remote cloud servers, which is termed as cloud based security service. The new paradigm of security defense produces a large amount of data and log files, and motivates data-driven techniques for detecting malicious software. This paper conducts an empirical study on the log of a real cloud based security service to characterize the occurrence of executable files in end hosts, which concerns 124,782 benign and 113,305 malicious executable files occurred in 165,549,417 end hosts. The end hosts and the timestamps that an executable file occurs in provide insights into the distribution of software in wild from spatial and temporal perspectives, respectively. Meanwhile, we investigate the strategies behind the characterizations, and observe the preferential attachment process and the periodicity of file occurrence in end hosts. The observed different occurrence patterns of benign and malicious files in end hosts inspire us a new scalable approach to malware detection. We learn from the characterizations that, the associated files shared more spatial and temporal information in common are more likely to be same in their labels, either benign or malicious. Thus, we devise a graph based semi-supervised learning algorithm for real-time malware detection by taking into account the spatio-temporal information of the distribution of executable files. Experimental results demonstrate that our approach increases the performance on malware detection by 14.7% over previous techniques on average.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computers & Security - Volume 74, May 2018, Pages 167-183
نویسندگان
, , , , ,