کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6855178 1437609 2018 23 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Handling adversarial concept drift in streaming data
ترجمه فارسی عنوان
مدیریت مفهوم مشارکتی در جریان داده ها راندگی دارد
ترجمه چکیده
طبقه بندی هایی که در یک محیط دینامیک، واقعی در دنیای واقعی عمل می کنند، آسیب پذیر هستند به فعالیت های دفاعی که باعث می شود توزیع داده ها در طول زمان تغییر کند. این تغییرات به طور سنتی به عنوان مفهوم رانده می شود و در ادبیات چندین روش برای حل مسئله تشخیص رانش و دست زدن به آن طراحی شده است. با این حال، بیشتر تکنیک های رانش مفهوم، به عنوان یک کار مستقل دامنه ای را به کار می گیرند تا آنها را به یک گستره وسیعی از سیستم های واکنشی مورد استفاده قرار دهند. این تکنیک ها از یک دیدگاه انحصارطلبی رقابتی توسعه می یابند، به طوری که آنها به ندرت فرض می کنند که فعالیت مشارکتی مثل هر گونه تغییر دیگری در داده ها است که می تواند با بازپروری مدل ها ثابت شود. با این حال، این مورد نیست که عامل مخرب در تلاش است از سیستم طبقه بندی شده مستقر شود. در چنین محیطی، خصوصیات ریزش مفهومی منحصر به فرد است، زیرا رانش در نظر گرفته شده است که سیستم را تضعیف کند و در عین حال برای جلوگیری از تشخیص با تکنیک های تشخیص رانشی سنتی طراحی شده است. این دسته خاص از رانش به عنوان راندگی مشارکتی نامیده می شود، و در این مقاله ویژگی های آن و تاثیر آن در یک محیط جریان را تحلیل می شود. یک چارچوب جدید برای مقابله با راندگی مفهوم دفاعی پیشنهاد شده است، به نام چارچوب جریان پیش بینی-تشخیص. این چارچوب، استفاده از پیشگویی درگیری را ایجاد می کند و زمینه طبقه بندی را در وظیفه شناسایی رانش، فراهم می کند تا اهرم را در حوزه های دینامیک دفاعی فراهم کند. ارزیابی تجربی چارچوب، برروی داده های جریان داده ای متقاطع تولید شده، نشان می دهد که این چارچوب قادر به نشان دادن ریسک بدون رعایت پیشین و قابل اطمینان است و می تواند به سرعت از راندگی ها بهبود یابد. در حالیکه آشکارسازهای رانش سنتی می توانند از طرف دشمنان هوشمند جلوگیری شوند، چارچوب پیشنهادی به ویژه برای ضرب و شتم دشمنان با سوء استفاده از آنها به آشکار شدن خودشان طراحی شده است. علاوه بر این، این چارچوب طراحی شده است که با استفاده از الگوریتم افزایشی به عنوان یک الگوریتم افزایشی حافظه محدود، کار بر روی داده های نامتقارن و ناقص را نشان می دهد. طراحی عمومی و حوزه مستقل دامنه چارچوب آن را به عنوان یک طرح برای توسعه دهندگان که می خواهند امنیت واکنشی را به سیستم های طبقه بندی مبتنی بر آن اعمال کنند، قابل استفاده است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Classifiers operating in a dynamic, real world environment, are vulnerable to adversarial activity, which causes the data distribution to change over time. These changes are traditionally referred to as concept drift, and several approaches have been developed in literature to deal with the problem of drift detection and handling. However, most concept drift handling techniques approach it as a domain independent task, to make them applicable to a wide gamut of reactive systems. These techniques are developed from an adversarial agnostic perspective, where they naively assume that adversarial activity is like any other change to the data, which can be fixed by retraining the models. However, this is not the case when a malicious agent is trying to evade the deployed classification system. In such an environment, the properties of concept drift are unique, as the drift is intended to degrade the system and at the same time designed to avoid detection by traditional concept drift detection techniques. This special category of drift is termed as adversarial drift, and this paper analyzes its characteristics and impact in a streaming environment. A novel framework for dealing with adversarial concept drift is proposed, called the Predict-Detect streaming framework. This framework uses adversarial forethought and incorporates the context of classification into the drift detection task, to provide leverage in dynamic-adversarial domains. Experimental evaluation of the framework, on generated adversarial drifting data streams, demonstrates that this framework is able to provide early and reliable unsupervised indication of drift, and is able to recover from drifts swiftly. While traditional drift detectors can be evaded by intelligent adversaries, the proposed framework is especially designed to capture adversaries by misdirecting them into revealing themselves. In addition, the framework is designed to work on imbalanced and sparsely labeled data streams, as a limited-memory, incremental algorithm. The generic design and domain independent nature of the framework makes it applicable as a blueprint for developers wanting to implement reactive security to their classification based systems.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Expert Systems with Applications - Volume 97, 1 May 2018, Pages 18-40
نویسندگان
, ,