آشنایی با موضوع
داده پرت به دادهای اطلاق میگردد که معمولاً در یک مجموعه داده نسبت به سایر مقادیر موجود بزرگتر یا کوچکتر است. داده پرت مشاهده ای است که در فاصله دورتری از سایر داده ها قرار میگیرد و با مقدار مورد انتظاری که داریم متفاوت است.
داده های پرت میتوانند حاصل یکی از موارد زیر باشند:
ـ غیرصحیح بودن اندازهگیری مشاهده شده؛
ـ جمع آوری دادهها از جوامع مختلف؛
ـ اندازه گیری برای یک حادثه یا رویداد نادر؛
ـ چولگی بیشتر مجموعه دادهها در منحنی توزیع فراوانی نسبی.
تشخیص و حذف داده های پرت از این رو حائز اهمیت است که این داده ها در صورت حذف نشدن در تمامی مراحل داده کاوی حضور داشته و باعث نتایج نادرست و بعضًا غیرمنطقی خواهند شد. تشخیص دادههای پرت امری زمانبر است و این موضوع علیالخصوص در مجموعه داده های بزرگ به خوبی خود را نشان خواهد داد.
داده کاوان روشهای مختلفی را برای دسته بندی روشهای تشخیص داده های پرت نام برده اند.
روشهای تشخیص دادههای پرت بر اساس تعداد متغیر در دو گروه تشخیص یک متغیره و چندمتغیره قرار میگیرند.
در این صفحه تعداد 259 مقاله تخصصی درباره تشخیص داده پرت که در نشریه های معتبر علمی و پایگاه ساینس دایرکت (Science Direct) منتشر شده، نمایش داده شده است. برخی از این مقالات، پیش تر به زبان فارسی ترجمه شده اند که با مراجعه به هر یک از آنها، می توانید متن کامل مقاله انگلیسی همراه با ترجمه فارسی آن را دریافت فرمایید.
در صورتی که مقاله مورد نظر شما هنوز به فارسی ترجمه نشده باشد، مترجمان با تجربه ما آمادگی دارند آن را در اسرع وقت برای شما ترجمه نمایند.
در صورتی که مقاله مورد نظر شما هنوز به فارسی ترجمه نشده باشد، مترجمان با تجربه ما آمادگی دارند آن را در اسرع وقت برای شما ترجمه نمایند.