کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4942931 1437615 2018 11 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Linear dimensionality reduction for classification via a sequential Bayes error minimisation with an application to flow meter diagnostics
ترجمه فارسی عنوان
کاهش خطی ابعاد برای دسته‌بندی از طریق کمینه کردن خطای بایز ترتیبی با برنامه برای تشخیص جریان اندازه‌گیری
کلمات کلیدی
کاهش ابعادس خطی؛ LDA؛ ناهم‌واریانس ؛ خطای بیزی؛ تشخیص متر جریان
فهرست مطالب مقاله
چکیده

کلمات کلیدی

1.مقدمه

2. زمینه و کارهای مرتبط

2.1. معیار فیشر

2.2. معیار Mahalanobis

2.3. معیار Chernoff

3.الگوریتم پیشنهادی

3.1. K=2

3.2. K=3

3.2.1. مرحله 1

3.2.2. مرحله 2

3.3. K کلی

3.3.1. مرحله 1

3.3.2. مرحله 2

3.3.3. مرحله 3

3.4. بهینه‌سازی خطای بایز  

4. برنامه برای تشخیص جریان اندازه‌گیری

تصویر 1: پیکربندی مبدل اندازه‌گیر جریان هشت مسیره

جدول 1: لیست و ویژگی‌های مجموعه داده‌ها

5. اعتبارسنجی آزمایشی

5.1. مجموعه داده‌های UCI

جدول 2: متوسط صحت دسته‌بندی (%) با QDA

جدول 3: متوسط صحت دسته‌بندی (%) با LDA

جدول 4: متوسط صحت دسته‌بندی: پیشنهادی + LDA در مقابل SVM خطی

5.1.1. نتایج و بحث

تصویر 2: عملکرد LDR روی داده تشخیصی: PCA

تصویر 3: عملکرد LDR روی داده تشخیص: F-LDR

5.2. مجموعه داده تشخیصی USM

تصویر 4: عملکرد LDR روی داده تشخیصی A: M-LDR 

تصویر 5: عملکرد LDR روی داده تشخیصی: C-LDR

5.2.1. نتایج و بحث

تصویر 6: عملکرد LDR روی داده تشخیصی اندازه‌گیر A: پیشنهادی

تصویر 7: متوسط صحت دسته‌بندی برای اندازه‌گیر A و B (%). صحت دسته‌بندی برای الگوریتم پیشنهادی از نظر آماری متفاوت با باقی الگوریتم‌ها به میزان اعتماد 0.01 براساس تست رتبه Wilcoxon است.

6. نتیجه‌گیری
ترجمه چکیده
کاهش خطی ابعاد به شکل نظارت شده (LDR) برای دسته‌بندی است و صحت دسته‌بندی را با کاهش بیش پردازش و حذف موارد واقع شونده در یک خط افزایش داده است. اگر یک دسته‌بندی کننده بایز استفاده شود، سپس کاهش ابعاد به میزان K-1 ضروری است و برای حفظ اطلاعات دسته‌بندی با فضای ویژگی اصلی برای مشکل kکلاس نیز کافی است. با این حال، اکثیر الگوریتم‌های حال حاضر هیچ بعد بهینه‌ای برای کاهش داده ندارند، در نتیجه اطلاعات دسته‌بندی می‌توانند در فضای کاهش یافته گم شوند در صورتی که K-1 بعد استفاده شوند. در این مقاله، ما یک تکنیک LDR جدید برای کاهش ابعاد داده اصلی به K-1 ارائه داده‌ایم که برای دسته‌بندی بیزین نیز مفید است. این کار با ساخت ترتیبی دسته‌بندی‌های خطی انجام می‌شود که خطای بایز را با رویه کاهش گرادیان، کمینه می‎‌کند که فرض بر نرمال بودن است. ما با آزمایش الگوریتم پیشنهادی را برای 10 مجموعه داده UCI اعتبارسنجی کردیم. الگوریتم ما از نظر صحت دسته‌بندی در مقایسه با الگوریتم‌های حال حاض مثل LDR مبتنی بر معیار فیشر و معیار چرنف ، بهتر است. قابلیت پیاده‌سازی الگوریتم ما با اعمال آن در وضعیت تشخیص سلامت با 2 جریان اندازه‌گیری نیز توضیح داده شده است. با مجموعه داده UCI، الگوریتم پیشنهادی عملکرد بهتری نسبت به الگوریتم‌های حال حاضر دارد و صحت دسته‌بندی آن به میزان 99.4% و 97.5% برای دو جریان اندازه‌گیری است. چنین صحت بالای دسته‌بندی بر روی جریان اندازه‌گیری باعث صرفه‌جویی بسیار در هزینه نفتی و کارهای گازی می‌شود.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی


- We propose a supervised linear dimensionality reduction algorithm.
- The algorithm reduces the dimensionality of data to K−1 for the K-class problem.
- The linearly reduced data is well-suited for Bayesian classification.
- Experiments on UCI datasets are performed for the proposed and existing algorithms.
- The applicability of the algorithm to flow meter diagnostics is also demonstrated.

Supervised linear dimensionality reduction (LDR) performed prior to classification often improves the accuracy of classification by reducing overfitting and removing multicollinearity. If a Bayes classifier is to be used, then reduction to a dimensionality of K−1 is necessary and sufficient to preserve the classification information in the original feature space for the K-class problem. However, most of the existing algorithms provide no optimal dimensionality to which to reduce the data, thus classification information can be lost in the reduced space if K−1 dimensions are used. In this paper, we present a novel LDR technique to reduce the dimensionality of the original data to K−1, such that it is well-primed for Bayesian classification. This is done by sequentially constructing linear classifiers that minimise the Bayes error via a gradient descent procedure, under an assumption of normality. We experimentally validate the proposed algorithm on 10 UCI datasets. Our algorithm is shown to be superior in terms of the classification accuracy when compared to existing algorithms including LDR based on Fisher's criterion and the Chernoff criterion. The applicability of our algorithm is then demonstrated by employing it in diagnosing the health states of 2 ultrasonic flow meters. As with the UCI datasets, the proposed algorithm is found to have superior performance to the existing algorithms, achieving classification accuracies of 99.4% and 97.5% on the two flow meters. Such high classification accuracies on the flow meters promise significant cost benefits in oil and gas operations.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Expert Systems with Applications - Volume 91, January 2018, Pages 252-262
نویسندگان
, , , ,