کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
4972927 | 1451245 | 2017 | 11 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Exploring diversity in ensemble classification: Applications in large area land cover mapping
ترجمه فارسی عنوان
بررسی تنوع در دسته بندی گروهی: کاربرد در نقشه های نقشه زمین پوشش بزرگ
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
تنوع گروهی لبه، جنگل های تصادفی، داده های آموزشی، طبقه بندی، پوشش زمین، سنجش از دور،
ترجمه چکیده
طبقه بندی گروهی، مانند جنگل های تصادفی، در حال حاضر معمولا در زمینه سنجش از راه دور استفاده می شود و نشان داده شده است که بهتر از سیستم های طبقه بندی واحد، که باعث کاهش خطای عمومی شده است. تنوع در همه اعضای طبقه بندی های گروهی تأثیر شدیدی بر عملکرد طبقه بندی دارد؛ بدین ترتیب خطاهای طبقه بندی کننده های غیرمجاز و یکسان در بین اعضای گروه توزیع شده اند. ارتباط بین تنوع گروهی و عملکرد طبقه بندی هنوز به طور کامل در زمینه علوم اطلاعات و یادگیری ماشین کاوش نشده است و در حوزه سنجش از دور مورد بررسی قرار نگرفته است. این مطالعه یک مطالعه جدید در مورد تنوع گروهی و پیوند آن با عملکرد طبقه بندی است که با استفاده از روش طبقه بندی طبقاتی چند طبقه با استفاده از جنگل های تصادفی و سنجش از راه دور چندرسانه ای و داده های سیستم اطلاعات جغرافیایی در هفت میلیون هکتار از جنگل های عمومی تحت تاثیر قرار می گیرند در استرالیا ویکتوریا. یک تاکید ویژه بر تحلیل رابطه بین تنوع گروهی و حاشیه ی مجموعه - دو مفهوم کلیدی در یادگیری گروهی است. نوآوری اصلی کار ما این است که با افزایش تنوع با تأکید بر سهم موارد حاشیه پایین تر مورد استفاده در روند یادگیری قرار گیرد. بررسی تأثیر هرس درختان بر تنوع نیز یک تحلیل تجربی جدید است که به درک بهتر عملکرد گروه کمک می کند. نتایج نشان می دهد بینش ها در مورد ترکیب بین دقت طبقه بندی گروه بندی و تنوع و از طریق حاشیه گروه، نشان می دهد که چگونه تنوع القاء با هدف قرار دادن نمونه های آموزش حاشیه پایین، وسیله ای برای رسیدن به عملکرد طبقه بندی بهتر برای کلاس های سخت تر و یا نادر تر و کاهش بارگیری اطلاعات در مشکلات طبقه بندی یافته های ما راهبردهای جمع آوری داده های آموزشی و طراحی و دسته بندی پارامترهای طبقه بندی های گروهی مانند جنگل های تصادفی را به اطلاع می رساند. این در برنامه های سنجش از دور در منطقه بسیار مهم است که داده های آموزشی برای جمع آوری هزینه ها و منابع فشرده است.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
سیستم های اطلاعاتی
چکیده انگلیسی
Ensemble classifiers, such as random forests, are now commonly applied in the field of remote sensing, and have been shown to perform better than single classifier systems, resulting in reduced generalisation error. Diversity across the members of ensemble classifiers is known to have a strong influence on classification performance - whereby classifier errors are uncorrelated and more uniformly distributed across ensemble members. The relationship between ensemble diversity and classification performance has not yet been fully explored in the fields of information science and machine learning and has never been examined in the field of remote sensing. This study is a novel exploration of ensemble diversity and its link to classification performance, applied to a multi-class canopy cover classification problem using random forests and multisource remote sensing and ancillary GIS data, across seven million hectares of diverse dry-sclerophyll dominated public forests in Victoria Australia. A particular emphasis is placed on analysing the relationship between ensemble diversity and ensemble margin - two key concepts in ensemble learning. The main novelty of our work is on boosting diversity by emphasizing the contribution of lower margin instances used in the learning process. Exploring the influence of tree pruning on diversity is also a new empirical analysis that contributes to a better understanding of ensemble performance. Results reveal insights into the trade-off between ensemble classification accuracy and diversity, and through the ensemble margin, demonstrate how inducing diversity by targeting lower margin training samples is a means of achieving better classifier performance for more difficult or rarer classes and reducing information redundancy in classification problems. Our findings inform strategies for collecting training data and designing and parameterising ensemble classifiers, such as random forests. This is particularly important in large area remote sensing applications, for which training data is costly and resource intensive to collect.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: ISPRS Journal of Photogrammetry and Remote Sensing - Volume 129, July 2017, Pages 151-161
Journal: ISPRS Journal of Photogrammetry and Remote Sensing - Volume 129, July 2017, Pages 151-161
نویسندگان
Andrew Mellor, Samia Boukir,