کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6448694 1642477 2015 11 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Progress towards establishing collection standards for semi-automated pollen classification in forensic geo-historical location applications
ترجمه فارسی عنوان
پیشرفت در راستای ایجاد استانداردهای جمع آوری برای طبقه بندی نیمه اتوماتیک گرده در برنامه های مکان جغرافیایی قانونی
ترجمه چکیده
دیجیتالیزاسیون تصاویر دانه گرده اجازه ایجاد یک سیستم نیمه اتوماتیک را می دهد که می تواند به متخصصان متخصص در طبقه بندی گرده ها کمک کند. این هزینه و زمان پاسخ را کاهش می دهد و همچنین بهبود بهره وری تحلیلگران را کاهش می دهد. این مسائل به ویژه در برنامه های قانونی مورد انتقاد قرار می گیرند. عوامل متعددی وجود دارد که باید هنگام ایجاد یک پایگاه داده دیجیتالی برای طبقه بندی نیمه اتوماتیک گرده ها مورد توجه قرار گیرد. این مقاله به بررسی برخی از این مسائل از طریق دیدگاه رایانه و ارزیابی یادگیری ماشین می پردازد. مباحث اصلی ارزیابی، طبقه بندی سطح مورفولوژیکی مشابه، اندازه داده های آموزشی بهینه، بهترین شیوه استفاده از داده های سه بعدی، تغییرات دقت به دلیل دسترسی به ابرداده است، یعنی نوسانات اعتماد تحلیل گران به برچسب زدن تاکسی ها و استفاده از داده های فسیلی برای طبقه بندی داده های مدرن. این اولین کاربرد شناخته شده آموزش در مورد داده های فسیلی برای طبقه بندی تاکوس های مدرن است. عملکرد 4/95٪ و 8/93٪ طبقه بندی صحیح بر روی دو مجموعه متمایز از داده های سطح گونه ی مشابه مورفولوژیکی، پیشی می گیرند. ما تعیین کردیم که حداقل 5-10 تصویر آموزشی در هر کلاس برای عملکرد معقول لازم بود. علاوه بر این، ما ثابت کردیم که تمام سطوح ابعاد عمق مربوط به هر دانه مورد نیاز بود تا بهترین عملکرد را به دست آوریم. در نهایت، میزان خطا به دلیل کاهش اعتماد به نفس تحلیلگران و تقریبا سه برابر در استفاده از داده ها از دانه های مختلف سنین دوخت، و بیشتر متمرکز اهمیت فراوانی گسترده است.
موضوعات مرتبط
مهندسی و علوم پایه علوم زمین و سیارات فسیل شناسی
چکیده انگلیسی
The digitization of pollen grain images would permit the creation of a semi-automated system that could aid the expert palynologists in pollen classification. It would reduce cost and time-to-answer as well as improve analyst productivity. These issues are particularly critical in forensic applications. There are numerous factors that should be considered when establishing a digital database intended for semi-automated pollen classification. This paper explores a number of these issues through computer vision and machine learning assessments. The main topics evaluated are morphologically similar species-level classification, optimal training data size, how best to utilize three-dimensional data, accuracy changes due to the availability of metadata, i.e., fluctuations in analysts' confidence in taxa labeling, and using fossil data to classify modern data. This is the first known application of training on fossil data to classify modern taxa. Performances of 95.4% and 93.8% correct classification were achieved on two distinct sets of morphologically similar species-level data, surpassing previous records. We determined that a minimum of 5-10 training images per class was required to yield reasonable performance. Additionally, we established that all depth dimension slices associated with each grain were required to yield the best performance possible. Lastly, the error rate doubles due to decreasing analyst confidence and almost triples when using data from grains of varying ages, further solidifying the importance of comprehensive metadata.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Review of Palaeobotany and Palynology - Volume 221, October 2015, Pages 117-127
نویسندگان
, , , ,