کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
7563111 1491532 2015 7 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
An ensemble regularization method for feature selection in mass spectral fingerprints
ترجمه فارسی عنوان
یک روش تنظیم صحنه برای انتخاب ویژگی در اثر انگشت طیفی جرم
کلمات کلیدی
انتخاب ویژگی، منظم سازی، گروهی بوت استرپ، طیف جرمی لیپید، هیدروکربن های کوتیکولیک،
ترجمه چکیده
شناسایی موفقانه از ویژگی های قابل توجه در اثر انگشت طیفی پیچیده جمعی، یک وظیفه حیاتی در حالت های تبعیض آمیز یا تفاوت های سیستم های طبیعی (مثلا در بیماران نسبت به سالم، درمان شده و بدون درمان و مردان در برابر زن) است که با استفاده از تکنولوژی طیف سنجی جرم تجسم می شود. در این مطالعه، ما یک روش قانونی سازمانی ارائه می دهیم که سه مدل رگرسیون تصحیح را برای تولید نتایج قوی تر ترکیب می کند. به طور خاص، ضرایب از هر یک از سه مدل تنظیم، بوت استرپ و ابعاد و انحراف معیار این ضرایب محاسبه شد. پس از به دست آوردن این آمار برآورد شده از ضرایب، ما یک آزمون فرضیه برای هر ویژگی انجام دادیم. در نهایت، ویژگی های قابل توجهی که به طور همزمان توسط آزمون های سه فرضیه انتخاب شده اند تعیین کردیم. داده های طیفی توده ای از شش عصاره مختلف کیت های پشه ای برای ارزیابی عملکرد روش پیشنهادی استفاده شده است. هدف از این تجزیه و تحلیل طیفی، تعیین ویژگی های اصلی مورد نیاز برای تشخیص پشه های متاهل و مونث بود که توانایی ایجاد عفونت مالاریا را از دیگران دارند. علاوه بر این، ما انتخاب روش انتخاب ویژگی گروه پیشنهاد با جنگل تصادفی، یک الگوریتم انتخابی به طور گسترده استفاده می شود. ما دریافتیم که روش پیشنهادی از لحاظ کارایی انتخاب ویژگی، از جنگل های تصادفی بهتر است.
موضوعات مرتبط
مهندسی و علوم پایه شیمی شیمی آنالیزی یا شیمی تجزیه
چکیده انگلیسی
Successful identification of the significant features in complex mass spectral fingerprints is a crucial task in discriminating states or differences in natural systems (e.g., diseased vs. healthy, treated vs. untreated, and male vs. female) that are visualized using mass spectrometry technology. In this study, we present an ensemble regularization method that combines three regularization regression models to generate more robust results. Specifically, the coefficients from each of three regularization models were bootstrapped and the means and standard deviations of these coefficients were calculated. After obtaining these estimated statistics of the coefficients, we performed a hypothesis test for each feature. Finally, we determined the significant features that were simultaneously selected by the three hypothesis tests. Mass spectral data from six different extracts of mosquito cuticles were used to evaluate the performance of the proposed method. The purpose of this spectral analysis was to determine the major features needed to differentiate married-female mosquitoes having the potential to cause malaria infection from others. In addition, we compared the proposed ensemble feature selection method with random forest, a widely used feature selection algorithm. We found that the proposed method outperformed random forest in terms of feature selection efficiency.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Chemometrics and Intelligent Laboratory Systems - Volume 146, 15 August 2015, Pages 322-328
نویسندگان
, , ,