کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6920390 1447920 2018 22 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Adaptive multinomial regression with overlapping groups for multi-class classification of lung cancer
ترجمه فارسی عنوان
رگرسیون چندجملهای سازگار با گروه های همپوشانی برای طبقه بندی چند طبقه ای از سرطان ریه
کلمات کلیدی
طبقه بندی چند طبقه داده های نامتعادل گروه همپوشانی لسو، شبکه های همبستگی ژنی با وزن،
ترجمه چکیده
طبقه بندی چند طبقه ای در تشخیص و درمان سرطان توجه زیادی را به خود جلب کرده است و اخیرا بسیاری از روش های یادگیری ماشین برای رسیدگی به این موضوع پدید آمده است. با این حال، عدم تعادل کلاس و مشکلات انتخاب ژن در طبقه بندی داده های سرطان ریه رخ می دهد. در این مقاله، یک رگرسیون چندجملهای تطبیقی ​​با یک مجازات لسو گروهی با هم تداخل دارد که برای طبقه بندی و انتخاب ژن گروهی برای داده های بیان ژن سرطان ریه پیشنهاد شده است. یک استراتژی گروه بندی همپوشانی با تفسیرپذیری بیولوژیکی پیشنهاد شده است که اهمیت گروههای ژنی از طبقات اقلیت را برجسته می کند. با استفاده از اطلاعات متقابل شرطی، اهمیت ژن در هر گروه مورد ارزیابی قرار می گیرد و وزن محور داده ها ساخته می شود. براساس استراتژی گروه بندی و وزنهای ساخته شده، یک رگرسیون چندجملهای اقتباس منظم ارائه شده و الگوریتم حل است که نه تنها می تواند گروه های مهم ژن را برای هر کلاس در کلاس های طبقه بندی چند طبقه انتخاب کند، بلکه ژن های مهم را در هر یک از اجزای سازنده انتخاب می کند. گروه نتایج آزمایش نشان می دهد که روش پیشنهاد شده به طور قابل توجهی از 6 روش دیگر در دقت طبقه بندی برتر برخوردار است و ژن های انتخاب شده ژن های بیماریزا برای سرطان ریه هستند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نرم افزارهای علوم کامپیوتر
چکیده انگلیسی
Multi-class classification has attracted much attention in cancer diagnosis and treatment and many machine learning methods have emerged for addressing this issue recently. However, class imbalance and gene selection problems occur in classifying lung cancer data. In this paper, an adaptive multinomial regression with a sparse overlapping group lasso penalty is proposed to perform classification and grouped gene selection for lung cancer gene expression data. An overlapped grouping strategy with biological interpretability is proposed, which highlights the importance of gene groups from the minority classes. By using the conditional mutual information, the gene significance within each group is evaluated and the data-driven weights are constructed. Based on the grouping strategy and constructed weights, a regularized adaptive multinomial regression is presented and the solving algorithm is developed, which can not only select the important gene groups for each class in performing multi-class classification, but also adaptively select important genes within each group. The experiment results show that the proposed method significantly outperforms the other 6 methods on classification accuracy, and the selected genes are disease-causing genes for lung cancer.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computers in Biology and Medicine - Volume 100, 1 September 2018, Pages 1-9
نویسندگان
, , , ,