کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4949366 1440049 2017 25 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Deriving optimal data-analytic regimes from benchmarking studies
ترجمه فارسی عنوان
به دست آوردن رژیم های داده-تحلیلی مطلوب از مطالعات تطبیقی
کلمات کلیدی
خوشه بندی افزودنی، معیار سنجش، درختان طبقه بندی مقایسه روش ها، رژیم های داده تحلیلی، نظارت بر یادگیری،
ترجمه چکیده
در مطالعات تطبیقی ​​با مجموعه داده های شبیه سازی شده که در آن دو یا چند روش آماری با یکدیگر مقایسه می شوند، علاوه بر جستجوی یک روش جامع برنده، می توانند روش روش برنده شدن را بر اساس الگوهای ویژگی های داده یا مکانیزم تولید داده ها متفاوت کنند. . جالب توجه است، این مشکل، شباهت های متداول رسمی با مشکل به دنبال رژیم های درمان بهینه در آمار زیست شناسی است، زمانی که دو یا چند جایگزین برای یک مشکل یا بیماری یکسان در دسترس هستند. مشخص شده است که چگونه رژیم های داده های تحلیلی مطلوب، یعنی قواعد برای بهینه سازی فراخوانی در روش های آماری، می توانند از مطالعات مربوط به سنجش با داده های شبیه سازی شده با استفاده از روش های طبقه بندی نظارت شده (به عنوان مثال، درختان طبقه بندی) حاصل شود. این رویکرد با استفاده از تجزیه و تحلیل داده ها از یک مطالعه بنچ مارکی به منظور مقایسه دو الگوریتم مختلف برای برآورد مدل خوشه بندی افزایشی دو حالت نشان داده شده است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
In benchmarking studies with simulated data sets in which two or more statistical methods are compared, over and above the search of a universally winning method, one may investigate how the winning method may vary over patterns of characteristics of the data or the data-generating mechanism. Interestingly, this problem bears strong formal similarities to the problem of looking for optimal treatment regimes in biostatistics when two or more treatment alternatives are available for the same medical problem or disease. It is outlined how optimal data-analytic regimes, that is to say, rules for optimally calling in statistical methods, can be derived from benchmarking studies with simulated data by means of supervised classification methods (e.g., classification trees). The approach is illustrated by means of analyses of data from a benchmarking study to compare two different algorithms for the estimation of a two-mode additive clustering model.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computational Statistics & Data Analysis - Volume 107, March 2017, Pages 81-91
نویسندگان
, , , ,