کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
5765456 1626778 2017 12 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Dealing with data conflicts in statistical inference of population assessment models that integrate information from multiple diverse data sets
ترجمه فارسی عنوان
در تعاملات داده ها در استنتاج آماری مدل های ارزیابی جمعیت که اطلاعات را از مجموعه های مختلف داده های مختلف ادغام می کنند، برخورد می شود
ترجمه چکیده
ارزیابی های شیلات معاصر اغلب از مجموعه داده های متنوع متعددی برای استخراج حداکثر اطلاعات در مورد پروسه های زیستی و ماهیگیری استفاده می کنند. با این حال، مدل ها، به تعبیر، ساده سازی واقعیت هستند و بنابراین نامشخص هستند. غلبه کردن بر روی مدل می تواند باعث کاهش تجزیه و تحلیل نتایج گردید که مجموعه داده های چندگانه به طور همزمان مورد تجزیه و تحلیل قرار می گیرند. فرآیند، مشاهده و اجزای نمونه برداری از مدل باید حداقل تا حدودی صحیح باشد تا امکان تعصب به حداقل برسد. متأسفانه، حتی فرآیندهای اساسی که معمولا به خوبی درک می شوند (مثلا رشد و انتخابی)، اغلب، اگر نه همه، ارزیابی سهام هستند. این فرایندهای غلط مشخص در ترکیب با استفاده از داده های ترکیبات، منجر به برآوردهای بی نظیر فراوانی مطلق و روند فراوانی می شود که اغلب به عنوان درگیری های داده ها مشهود است. این به دلیل سوء استفاده از رویکردهای وزن دهی داده ها با اضافه وزن در داده های ترکیب در بسیاری از ارزیابی ها ترکیب شده است. "قانون داده های متضاد" بیان می کند که از آنجا که داده ها حقایق هستند، داده های متناقض به معنی عدم تعریف مدل است، اما باید در متن خطای نمونه گیری تصادفی تفسیر شود. داده های متضاد ضعیف (یا رها کردن) لزوما مناسب نیست زیرا ممکن است غلط بودن مدل را حل کند. غلظت مدل و تغییرات فرآیند را می توان در پارامترهای واریانس احتمال (خطای نمونه گیری) در نظر گرفت، اما زمانیکه یا حتی اگر مناسب باشد، مشخص نیست. روش مناسب برای مقابله با اختلالات داده بستگی به این دارد که آیا این خطا بوسیله خطای نمونه گیری تصادفی، تغییرات فرآیند، عدم تعریف مدل مشاهده یا نامناسب بودن مدل سیستم (دینامیک) ایجاد می شود یا خیر. روشهای تشخیصی برای ارزیابی آمادگی مناسب و شناسایی ناسازگاری مدل ضروری هستند. ما پیشنهاد تخمین خارجی واریانس خطای نمونه برداری در توابع احتمال، تنوع روند مدل سازی در مدل های یکپارچه و برآورد داخلی انحراف استاندارد تغییرات روند را توصیه می کنیم. چارچوب آماری مورد نیاز محاسباتی فشرده است، اما تقریبی عملی در دسترس است، الگوریتم های محاسباتی در حال بهبود است و قدرت کامپیوتر افزایش می یابد. ما یک چارچوب برای توسعه مدل ارائه می دهیم که شناسایی و اصلاح ناسازگاری مدل و چارچوب را با استفاده از داده های شبیه سازی نشان می دهد.
موضوعات مرتبط
علوم زیستی و بیوفناوری علوم کشاورزی و بیولوژیک علوم آبزیان
چکیده انگلیسی
Contemporary fisheries stock assessments often use multiple diverse data sets to extract as much information as possible about biological and fishery processes. However, models are, by definition, simplifications of reality and, therefore, misspecified. Model misspecification can cause degradation of results when multiple data sets are analyzed simultaneously. The process, observation, and sampling components of the model must all be, at least, approximately correct to minimize bias. Unfortunately, even the basic processes that are usually considered well understood (e.g., growth and selectivity) are misspecified in most, if not all, stock assessments. These misspecified processes, in combination with use of composition data, result in biased estimates of absolute abundance and abundance trends, which are often evident as “data conflicts.” This is compounded by over-weighting of composition data in many assessments owing to misuse of data-weighting approaches. The 'law of conflicting data' states that since data are facts, conflicting data implies model misspecification, but must be interpreted in the context of random sampling error. Down-weighting (or dropping) conflicting data is not necessarily appropriate because it may not resolve the model misspecification. Model misspecification and process variation can be accounted for in the variance parameters of the likelihoods (sampling error), but it is unclear when, or even if, this is appropriate. The appropriate method to deal with data conflicts depends on whether it is caused by random sampling error, process variation, observation model misspecification, or misspecification of the system (dynamics) model. Diagnostic approaches are urgently needed to evaluate goodness of fit and to identify model misspecification. We recommend external estimation of the sampling error variance in likelihood functions, modelling process variation in integrated models, and internal estimation of the standard deviation of the process variation. The required statistical framework is computationally intensive, but practical approximations are available, computational algorithms are being improved, and computer power is increasing. We provide a framework for model development that identifies and corrects model misspecification and illustrate the framework, using simulated data.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Fisheries Research - Volume 192, August 2017, Pages 16-27
نویسندگان
, ,