کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
9952353 1448264 2018 15 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Towards justifying unsupervised stationary decisions for geostatistical modeling: Ensemble spatial and multivariate clustering with geomodeling specific clustering metrics
ترجمه فارسی عنوان
در راستای توجیه تصمیم گیری های ثابت نشده نظارت نشده برای مدل سازی ژئواستاتنتیکی: خوشه بندی فضایی و چند متغیره گروه با معیارهای خوشه بندی ویژه جغرافیایی
کلمات کلیدی
دامنه های برآورد خوشه فضایی، گروه خوشه بندی ایستادگی،
ترجمه چکیده
تقسیم بندی نمونه ها به مجموعه های ثابت یکی از اولین تصمیمات در یک جریان کاری مدل سازی است که در آن نمونه های مربوط به زمین شناسی و آماری برای مدل سازی ژئواستاتسیسکی بیشتر گروه بندی می شوند. الگوریتم های یادگیری بدون نظم (خوشه بندی) با اصلاحاتی جهت بررسی همبستگی فضایی، در تصمیم گیری استقراضی دارای مزایای متعددی هستند: آنها خودکار و قابل تکرار هستند؛ ارزیابی عدم اطمینان؛ و چارچوبی برای بررسی گروههای موجود فراهم می کند. با این حال، پارامترهای ذهنی محدودیت های مهمی برای استفاده از خوشه بندی فضایی در جریان های کاری جغرافیایی باقی مانده است. در این کار دو اصطلاح اصلی برای وضعیت فعلی تحقیق پیشنهاد شده است: 1) متریک فضایی و چند متغیر ترکیبی که کیفیت خوشه را در هر دو فضای چند متغیری و دکتسک با اندازه گیری فشرده سازی چند متغیره و همبستگی فضایی توصیف می کند؛ و 2) یک الگوریتم خوشه بندی چندگانه فضایی چند متغیره جدید تصادفی برای کاهش وابستگی به پارامتر خوشه بندی ذهنی. معیارهای توسعه یافته در این کار کمیت خوشه بندی چند متغیره و خواص مکانی را برآورده می کنند. علاوه بر این، الگوریتم خوشه بندی پیشنهاد شده به کاربر اجازه می دهد تا با تغییر یک پارامتر واحد فضایی و فشرده سازی چندگانه خوشه های نهایی را کنترل کند. الگوریتم خوشه بندی در یک مجموعه داده های آزمون مصنوعی معرفی شده و نشان داده شده است و سپس کاربرد بیشتر در مجموعه داده های پیچیده برای نشان دادن خواص خوشه بندی و سادگی تنظیم الگوریتم برای خوشه های فضایی مجاور یا فشرده سازی چند متغیره مورد بررسی قرار می گیرد. الگوریتم پیشنهاد شده از الگوریتم های خوشه بندی دیگر برای مجموعه داده ها بر اساس معیارهای توسعه یافته برتر است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نرم افزارهای علوم کامپیوتر
چکیده انگلیسی
The subdivision of samples into stationary sets is one of the first decisions in a resource modeling workflow where geologically and statistically related samples are grouped for further geostatistical modeling. Unsupervised learning algorithms (clustering) with modifications to consider spatial correlation have several benefits in the decision of stationarity, they are: automatic and repeatable; assess uncertainty; and provide a framework for checking existing groupings. However, subjective parameterization remains a critical limitation for the application of spatial clustering in geostatistical workflows. In this work, two main extensions to the current state of research are proposed: 1) a combined spatial-multivariate metric that describes cluster quality in both multivariate and Cartesian space by measuring multivariate compactness and spatial contiguity; and 2) a novel random-path spatial-multivariate ensemble clustering algorithm to reduce the reliance on subjective clustering parameterization. The metrics developed in this work quantify clustering quality based multivariate and spatial properties. Moreover, the proposed clustering algorithm allows the user to control the spatial contiguity and multivariate compactness of the final clusters by modifying a single parameter. The clustering algorithm is introduced and demonstrated on a synthetic test dataset, then further application to more complex datasets are explored to demonstrate the clustering properties and simplicity of tuning the algorithm to prefer spatially contiguous clusters or multivariate compactness. The proposed algorithm outperforms other clustering algorithms for the datasets tested based on the metrics developed.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computers & Geosciences - Volume 120, November 2018, Pages 82-96
نویسندگان
, ,