کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
4946091 | 1439270 | 2017 | 28 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
A parametrized approach for linear regression of interval data
ترجمه فارسی عنوان
یک رویکرد پارامتری برای رگرسیون خطی داده های فاصله
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
رگرسیون خطی فاصله، تجزیه و تحلیل داده های نمادین، پارامتراسیون فاصله
ترجمه چکیده
داده نمادین فاصله یک نوع داده پیچیده است که اغلب می تواند با خلاصه مجموعه داده های بزرگ به دست آید. تمام رویکردهای رگرسیون خطی موجود برای داده های فاصله، برخی از نقاط مرجع ثابت را به فواصل مدل، مانند میانه ها، محدوده ها و مرزهای پایین و بالایی، استفاده می کنند. این یک محدودیت است، زیرا مجموعه داده های مختلف ممکن است بهتر از نقاط مرجع متفاوت باشند. در این مقاله، یک روش جدید برای استخراج دانش از داده های فاصله ارائه می کنیم. رویکرد پارامترهای ما به طور خودکار بهترین امتیاز مرجع را از متغیرهای رگرسیور استخراج می کند. سپس این نقاط مرجع برای ساخت دو رگرسیون خطی استفاده می شود: یکی برای مرزهای پایین متغیر پاسخ و دیگری برای مرزهای بالایی آن. قبل از اینکه رگرسیون ها اعمال شوند، ما یک معیار را برای بررسی یکپارچگی ریاضی مقادیر پیش بینی شده محاسبه می کنیم. انسجام ریاضی بدان معنی است که مرزهای بالایی بیشتر از حد پایین است. اگر معیار نشان دهد که انسجام تضمین نشده است، ما پیشنهاد استفاده از فاصله زمانی جدید جعبه ککس تغییر متغیر پاسخ را پیشنهاد می کنیم. ارزیابی تجربی با مجموعه داده های مصنوعی و واقعی، نشان دهنده مزایا و کاربرد روش پیشنهاد شده برای انجام رگرسیون خطی فواصل است.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
هوش مصنوعی
چکیده انگلیسی
Interval symbolic data is a complex data type that can often be obtained by summarizing large datasets. All existing linear regression approaches for interval data use certain fixed reference points to model intervals, such as midpoints, ranges and lower and upper bounds. This is a limitation, because different datasets might be better represented by different reference points. In this paper, we propose a new method for extracting knowledge from interval data. Our parametrized approach automatically extracts the best reference points from the regressor variables. These reference points are then used to build two linear regressions: one for the lower bounds of the response variable and another for its upper bounds. Before the regressions are applied, we compute a criterion to verify the mathematical coherence of predicted values. Mathematical coherence means that the upper bounds are greater than the lower bounds. If the criterion shows that the coherence is not guaranteed, we suggest the use of a novel interval Box-Cox transformation of the response variable. Experimental evaluations with synthetic and real interval datasets illustrate the advantages and the usefulness of the proposed method to perform interval linear regression.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Knowledge-Based Systems - Volume 131, 1 September 2017, Pages 149-159
Journal: Knowledge-Based Systems - Volume 131, 1 September 2017, Pages 149-159
نویسندگان
Leandro C. Souza, Renata M.C.R. Souza, Getúlio J.A. Amaral, Telmo M. Silva Filho,