کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6697237 1428354 2018 30 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Reconstruction of the indoor temperature dataset of a house using data driven models for performance evaluation
ترجمه فارسی عنوان
بازسازی مجموعه داده های دما در محیط خانه با استفاده از مدل های داده ای برای ارزیابی عملکرد
ترجمه چکیده
هرگاه نظارت طولانی مدت بر روی یک ساختمان انجام می شود، احتمال دارد که سنسورهای خاص یا کل سیستم نظارت استفاده شده ممکن است ناشی از شکست دراز مدت باشد و بنابراین شکاف های مهمی را در یک یا چند متغیر ویژه ای ایجاد می کند. این فاصله های طولانی ممکن است با استفاده از درون یابی خطی ساده مورد خطاب قرار نگیرند. گزینه ای که تنها با استفاده از داده های موجود برای آمار توصیفی، نتایجی را ایجاد می کند که نسبت به فصل اندازه گیری تغییر یافته است. علاوه بر این، نادیده گرفتن اطلاعات ناقص نشاندهنده هدر رفتن وقت و تلاش در تحقیقات است. کار در اطراف برای کاهش مشکل تعصب پیش بینی داده های از دست رفته از دیگر متغیرهای اندازه گیری با استفاده از تکنیک های یادگیری ماشین است. بعضی از سوالاتی که مطرح می شود عبارتند از: چقدر اطلاعات لازم است تا بتواند مدل رگرسیون را آموزش دهد؟ خطای پیش بینی شده چنین پیش بینی چیست؟ بهترین مدل برای چنین کاری چیست؟ این مقاله به مشکل تکمیل یک مجموعه داده برای درجه حرارت داخلی داخل یک خانه منفعل با استفاده از پیش بینی کننده های نظارت شده نظیر دمای بیرونی، رطوبت، سرعت باد، دید، فشار و استفاده از انرژی الکتریکی در داخل ساختمان می پردازد. دو مدل رگرسیون، رگرسیون چندگانه خطی و جنگل تصادفی با استفاده از منحنی یادگیری برای مجموعه های آموزشی و تست برای تجسم به اصطلاح تجارت نامحدود واریانس مقایسه شده است. منحنی یادگیری کمک می کند تا به پرسش از اندازه نمونه مطلوب برای آموزش، انتخاب مدل و خطای احتمالی پاسخ دهد. در نهایت، آمار توصیفی مانند متوسط، حداکثر، حداقل، و میانگین دمای اتاق قبل و بعد از تکمیل مجموعه داده ها ارائه شده است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی انرژی انرژی های تجدید پذیر، توسعه پایدار و محیط زیست
چکیده انگلیسی
Whenever the long term monitoring of a building is attempted it is likely that specific sensors or the whole monitoring system used may experience long-term failure therefore creating important gaps in one or more variables of special interest. These long gaps may not be addressed using simple linear interpolation. The option of only using the available data for descriptive statistics would produce results that are biased towards the season of measurement. In addition discarding the incomplete data represents a significant waste of time and effort in the research study. A work around to reduce the bias problem is to predict the missing data from other measured variables using machine-learning techniques. Some questions that follow are: How much data is necessary to be able to train a regression model? What is the expected error of such prediction? What is the best model for such a task? This paper addresses the problem of completing a data set for the interior temperatures inside a passive house using different monitored predictors such as exterior temperature, humidity, wind speed, visibility, pressure and electrical energy use inside the building. Two regression models, multiple linear regression and random forest are compared using learning curves for the training and testing sets for visualizing the so-called bias-variance trade off. The learning curves help to answer the question of optimal sample size for training, model selection and expected error. Finally, descriptive statistics such as median, maximum, minimum, and room temperature averages are presented before and after completing the data sets.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Building and Environment - Volume 138, 15 June 2018, Pages 250-261
نویسندگان
, , ,