کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6903354 1446990 2018 25 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A survey on deep learning techniques for image and video semantic segmentation
ترجمه فارسی عنوان
یک نظرسنجی در مورد تکنیک های یادگیری عمیق برای تقسیم بندی معنایی تصویر و ویدئو
کلمات کلیدی
تقسیم معنایی، یادگیری عمیق، برچسب زدن صحنه
ترجمه چکیده
تقسیم بندی معنایی تصویر بیشتر و بیشتر مورد توجه محققان بینایی کامپیوتری و یادگیری ماشین است. بسیاری از برنامه های کاربردی در حال رشد نیاز به مکانیسم دقیق و کارآمد بخش بندی دارند: رانندگی مستقل، ناوبری داخلی، و حتی سیستم های واقعیت مجازی یا تقویت شده برای نام چند. این تقاضا با افزایش روش های یادگیری عمیق در تقریبا در هر زمینه یا هدف کاربردی مرتبط با دید کامپیوتر، از جمله تقسیم معنایی یا درک صحنه، هماهنگ است. این مقاله بررسی روشهای یادگیری عمیق برای تقسیم بندی معنایی در زمینه های کاربردی مختلف را ارائه می دهد. اولا، ما مسئله تقسیم بندی معنایی را تشکیل می دهیم و اصطلاحات این حوزه را تعریف می کنیم و مفاهیم پس زمینه جالب نیز تعریف می کنیم. بعد، مجموعه داده ها و چالش های اصلی در معرض کمک به محققان قرار می گیرند که کدامیک از مواردی هستند که به بهترین وجه با نیازها و اهدافشان منطبق است. سپس، روش های موجود بررسی می شود، برجسته سازی مشارکت و اهمیت آنها در زمینه. ما همچنین بخشی از مقاله را برای بررسی توابع از دست رفته و ضریب خطا برای این مشکل بررسی می کنیم. در نهایت، نتایج کمی برای روش های شرح داده شده و مجموعه داده ها که در آنها ارزیابی شده اند، با بحث درباره نتایج ارائه شده است. در نهایت، ما مجموعه ای از آیندۀ امیدوار کننده ی آینده را بیان می کنیم و نتیجه گیری های خود را در مورد وضعیت هنر تقسیم بندی معنایی با استفاده از تکنیک های یادگیری عمیق به دست می آوریم.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نرم افزارهای علوم کامپیوتر
چکیده انگلیسی
Image semantic segmentation is more and more being of interest for computer vision and machine learning researchers. Many applications on the rise need accurate and efficient segmentation mechanisms: autonomous driving, indoor navigation, and even virtual or augmented reality systems to name a few. This demand coincides with the rise of deep learning approaches in almost every field or application target related to computer vision, including semantic segmentation or scene understanding. This paper provides a review on deep learning methods for semantic segmentation applied to various application areas. Firstly, we formulate the semantic segmentation problem and define the terminology of this field as well as interesting background concepts. Next, the main datasets and challenges are exposed to help researchers decide which are the ones that best suit their needs and goals. Then, existing methods are reviewed, highlighting their contributions and their significance in the field. We also devote a part of the paper to review common loss functions and error metrics for this problem. Finally, quantitative results are given for the described methods and the datasets in which they were evaluated, following up with a discussion of the results. At last, we point out a set of promising future works and draw our own conclusions about the state of the art of semantic segmentation using deep learning techniques.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Applied Soft Computing - Volume 70, September 2018, Pages 41-65
نویسندگان
, , , , , ,