کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6938926 1449967 2018 35 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Rough-fuzzy based scene categorization for text detection and recognition in video
ترجمه فارسی عنوان
طبقه بندی صحنه های مبتنی بر رافع فاز برای شناسایی و تشخیص متن در ویدیو
کلمات کلیدی
مجموعه خشن، مجموعه فازی طبقه بندی ویدئو، طبقه بندی تصویر صحنه، تشخیص متن ویدئو، شناسایی متن ویدئو،
ترجمه چکیده
درک تصویر یا تصویر صحنه یک کار چالش برانگیز است، به ویژه هنگامی که تعداد انواع ویدیوها به شدت با تغییرات زیاد در زمینه و پیش زمینه افزایش می یابد. این مقاله یک روش جدید برای طبقه بندی فیلم های صحنه به کلاس های مختلف، یعنی انیمیشن، خروجی، ورزش، آموزش الکترونیکی، پزشکی، آب و هوا، دفاع، اقتصاد، حیوانات و فناوری، برای بهبود عملکرد تشخیص و شناسایی متن پیشنهاد می کند. یک رویکرد موثر برای درک تصویر یا تصویر صحنه است. برای این منظور ابتدا ترکیبی جدید از مفهوم خشن و فازی را برای مطالعه شکل های نامنظم اجزای لبه در فیلم های صحنه ورودی ارائه می کنیم که به طبقه بندی اجزای لبه به چندین گروه کمک می کند. سپس، روش پیشنهادی، اطلاعات مسیر هدایت هر پیکسل در هر گروه جزء لبه را برای استخراج ویژگی های سکته مغزی به وسیله تقسیم هر گروه به چندین درون و داخل هواپیما، بررسی می کند. ما بیشتر ویژگی های همبستگی و کوواریانس را برای کدگذاری ویژگی های معنایی که در داخل هواپیما یا بین هواپیما قرار دارد، استخراج می کنیم. سپس ویژگی های درون و بین فضاهای گروه ها برای دریافت یک ماتریس مشخص ترکیب می شوند. در نهایت، ماتریس ویژگی با فریم های زمانی تایید شده و برای طبقه بندی به یک شبکه عصبی تغذیه می شود. نتایج تجربی نشان می دهد که روش پیشنهادی از روشهای موجود پیشرفته تر است، در حالی که عملکرد روش تشخیص و شناسایی متن نیز به واسطه طبقه بندی بهبود یافته است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
Scene image or video understanding is a challenging task especially when number of video types increases drastically with high variations in background and foreground. This paper proposes a new method for categorizing scene videos into different classes, namely, Animation, Outlet, Sports, e-Learning, Medical, Weather, Defense, Economics, Animal Planet and Technology, for the performance improvement of text detection and recognition, which is an effective approach for scene image or video understanding. For this purpose, at first, we present a new combination of rough and fuzzy concept to study irregular shapes of edge components in input scene videos, which helps to classify edge components into several groups. Next, the proposed method explores gradient direction information of each pixel in each edge component group to extract stroke based features by dividing each group into several intra and inter planes. We further extract correlation and covariance features to encode semantic features located inside planes or between planes. Features of intra and inter planes of groups are then concatenated to get a feature matrix. Finally, the feature matrix is verified with temporal frames and fed to a neural network for categorization. Experimental results show that the proposed method outperforms the existing state-of-the-art methods, at the same time, the performances of text detection and recognition methods are also improved significantly due to categorization.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Pattern Recognition - Volume 80, August 2018, Pages 64-82
نویسندگان
, , , , , , ,