کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4966421 1365120 2017 16 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Box clustering segmentation: A new method for vision-based web page preprocessing
ترجمه فارسی عنوان
تقسیم خوشه بندی جعبه: یک روش جدید برای پیش پردازش صفحه وب مبتنی بر بینایی
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نرم افزارهای علوم کامپیوتر
چکیده انگلیسی
We experimentally evaluate the properties of our algorithm by processing 2400 web pages. On this set of web pages, we prove that our algorithm is almost 90% faster than the reference algorithm. We also show that our algorithm accuracy is between 47% and 133% of the reference algorithm accuracy with indirect correlation of our algorithm's accuracy to the depth of inspected page structure. In our experiments, we also demonstrate the advantages of producing a flat segmentation structure instead of an hierarchy.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Processing & Management - Volume 53, Issue 3, May 2017, Pages 735-750
نویسندگان
, , ,