کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
497265 862883 2010 6 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
SCTWC: An online semi-supervised clustering approach to topical web crawlers
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نرم افزارهای علوم کامپیوتر
پیش نمایش صفحه اول مقاله
SCTWC: An online semi-supervised clustering approach to topical web crawlers
چکیده انگلیسی

Focused web crawlers collect topic-related web pages from the Internet. Using Q learning and semi-supervised learning theories, this study proposes an online semi-supervised clustering approach for topical web crawlers (SCTWC) to select the most topic-related URL to crawl based on the scores of the URLs in the unvisited list. The scores are calculated based on the fuzzy class memberships and the Q values of the unlabelled URLs. Experimental results show that SCTWC increases the crawling performance.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Applied Soft Computing - Volume 10, Issue 2, March 2010, Pages 490–495
نویسندگان
, ,