کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
409970 679112 2014 8 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A class of neural-network-based transducers for web information extraction
ترجمه فارسی عنوان
یک کلاس از مبدل های مبتنی بر شبکه عصبی برای استخراج اطلاعات وب
کلمات کلیدی
بسته بندی وب، استخراج اطلاعات وب، شبکه های عصبی، اتوماتای ​​محدود فراگیری ماشین، روش نظارت
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی

The Web is a huge and still growing information repository that has attracted the attention of many companies. Many such companies rely on information extractors to integrate information that is buried into semi-structured web documents into automatic business processes. Many information extractors build on extraction rules, which can be handcrafted or learned using supervised or unsupervised techniques. The literature provides a variety of techniques to learn information extraction rules that build on ad hoc machine learning techniques. In this paper, we propose a hybrid approach that explores the use of standard machine-learning techniques to extract web information. We have specifically explored using neural networks; our results show that our proposal outperforms three state-of-the-art techniques in the literature, which opens up quite a new approach to information extraction.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 135, 5 July 2014, Pages 61–68
نویسندگان
, ,