کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
10151502 1666126 2019 42 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Maximal fusion of facts on the web with credibility guarantee
ترجمه فارسی عنوان
همکاری حداکثر حقایق در وب با تضمین اعتبار
کلمات کلیدی
تلفیق اطلاعات، استخراج دانش، تضمین دقیق، مدل احتمالی تجزیه و تحلیل اعتبار،
ترجمه چکیده
وب بعنوان محرک مرکزی برای منابع ارزشمند برنامه های کاربردی همجوشی است. با این حال، چنین منابع تولید شده توسط کاربر اغلب ناشی از اشتباهات و اطلاعات غلط در نتیجه باز بودن ذاتی و عدم اطمینان وب است. در حالی که پیدا کردن داده های عینی بی اهمیت است، با توجه به درگیری اطلاعات بین منابع وب، ارزیابی اعتبار آنها با اعتماد به نفس بسیار سخت تر است. در این کار، ما تنظیمات جدیدی را برای اتصال داده های واقعی از وب با تضمین اعتبار و فراخوانی حداقلی در نظر می گیریم. هدف نهایی این است که نه تنها اطلاعات باید به حداکثر ممکن استخراج شود بلکه اعتبار آن باید یک نیاز آستانه را برآورده کند. برای این منظور، ما مسئله اکتشاف یک مجموعه حداکثر اطلاعات واقعی را به گونه ای طراحی می کنیم که دقت آن بزرگتر از یک آستانه پیش از تعریف است. رویکرد پیشنهادی ما یک فرایند یادگیری برای بهینه سازی پارامترهای یک مدل احتمالاتی است که روابط میان منابع داده، محتویات آنها و اطلاعات واقعی حقیقی را نشان می دهد. مدل به طور خودکار برای بهترین پارامترها بدون داده های آموزش داده شده جستجو می کند. پس از همگرایی، پارامترها به منظور تحلیل اطلاعات با اطلاعات تضمینی دقیق مورد استفاده قرار می گیرند. ارزیابی های ما از مجموعه داده های دنیای واقعی نشان می دهد که رویکرد ما 6 برابر بیشترین امتیاز را دارد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
The Web became the central medium for valuable sources of information fusion applications. However, such user-generated resources are often plagued by inaccuracies and misinformation as a result of the inherent openness and uncertainty of the Web. While finding objective data is non-trivial, assessing their credibility with a high confidence is even harder due to the conflicts of information between Web sources. In this work, we consider the novel setting of fusing factual data from the Web with a credibility guarantee and maximal recall. The ultimate goal is that not only the information should be extracted as much as possible but also its credibility must satisfy a threshold requirement. To this end, we formulate the problem of instantiating a maximal set of factual information such that its precision is larger than a pre-defined threshold. Our proposed approach is a learning process to optimize the parameters of a probabilistic model that captures the relationships between data sources, their contents, and the underlying factual information. The model automatically searches for best parameters without pre-trained data. Upon convergence, the parameters are used to instantiate as much as factual information with a precision guarantee. Our evaluations of real-world datasets show that our approach outperforms the baselines up to 6 times.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Fusion - Volume 48, August 2019, Pages 55-66
نویسندگان
, , , , ,