کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4945120 1438297 2017 13 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Multi-source uncertain entity resolution: Transforming holocaust victim reports into people
ترجمه فارسی عنوان
قطعنامه نهادهای چندگانه منبع: تبدیل گزارش های قربانیان هولوکاست به افراد
کلمات کلیدی
قطعنامه ناپایدار، مسدود کردن، هولوکاست،
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
In this work we present a multi-source uncertain entity resolution model and show its implementation in a use case of Yad Vashem, the central repository of Holocaust-era information. The Yad Vashem dataset is unique with respect to classic entity resolution, by virtue of being both massively multi-source and by requiring multi-level entity resolution. With today's abundance of information sources, this project motivates the use of multi-source resolution on a big-data scale. We instantiate the proposed model using the MFIBlocks entity resolution algorithm and a machine learning approach, based upon decision trees to transform soft clusters into ranked clustering of records, representing possible entities. An extensive empirical evaluation demonstrates the unique properties of this dataset that make it a good candidate for multi-source entity resolution. We conclude with proposing avenues for future research in this realm.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Systems - Volume 65, April 2017, Pages 124-136
نویسندگان
, , , , ,