کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
392363 664765 2014 17 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Probabilistic correlation-based similarity measure on text records
ترجمه فارسی عنوان
اندازه گیری شباهت احتمالی مبتنی بر همبستگی بر روی پرونده های متن
کلمات کلیدی
اندازه گیری مشابهی همبستگی احتمالی، رکورد متن،
ترجمه چکیده
در این مقاله، ما یک معیار تشابه مبتنی بر همبستگی احتمالی جدید را پیشنهاد می کنیم. به جای صرفا انجام تطبیق نشانه ها بین دو سوابق، ارزیابی شباهت ما اطلاعات رکوردها را با در نظر گرفتن همبستگی نشانه ها، غنی می کند. همبستگی احتمالی بین نشانه ها به عنوان احتمال آنها با هم در یک سوابق نمایش داده می شود. سپس ما وزن توکن ها را محاسبه می کنیم و ارتباطات رکوردها را براساس همبستگی احتمالی نشانه ها کشف می کنیم. نتایج آزمایشگاهی گسترده اثربخشی رویکرد پیشنهادی ما را نشان می دهد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
In this paper, we propose a novel probabilistic correlation-based similarity measure. Rather than simply conducting the matching of tokens between two records, our similarity evaluation enriches the information of records by considering correlations of tokens. The probabilistic correlation between tokens is defined as the probability of them appearing together in the same records. Then we compute weights of tokens and discover correlations of records based on the probabilistic correlations of tokens. The extensive experimental results demonstrate the effectiveness of our proposed approach.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volume 289, 24 December 2014, Pages 8-24
نویسندگان
, , ,