کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6858180 661922 2014 23 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Namesake alias mining on the Web and its role towards suspect tracking
ترجمه فارسی عنوان
معدن نام مستعار در وب و نقش آن را به عنوان ردیابی مشکوک نامگذاری کنید
کلمات کلیدی
استخراج محتوای وب مردم وب جستجو می کنند معدن نام مستعار، نامتعارف خوشه بندی
ترجمه چکیده
با گسترش روزافزون رسانه های اجتماعی، تعداد کاربران فعال فعال این روزها به سرعت در حال افزایش است. آنها پروفایل های شخصی شخصی خود را ایجاد و نگهداری می کنند و از آنها برای برقراری ارتباط با دیگران در فضای سایبر استفاده می کنند. در حال حاضر دو مشکل عمده برای به طور خودکار شناسایی این کاربران وب روبرو هستند و پروفایل های وب خود را مرتبط می کنند. اولا حضور اسم ها در وب است و دوم استفاده از نام های نام مستعار است. در این مقاله، ما یک رویکرد مفهومی متن مبتنی بر متن را پیشنهاد می کنیم تا نامهای نام خانوادگی را برای همه اسم ها و نام مشترکشان در وب به اشتراک بگذاریم و کار را به عنوان یک نام مشترک از طرف کاربر انجام دهیم. روش پیشنهادی یک موتور جستجوی موتور را برای بازیابی صفحات مربوطه برای یک نام استفاده می کند. صفحات بازیابی شده به یک گراف مدل سازی شده و یک الگوریتم خوشه بندی برای اصلاح صفحات وب استفاده می شود. پس از آن هر خوشه به دست آمده برای یک اسم زن برای شناسایی نام مستعار تحت یک روش آماری مبتنی بر الگوی متنی استخراج می شود. کارهای تحقیقاتی موجود، حضور نامزدها در وب را به معنی نامهای نامعلوم در نظر نمی گیرند، که غیر عملی است. تازگی رویکرد پیشنهادی در کشف این نقص آثار موجود است. علاوه بر این، این مشارکت شامل روش تشخیصی است که نیازی به تعداد خوشه ای از پیش تعیین شده برای تولید و الگوی متن ناسازگار بر اساس تکنیک استخراج نام مستعار ندارد. تعداد خوشه ها در روش پیشنهادی، به واسطه پارامتر تورم، به صورت پویا تعیین می شود و پیش تعیین آن نسبتا ساده تر است. نتایج تجربی در اجزای مختلف نشان دهنده استحکام روش پیشنهادی معادله نامطلوب است. این مقاله همچنین اهمیت معدن نام مستعار را به مسئله مانیتور کردن و ردیابی مشکوک در وب به ارمغان می آورد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
With the proliferation of social media, the number of active web-users is rapidly increasing these days. They create and maintain their personal web-profiles, and use them to interact with others in the cyber-space. Currently two major problems are being faced to automatically identify these web-users and correlate their web-profiles. First is the presence of namesakes on the Web, and the second is the use of alias names. In this paper, we propose a context-based text mining approach to discover alias names for all the namesakes sharing a common name on the Web, and leave the task of selecting the namesake of interest on part of the user. The proposed method employs a search-engine API to retrieve relevant webpages for a given name. The retrieved webpages are modeled into a graph, and a clustering algorithm is applied to disambiguate the webpages. Thereafter each obtained cluster standing for a namesake is mined for alias identification following a text pattern based statistical technique. The existing research works do not consider the presence of namesakes on the Web to mine aliases, which is impractical. The novelty of the proposed approach lies in discovering this drawback of existing works. Additionally the contribution includes the disambiguation technique that does not need to have a pre-determined number of clusters to be generated and the light-weight text pattern based alias mining technique. The number of clusters in the proposed method is rather determined dynamically by the inflation parameter, the pre-determination of which is comparatively much easier. Experimental results on different components demonstrate the robustness of the proposed alias mining approach. This paper also brings forth the significance of alias mining to the problem of suspect monitoring and tracking on the Web.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volume 276, 20 August 2014, Pages 123-145
نویسندگان
, ,