کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4970293 1450032 2017 12 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Optimizing the class information divergence for transductive classification of texts using propagation in bipartite graphs
ترجمه فارسی عنوان
بهینه سازی واگرایی اطلاعات کلاس برای طبقه بندی متخلخل متون با استفاده از انتشار در گراف دو طرفه
کلمات کلیدی
ترجمه چکیده
طبقه بندی مولد یک روش مفید برای طبقه بندی مجموعه ای از اسناد متنی بدون برچسب است که فقط یک کسر کوچک از این مجموعه می تواند به صورت دستی برچسب گذاری شود. الگوریتم های مبتنی بر گراف در سال های اخیر موجب ایجاد منافع قابل توجهی برای طبقه بندی پرتودرمانی شده اند، زیرا نمایندگی مبتنی بر گراف، تبادل برچسب را از طریق لبه های گراف انجام می دهد. در نمایه گراف دو طرفه، گره ها اشیاء از دو نوع را نشان می دهند، در اینجا اسناد و اصطلاحات، و لبه های بین اسناد و اصطلاحات نشان دهنده وقوع شرایط در اسناد است. در این زمینه، انتشار برچسب از اسناد به شرایط و سپس از اصطلاحات به اسناد تکراری انجام می شود. در این مقاله، ما یک الگوریتم جدید بر اساس گراف مبتنی بر گرافیتی استفاده می کنیم که از ساختار گراف دو طرفه برای ارتباط اطلاعات موجود کلاس اسناد برچسب دار استفاده می کند و سپس این اطلاعات کلاس را برای تخصیص برچسب ها برای اسناد بدون برچسب به نمایش می گذارد. با مرتبط کردن اطلاعات کلاس به لبه های پیوند اسناد به شرایط ما تضمین می کنیم که یک اصطلاح تک می تواند اطلاعات کلاس های مختلف را به همسایگان مجزا آن انتقال دهد. ما همچنین نشان دادیم که روش پیشنهادی الگوریتم های طبقه بندی پرتوودتی بر مبنای مدل فضای بردار یا نمودار در مقایسه با تعداد کمی از اسناد برچسب دار در دسترس است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
Transductive classification is an useful way to classify a collection of unlabeled textual documents when only a small fraction of this collection can be manually labeled. Graph-based algorithms have aroused considerable interests in recent years to perform transductive classification since the graph-based representation facilitates label propagation through the graph edges. In a bipartite graph representation, nodes represent objects of two types, here documents and terms, and the edges between documents and terms represent the occurrences of the terms in the documents. In this context, the label propagation is performed from documents to terms and then from terms to documents iteratively. In this paper we propose a new graph-based transductive algorithm that use the bipartite graph structure to associate the available class information of labeled documents and then propagate these class information to assign labels for unlabeled documents. By associating the class information to edges linking documents to terms we guarantee that a single term can propagate different class information to its distinct neighbors. We also demonstrated that the proposed method surpasses the algorithms for transductive classification based on vector space model or graphs when only a small number of labeled documents is available.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Pattern Recognition Letters - Volume 87, 1 February 2017, Pages 127-138
نویسندگان
, , ,