کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6861524 1439253 2018 14 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Adaptive local structure learning for document co-clustering
ترجمه فارسی عنوان
یادگیری ساختار محلی سازگار برای هماهنگ سازی سند
کلمات کلیدی
یادگیری سازمانی محلی سازگار، تنظیم مقادیر گراف، همکاری مشترک با سند، سه بعدی سازی ماتریس غیر انتزاعی،
ترجمه چکیده
هدف خوشه بندی سند این است که با استفاده از دوگانگی بین اسناد (یعنی داده ها) و کلمات (یعنی ویژگی ها)، مجموعه داده های متنی را به گروه ها تقسیم کنیم. به عبارت دیگر، اسناد می توانند براساس توزیع آنها بر اساس کلمات گروه بندی شوند، در حالی که کلمات را می توان بر اساس توزیع آنها در اسناد گروه بندی کرد. با این حال، روش های همکاری مشترک سنتی معمولا به ماتریس وابستگی ورودی حساس هستند، زیرا داده ها را براساس نمودار داده ثابت پارتیشن بندی می کنند. برای رسیدگی به این محدودیت، در این مقاله، بر اساس سه بعدی سازی ماتریس غیر انتزاعی، ما یک چارچوب جدیدی از همکاری خوشه ای با یادگیری ساختار سازمانی محلی ارائه می دهیم. چارچوب یادگیری یکپارچه پیشنهادی به طور همزمان یادگیری ساختار ذاتی و سه بعدی سازی (یعنی فاکتور سازی سه عامل) را انجام می دهد. ساختار ذاتی به طور سازگارانه از نتایج سه فاکتور یاد می شود و عوامل برای اصلاح ساختارهای تصفیه محلی داده های متنی اصلاح می شوند. به این طریق، یادگیری و فاکتور سازی ساختار محلی می تواند به طور متقابل بهبود یابد. علاوه بر این، با توجه به دوگانگی بین اسناد و کلمات، چارچوب پیشنهادی نه تنها ساختار محلی سازگار فضای داده، بلکه ساختار محلی سازگار فضای ویژگی را نیز بررسی می کند. برای حل مشکل بهینه سازی روش ما یک الگوریتم به روز رسانی تکراری کارآمد با همگرایی تضمین شده ارائه شده است. آزمایشات بر روی مجموعه داده های متنی معین اثربخشی روش پیشنهادی را نشان می دهد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
The goal of document co-clustering is to partition textual data sets into groups by utilizing the duality between documents (i.e., data points) and words (i.e., features). That is, the documents can be grouped based on their distribution on words, while words can be grouped based on their distribution on documents. However, traditional co-clustering methods are usually sensitive to the input affinity matrix since they partition the data based on the fixed data graph. To address this limitation, in this paper, based on nonnegative matrix tri-factorization, we propose a new framework of co-clustering with adaptive local structure learning. The proposed unified learning framework performs intrinsic structure learning and tri-factorization (i.e., 3-factor factorization) simultaneously. The intrinsic structure is adaptively learned from the results of tri-factorization, and the factors are reformulated to preserve the refined local structures of the textual data. In this way, the local structure learning and factorization can be mutually improved. Furthermore, considering the duality between documents and words, the proposed framework explores not only the adaptive local structure of the data space, but also the adaptive local structure of the feature space. In order to solve the optimization problem of our method, an efficient iterative updating algorithm is proposed with guaranteed convergence. Experiments on benchmark textual data sets demonstrate the effectiveness of the proposed method.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Knowledge-Based Systems - Volume 148, 15 May 2018, Pages 74-84
نویسندگان
, , ,