کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
553377 873486 2006 18 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
The concept of document warehousing for multi-dimensional modeling of textual-based business intelligence
ترجمه فارسی عنوان
مفهوم انباره‌سازی سند برای مدلسازی چندبعدی هوش تجاری مبتنی بر متن
کلمات کلیدی
انباره‌سازی داده‌ها؛ انباره‌سازی سند؛ مدیریت دانش؛ OLAP
فهرست مطالب مقاله
چکیده

کلیدواژه‌ها

1. مقدمه 

2.مقدمه‌ای بر انباره‌سازی داده‌ای

جدول 1. یک رابطه‌ی Region و متغیر آن برای ساخت بُعد R

شکل 1. نمایش بُعد R

شکل 2. یک نمایش کوتاه از بعد R

شکل 3. یک ایمیل شکایت که توسط یک مشتری صادر شده است (A0001).

شکل 4. یک مثال ساده از یک مکعب سند

3.چارچوبی برای انباره‌سازی سند

شکل 5. معماری پیشنهادی انباره‌های سند

شکل 6. فرآیند کلی استخراج، تبدیل، بارگذاری، مدلسازی ابعادی و ساختار یک انباره‌ی سند

3.1.منابع سند

3.2.مؤلفه‌ی Front-end

3.3.مدیر انباره

3.4.مؤلفه‌های Back-end

3.5.اسناد خلاصه‌شده

جدول 2. طراحی متاداده‌ی پیشنهادی

3.6.متاداده

4.مدلسازی انباره‌های سند

شکل 7. یک شمای ستاره‌ای از یک انباره‌ی سند

4.1.ابعاد

4.2.جدول fact

شکل 8. ابعاد product و time که در روابط نشان داده شده‌اند.

4.3.ساختار مکعب‌های سند

5.برنامه‌های انباره‌های سند

5.1.یک برنامه برای مدیریت روابط مشتری

شکل 9. یک شمای ستاره‌ای برای مدیریت ایمیل شکایت

شکل 10. یک نمایش دقیق از بُعد P

5.2.یک برنامه برای انباره‌سازی مقاله

شکل 11. پردازش تحلیلی روی خط برای مکعب سند نمونه.

شکل 12. یک شمای ستاره‌ی نمونه برای انباره سازی مقاله

شکل 13. پردازش تحلیلی روی خط برای مکعب سند نمونه

6.نتیجه‌گیری و مسیرهای آینده

6.1.نتیجه‌گیری

شکل 14. فهرست مقاله‌ی دقیق مشترک «Elsevier» و «Data Mining and Knowledge Discovery»

جدول 3. یک مقایسه‌ بین انباره‌سازی سند و انباره‌سازی داده‌ها

6.2.آثار آینده

 
ترجمه چکیده
در طول دهه‌ی گذشته، انباره‌سازی داده‌ها در سطح گسترده‌ای در انجمن کسب و کار تطبیق یافته است. یک تحلیل چندبُعدی را برای داده‌های کسب و کار تاریخی و کمک به تصمیم‌گیری مدیریتی معاصر فراهم می‌کند. با این حال این باور وجود دارد که تنها 20% از اطلاعات را می‌توان از انباره‌های داده‌ای مرتبط با داده‌های عددی استخراج کرد، 80% بقیه‌ی اطلاعات در داده‌های غیرعددی یا حتی اسناد مخفی است. بنابراین بسیاری از محققان از زمان اجرای تحقیقات روی انباره‌سازی سند برای دستیابی به یک هوش تجاری کامل، دفاع می‌کنند. انباره‌های سند برخلاف سیستم‌های مدیریت سند معمولی، شامل اطلاعات معنای گسترده‌ای در رابطه با اسناد، روابط سند عرضی و گروه‌بندی یا دسته‌بندی سند برای ارائه‌ی یک دسترسی بهینه‌تر و دقیق‌تر به هوش تجاری مبتنی بر متن هستند. در این مقاله به شرح مفهوم ابتدایی انباره‌داری سند پرداخته و تعریف‌های رسمی آن را ارائه می‌کنیم. سپس به ارائه‌ی یک چارچوب سیستمی کلی پرداخته و بعضی کاربردهای سودمند را برای نمایش اهمیت انباره‌سازی سند، شرح می‌دهیم. اثر مرتبط با ساخت یک زیرساخت، کمک به ترکیب پردازش متنی با فناوری‌های پردازش OLAP است. ترکیب انباره‌سازی داده‌ها و انباره‌سازی سند یکی از مهم‌ترین هسته‌های مدیریت دانش و کاربردهای مدیریت رابطه‌ی مشتری به شمار می‌رود.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر سیستم های اطلاعاتی
چکیده انگلیسی

During the past decade, data warehousing has been widely adopted in the business community. It provides multi-dimensional analyses on cumulated historical business data for helping contemporary administrative decision-making. Nevertheless, it is believed that only about 20% information can be extracted from data warehouses concerning numeric data only, the other 80% information is hidden in non-numeric data or even in documents. Therefore, many researchers now advocate that it is time to conduct research work on document warehousing to capture complete business intelligence. Document warehouses, unlike traditional document management systems, include extensive semantic information about documents, cross-document feature relations, and document grouping or clustering to provide a more accurate and more efficient access to text-oriented business intelligence. In this paper, we discuss the basic concept of document warehousing and present its formal definitions. Then, we propose a general system framework and elaborate some useful applications to illustrate the importance of document warehousing. The work is essential for establishing an infrastructure to help combine text processing with numeric OLAP processing technologies. The combination of data warehousing and document warehousing will be one of the most important kernels of knowledge management and customer relationship management applications.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Decision Support Systems - Volume 42, Issue 2, November 2006, Pages 727–744
نویسندگان
, ,