کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4943253 1437624 2017 34 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A system for extracting and comparing memes in online forums
ترجمه فارسی عنوان
سیستم برای استخراج و مقایسه الگوهای رفتاری در انجمن های آنلاین
کلمات کلیدی
پردازش متن، شبکه های معنایی، انجمن های آنلاین بازیابی اطلاعات، تکنیک های جستجو، اطلاعات و دانش، هوش محاسباتی،
ترجمه چکیده
از ریشه های آنها در زمینه جامعه شناختی، الگوهای رفتاری اخیرا در زمینه "انتقال ویروسی" واحدهای اطلاعات اولیه (الگوهای رفتاری) در شبکه های اجتماعی آنلاین مورد توجه قرار گرفته اند. با این حال، کارهای زیادی در رابطه با معیارها و مسائل پردازش اطلاعات عملی انجام می شود. در این مقاله، یک مبنای نظری و سیستم پردازش را برای استخراج و تطبیق الگوهای رفتاری از متن فرمت آزاد تعریف می کنیم. این سیستم کار یک تحلیلگر متنی را در استخراج این نوع ساختار داده از جابجایی متن های آنلاین و انجام آزمایش های تجربی به شیوه ای کنترل می کند. جنبه های عمومی مربوط به راه حل عبارتند از پردازش اتوماتیک متن بدون ساختار بدون نیاز به پیش پردازش (مانند برچسب زدن و برچسب زدن)، شناسایی همزمان وقایع مفاهیم و روابط مربوطه، ساخت شبکه های معنایی و انتخاب الگوهای رفتاری بالا. این سیستم این پروسه ها را ادغام می کند که عموما در سایر سیستم های هنری جداگانه هستند. سیستم پیشنهادی مهم است، زیرا محتوای متن آنلاین بدون ساختار در حال رشد است با میزان بیشتر از محتوای دیگر (به عنوان مثال نیمه ساختار یافته، ساختار یافته) و سیستم های یکپارچه و خودکار برای استخراج دانش از این محتوا در آینده به طور فزاینده مهم خواهد بود. برای نشان دادن روش و معیارهای ما چندین انجمن آنلاین بحث آنلاین واقعی را استخراج می کنیم، مفاهیم و روابط اصلی را استخراج می کنیم، الگوهای رفتاری را ایجاد می کنیم و سپس الگوهای رفتاری کلیدی را برای هر کدام از پرونده ها با استفاده از یک فرایند تطبیق پیچیده شناسایی می کنیم. نتایج نشان می دهد که روش ما می تواند به طور خودکار دانش کلیدی هماهنگ را از متن آزاد استخراج کند، که با تعیین معیارها با مجموعه ای از روش های دیگر تجزیه و تحلیل متن و همچنین ارزیابی مطالعات کاربر تایید می شود.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
From their origins in the sociological field, memes have recently become of interest in the context of `viral' transmission of basic information units (memes) in online social networks. However, much work still needs to be done in terms of metrics and practical data processing issues. In this paper we define a theoretical basis and processing system for extracting and matching memes from free format text. The system facilitates the work of a text analyst in extracting this type of data structures from online text corpuses and n performing empirical experiments in a controlled manner. The general aspects related to the solution are the automatic processing of unstructured text without need for preprocessing (such as labelling and tagging), identification of co-occurences of concepts and corresponding relations, construction of semantic networks and selecting the top memes. The system integrates these processes which are generally separate in other state of the art systems. The proposed system is important because unstructured online text content is growing at a greater rate than other content (e.g. semi-structured, structured) and integrated and automated systems for knowledge extraction from this content will be increasingly important in the future. To illustrate the method and metrics we process several real online discussion forums, extracting the principal concepts and relations, building the memes and then identifying the key memes for each document corpus using a sophisticated matching process. The results show that our method can automatically extract coherent key knowledge from free text, which is corroborated by benchmarking with a set of other text analysis approaches, as well as a user study evaluation.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Expert Systems with Applications - Volume 82, 1 October 2017, Pages 231-251
نویسندگان
, , , , ,