کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4966455 1365122 2017 25 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Excavating the mother lode of human-generated text: A systematic review of research that uses the wikipedia corpus
ترجمه فارسی عنوان
گودال مادر از متن تولید شده توسط انسان: بررسی سیستماتیک تحقیقاتی که از مجله ویکیپدیا استفاده می کند
کلمات کلیدی
ترجمه چکیده
اگر چه اساسا یک دانشنامه، محتوا گسترده ویکی پدیا پایگاه دانش است که به طور مداوم توسط محققان در طیف وسیعی از زمینه ها مورد سوء استفاده قرار گرفته است. این مقاله به طور سیستماتیک بررسی مطالعات علمی که ویکی پدیا را به عنوان منبع داده مورد بررسی قرار داده اند و ابزارهایی را که در ویکیپدیا در سه حوزه تحقیق علمی کامپیوتر کاربرد دارد، بررسی می کند: بازیابی اطلاعات، پردازش زبان طبیعی و ساخت هستی شناسی. ما در مورد روند تحقیق مطالعات شناسایی شده و مورد بررسی قرار می گیریم. ما فهرستی از ابزارهایی را که می توان برای استخراج داده ها از ویکی پدیا استفاده کرد و لیستی از مجموعه داده های موجود که از ویکی پدیا استخراج شده است، شناسایی و طبقه بندی کنیم.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نرم افزارهای علوم کامپیوتر
چکیده انگلیسی
Although primarily an encyclopedia, Wikipedia's expansive content provides a knowledge base that has been continuously exploited by researchers in a wide variety of domains. This article systematically reviews the scholarly studies that have used Wikipedia as a data source, and investigates the means by which Wikipedia has been employed in three main computer science research areas: information retrieval, natural language processing, and ontology building. We report and discuss the research trends of the identified and examined studies. We further identify and classify a list of tools that can be used to extract data from Wikipedia, and compile a list of currently available data sets extracted from Wikipedia.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Processing & Management - Volume 53, Issue 2, March 2017, Pages 505-529
نویسندگان
, , , , ,