کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6898927 1446424 2018 17 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Automated scraping of structured data records from health discussion forums using semantic analysis
ترجمه فارسی عنوان
حذف خودکار از سوابق داده های ساخت یافته از انجمن های بحث سلامت با استفاده از تجزیه و تحلیل معنایی
ترجمه چکیده
مقدار اطلاعات موجود در اینترنت رشد چشمگیر دارد و بنابراین دریافت اطلاعات مناسب از یک مخزن بزرگ یک کار ضروری اما پیچیده است. همانطور که ساختار صفحات وب در سراسر وب متنوع است، هیچ اندازه ای برای متناسب با آن وجود ندارد تکنیک برای استخراج داده های وب. این نتیجه نیاز به طراحی تکنیک است که مستقل از ساختار صفحات وب است که در این مقاله با شناسایی محتوای آموزنده از طریق تجزیه و تحلیل معنایی به جای ساختار نحوی مورد توجه قرار گرفته است. انجمن های وب اجتماعی حاوی صفحات وب هستند که با استفاده از قالب های سرور تولید می شوند و اطلاعات موجود در چنین وب سایت ها کاربرد گسترده ای از برنامه های کاربردی نظیر افکار، تحلیل احساسات، مدل سازی موضوع، تحلیل روند و غیره. از انجمن های رسانه های اجتماعی، نقش حیاتی و تجزیه و تحلیل داده های استخراج شده از این انجمن پزشکی پیدا کردن کاربرد آن در تشخیص بیماری بر اساس علائم، تعیین واکنش های نامطلوب دارو، پیشنهاد آزمایش های بالینی برای بیماری ها و غیره است. در این مقاله یک تکنیک کاملا خودکار برای استخراج پست از سایت های پزشکی مختلف انجمن طراحی شده است و به خوبی برای صفحات وب متشکل از وب سایت های متفاوتی طراحی شده است. از آنجایی که این تکنیک بر اساس ویژگی های معنایی است، می توان آن را به سایر انجمن های وب اجتماعی نیز اعمال کرد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر علوم کامپیوتر (عمومی)
چکیده انگلیسی
The amount of information available in the Internet has an exponential growth and therefore, obtaining appropriate information from such a huge repository is an indispensable yet complicated task. As the structuring of web pages is diverse across websites, there is no “one size fits all” technique to perform web data extraction. It results in the need for devising a technique that is independent of structuring of web pages, which is addressed in this paper by identifying informative content through semantic analysis rather than syntactic structure. Social web forums contain web pages which are generated using server-side templates and the information present in such websites has wide variety of applications like opinion mining, sentiment analysis, topic modeling, trend analysis etc. Of the social media forums, health discussion forums play a crucial role and analyzing data extracted from such medical forums find its application in disease detection based on symptoms, determining adverse drug reactions, suggestion of clinical tests for diseases and so on. In this paper, a fully automated technique for extracting posts from various Medical Forum Websites has been devised and it performs well for differently structured web pages belonging to diverse forum websites. Since, the technique is based on semantic features, it can be applied to other social web forums as well.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Informatics in Medicine Unlocked - Volume 10, 2018, Pages 149-158
نویسندگان
, ,