کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6890962 1445221 2018 29 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Development of an information retrieval tool for biomedical patents
ترجمه فارسی عنوان
توسعه ابزار بازیابی اطلاعات برای اختراعات ثبت‌شده زیست پزشکی
کلمات کلیدی
متن‌کاوی زیست‌پزشکی، بازیابی اطلاعات، استخراج اطلاعات، اختراعات ثبت‌شده، تبدیل PDF به متن
فهرست مطالب مقاله
چکیده 

کلمات کلیدی

1.مقدمه

شکل 1: متن‌کاوی، مولفه‌های تحلیلی متن در این کار و رشته‌های علمی از حوزه‌های مکمل مشارکت دارند. منطبق با (7).

شکل 2: ساختار اصلی @Note2. @Note2 GUI روشهایی دارد که به طور گرافیکی عملکردهایی از کتابخانه‌های متن‌کاوی اصلی را به اجرا میگذارند که در پشتگاه اجرا شد.

جدول 1: بعضی از برنامه‌های کاری BioTM، زبانهای برنامه نویسی آنها و بازبینی مختصر در عملکرد BioTM

2.    روشها

  شکل 3: خلاصه کانال اطلاعات اختراعات ثبت و طراحی شده که اعداد نشان‌دهنده جریان فرآیند هستند.

شکل 4: مثالی از URL استفاده شده برای دسترسی به منبع محلی با اختراعات ثبت‌شده از USPTO از سال 2005، جستجو برای اختراعات ثبت‌شده با استفاده از واژگان کلیدی خاص.

شکل 5: فرآیند ایجاد و به‌روزرسانی برای ساختار داده پرس‌و‌جو و نوشتجات. تعداد نشان‌دهنده نمونه‌ کانال اطلاعات و جریان آنها است. زمینه اطلاعاتی پرس‌و‌جو در کادر نارنجی نشان‌دهنده فرآیند به‌روزرسانی پرس‌و‌جوی اصلی است، درحالیکه زمینه داده نوشتجات نارنجی نشان‌دهنده زمینه‌ای است که نوشته را به ساختار داده‌ای متفاوتی تغییر میدهد.

شکل 6: مثالی از URL به کار رفته برای دسترسی به منبع محلی با اختراع ثبت‌شده از USPTO از سال 2005، به دست آوردن ابراطلاعات برای شناسه‌های اختراع ثبت‌شده ویژه.

3.    نتایج

شکل 7: ساختار @Note2 با اجرای کانال اطلاعاتی اختراعات ثبت‌شده.کادرهای نارنجی نشان‌دهنده مولفه‌های جدید افزوده هستند.

3.1    کار زیست نوآوری V CHEMDNER

شکل 8: افزونه جستجوی اختراع ثبت‌شده @Note2. کانال اطلاعات از واژگان کلیدی داده ورودی، اسم پرس‌و‌جو و شکل‌بندی ارائه شده توسط کاربر یا با تنظیمات @Note2 برای جستجوی شناسه اختراع ثبت‌شده و دانلود فراداده اختراع ثبت‌شده استفاده میکند.

شکل 9: تزریق داده مجموعه آموزشی کار زیست‌نوآوری V CHEMNER در کانال اطلاعات اختراع ثبت‌شده، جایگزینی نمونه منابع جستجو.

شکل 10: نمودار جعبه‌ای برای معیارهای ارزیابی فرآیند تبدیل PDF به متن. میانه و انحراف معیار پررنگ نشان داده شدند.

3.2    بررسی موردی تولید وانیلین

شکل 11: کانال اطلاعات اختراع ثبت‌شده جستجو برای وانیلین را اجرا میکند. در کانال اطلاعات @Note2، کلیک روی دکمه جستجوی کانال اطلاعات اختراع ثبت‌شده آزاد است (قطعه در گوشه بالا سمت چپ).

شکل 12: کانال اطلاعات اختراع ثبت‌شده جستجویی برای وانیلین اجرا میکند. از نتایج حاصل، یک اختراع ثبت‌شده را میتوان انتخاب کرد تا بعضی داده‌ها از انتشار منابع پیوند خارجی روی جدول جزئیات بیشتر نشان داده شوند

4.    بررسی

 
ترجمه چکیده
دورنما و هدف. حجم مطالب زیست پزشکی در سالهای اخیر رو به افزایش است. اسناد اختراعات ثبت‌شده نیز از این قاعده مستثنی نیستند، منابع مهمی از دانش زیست‌پزشکی، جزئیات فنی و داده‌ برگزیده هستند که در فرآیند امتیازدهی با هم جمع شوند. رشته متن‌کاوی زیست‌پزشکی (BioTM) راه‌حلهایی برای مشکلات به وجود آمده برای ماهیت بدون ساختار زبان طبیعی ارائه داد که جستجوی اطلاعات را به کاری چالش‌برانگیز تبدیل کرد. تکنیکهای متعدد BioTM را میتوان برای اختراعات ثبت‌شده به کار برد. از این میان، بازیابی اطلاعات (IR) شامل فرآیندهایی است که داده‌های مرتبط را از مجموعه اسناد به دست می‌آورند. در این کار، هدف اصلی ساخت کانال اطلاعات اختراعات ثبت‌شده است که کارهای IR را میان منابع اختراعات ثبت‌شده نشان دهد تا این اسناد را با قابلیت عملکرد BioTM ایجاد کند. روشها. کانال اطلاعات در میان @Note2 گسترش یافتند که چارچوب محاسباتی آزاد برای BioTM به شمار میروند، تعدادی از نمونه‌ها به کتابخانه اصلی اضافه شدند، از جمله فراداده اختراعات ثبت‌شده و بازیابی کامل متن، تبدیل PDF به متن و تشخیص نوری کاراکتر . همچنین، رابطهای کاربری برای توسعه عملکرد اصلی در افزونه جدید @Note2 به وجود آمدند. نتایج. یکپارچه‌سازی این ابزار در @Note2 فرصت را برای اجرای ابزار BioTM بین متنهای اختراعات ثبت‌شده فراهم کرد، از جمله این کارها برای استخراج اطلاعات، شاملند از تشخیص واحد اسمی یا استخراج ارتباطات . عملکرد اصلی کانال اطلاعات از طریق بررسی موردی با استفاده از مجموعه داده‌های معیار از چالشهای نوآوری زیستی موجود تشریح شد. همچنین، استفاده از افزونه را با پرس‌و‌جو از کاربر در رابطه با تولید وانیلین نشان دادیم. نتیجه‌گیری. این کار همه محتوای مربوط، از اختراعات ثبت‌شده تا جامعه علمی را در دسترس قرار میدهد، به طور چشمگیری زمان لازم برای انجام کار را کاهش میدهد و رابطهای جغرافیایی ارائه میکند تا استفاده از این ابزار را راحت کنند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر علوم کامپیوتر (عمومی)
چکیده انگلیسی
Conclusions: This work makes available all the relevant content from patents to the scientific community, decreasing drastically the time required for this task, and provides graphical interfaces to ease the use of these tools.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computer Methods and Programs in Biomedicine - Volume 159, June 2018, Pages 125-134
نویسندگان
, , , ,