کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4966506 1365125 2017 24 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Using genre-specific features for patent summaries
ترجمه فارسی عنوان
استفاده از ویژگی های ژنرال برای خلاصه های ثبت اختراع
کلمات کلیدی
خلاصه سازی، اختراعات، زنجیرهای زبانی، تقسیم بندی، خلاصه بر اساس بخش، تجمع جمله،
ترجمه چکیده
جستجوی ثبت اختراع به یاد می آورد که هدایت می شود، که دست کم با تقریبا یکنواختی دقیق به دست می آید. به عنوان یک نتیجه، تحلیلگران ثبت اختراعات باید مرتبا تعداد زیادی از اختراعات را مشاهده و بررسی کنند. این بدان معنی است که حجم کاری بسیار بالا است. کمک های تجزیه و تحلیل تعاملی که به کم کردن این حجم کار کمک می کنند در نتیجه تقاضای بالا هستند. با این حال، این کمک ها مقدار مواد مورد بررسی را کاهش نمی دهد، آنها تنها امتحان خود را تسهیل می کنند. کاهش آن را می توان با استفاده از خلاصه های ثبت اختراع به جای اسناد کامل ثبت اختراع به دست آورد. تا کنون، خلاصه های ثبت اختراع با کیفیت بالا به طور دستی تولید می شود و فقط چند کار تحقیقاتی در مورد مسئله خلاصه سازی ثبت اختراع اتوماتیک است. اغلب این آثار یا تکرار معیارهای خلاصه شناخته شده از خلاصه گفتار عمومی و یا تمرکز بر ادعاهای یک حق ثبت اختراع. با این حال، می توان مشاهده کرد که هیچ کدام از استراتژی ها کافی نیست: تکنیک های خلاصه ای از گفتمان عمومی، با استفاده از ویژگی های خاص ژنرال ثبت اختراع، از استفاده محدود استفاده می کنند و تکنیک هایی که بر ادعاهایی تمرکز می کنند، تنها در مورد خلاصه هایشان مهم نیست جزئیات ارائه شده در بخش های دیگر در مورد اجزای اختراع معرفی شده در ادعا. ما یک روش خلاصه سازی حق ثبت اختراع را ارائه می دهیم که طرز تفکر ژنتیکی (مانند توزیع نامتقارن محتوا در بخش های مختلف ثبت اختراع، طول بیش از حد جملات در ادعاها، واژگان انتزاعی و غیره) را برای دریافت خلاصه جامع اختراع. به طور خاص، از زنجیره های واژگانی در ادعاهای و در توضیح اختراع و بخش های توضیح ادعا شده در سطح زیرزمینی استفاده می کنیم تا ارزیابی ارتباط قطعات فردی سند را برای خلاصه انجام دهیم. مهم ترین بخش ها انتخاب شده اند و با استفاده از تکنیک های تولید نسل کامل کامل ترکیب شده اند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نرم افزارهای علوم کامپیوتر
چکیده انگلیسی
Patent search is recall-driven, which goes hand in hand with at least a partial sacrifice of precision. As a consequence, patent analysts have to regularly view and examine a large amount of patents. This implies a very high workload. Interactive analysis aids that help to minimize this workload are thus of high demand. Still, these aids do not reduce the amount of the material to be examined, they only facilitate its examination. Its reduction can be achieved working with patent summaries instead of full patent documents. So far, high quality patent summaries are produced mainly manually and only a few research works address the problem of automatic patent summarization. Most often, these works either replicate the summarization metrics known from general discourse summarization or focus on the claims of a patent. However, it can be observed that neither of the strategies is adequate: general discourse state-of-the-art summarization techniques are of limited use due to the idiosyncrasies of the patent genre, and techniques that focus on claims only miss in their summaries important details provided in the other sections on the components of the invention introduced in the claims. We propose a patent summarization technique that takes the idiosyncrasies of the patent genre (such as the unbalanced distribution of the content across the different sections of a patent, excessive length of the sentences in the claims, abstract vocabulary, etc.) into account to obtain a comprehensive summary of the invention. In particular, we make use of lexical chains in the claims and in the description of the invention and of aligned claim-description segments at the subsentential level to assess the relevance of the individual fragments of the document for the summary. The most relevant fragments are selected and merged using full-fledged natural language generation techniques.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Processing & Management - Volume 53, Issue 1, January 2017, Pages 151-174
نویسندگان
, , , , , , , ,