کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6870857 1440106 2018 19 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Supercombinator set acquired from context-free grammar samples
ترجمه فارسی عنوان
مجموعه سوپر کامبیناتور از نمونه های گرامر متنباز به دست آمده است
ترجمه چکیده
ما یک الگوریتم ارائه می دهیم که گرامرهای بدون متن را تبدیل به یک مجموعه غیر اضافی از ابررساناها می کند. این مجموعه شامل ترکیبی از لامبدا متصل شده است که توسط عملیات دستور زبان غنی شده اند. مجموعه نتیجه مقیاس پذیر است و می توان آن را با سوپر کامبیتین های جدید ایجاد شده از گرامرها گسترش داد. ما این الگوریتم را به طور دقیق توصیف می کنیم و سپس آن را در نمونه های گرامر 62،008 به منظور پیدا کردن خواص و محدودیت مجموعه سوپر کامبیناتور به دست آمده اعمال می کنیم. ما نشان می دهیم که این مجموعه دارای حداکثر حداکثر نظری از سوپر کامبیناتورهای ممکن است. این محدودیت دنباله ای از اعداد کاتالان است. ما نشان می دهیم که در بعضی موارد ما می توانیم به این حد دست یابیم، اگر از منبع داده های ورودی به اندازه کافی استفاده می کنیم و حجم سوپر کامپانیا ها را که مجاز به مجموعه نهایی هستند، محدود می کنیم. ما همچنین یکی دیگر از الگوریتم های ما را توصیف می کنیم، که شناسایی بیشترین ساختارهای مجدد در مجموعه ورودی است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
We present an algorithm that transforms context-free grammars into a non-redundant set of supercombinators. This set contains interconnected lambda calculus' supercombinators that are enriched by grammar operations. The resulting set is scalable and it can be extended with new supercombinators created from grammars. We describe this algorithm in detail and then we apply it on 62,008 grammar samples in order to find out the properties and limits of acquired supercombinator set. We show that this set has a maximum theoretical limit of possible supercombinators. That limit is the sequence of Catalan numbers. We show that in some cases we are able to reach that limit if we use large enough input data source and we limit the size of supercombinators permitted into the final set. We also describe another benefit of our algorithm, which is the identification of most reoccurring structures in the input set.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computer Languages, Systems & Structures - Volume 54, December 2018, Pages 1-19
نویسندگان
, ,