کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4951737 1441598 2017 63 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Mining structured data in natural language artifacts with island parsing
ترجمه فارسی عنوان
داده های ساختاری معدنی در مصنوعات زبان طبیعی با تجزیه جزیره
کلمات کلیدی
مخازن نرم افزار معدن، داده های بدون ساختار، تجزیه جزیره،
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
Researchers have proposed several approaches to recognize, extract, and analyze structured data embedded in natural language. We analyze these approaches and investigate their drawbacks. Subsequently, we present two novel methods, based on scannerless generalized LR (SGLR) and Parsing Expression Grammars (PEGs), to address these drawbacks and to mine structured fragments within unstructured data. We validate and compare these approaches on development emails and Stack Overflow posts with Java code fragments. Both approaches achieve high precision and recall values, but the PEG-based one achieves better computational performances and simplicity in engineering.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Science of Computer Programming - Volume 150, 15 December 2017, Pages 31-55
نویسندگان
, , , ,