کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6883220 694936 2015 34 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Automatic compilation of language resources for named entity recognition in Turkish by utilizing Wikipedia article titles
ترجمه فارسی عنوان
جمع آوری خودکار منابع زبان برای به رسمیت شناختن نام شرکت در ترکی با استفاده از عناوین مقاله ویکی پدیا
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر شبکه های کامپیوتری و ارتباطات
چکیده انگلیسی
We present an automatic approach to compile language resources for named entity recognition (NER) in Turkish by utilizing Wikipedia article titles. First, a subset of the article titles is annotated with the basic named entity types. This subset is then utilized as training data to automatically classify the remaining titles by employing the k-nearest neighbor algorithm, leading to the construction of a significant lexical resource set for Turkish NER. Experiments on different text genres are conducted after extending an existing NER system with the resources and the results obtained confirm that the resources contribute to NER on different genres.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computer Standards & Interfaces - Volume 41, September 2015, Pages 1-9
نویسندگان
,