کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4942785 1437420 2017 13 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Keyword spotting in handwritten chinese documents using semi-markov conditional random fields
ترجمه فارسی عنوان
شناسایی کلمات کلیدی در اسناد دستنویس چینی با استفاده از زمینه های تصادفی شرطی نیمه مارکوف
کلمات کلیدی
آنلاین اسناد دست نوشته چینی، زمینه های تصادفی شرطی نیمه مارکوف، کلمات کلیدی، جستجوی مبتنی بر پروکسی،
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
This paper proposes a document indexing method for keyword spotting based on semi-Markov conditional random fields (semi-CRFs), which provide a theoretical framework for fusing the information of different contexts. The candidate segmentation-recognition lattice is first augmented based on the linguistic context to improve recognition results. For fast retrieval and to save storage space, the lattice is then purged by a forward-backward pruning procedure. In the reduced lattice, we estimate character similarity scores based on the semi-CRF model. The parameters of semi-CRF model are estimated using a binary classification objective, i.e., the cross-entropy (CE) to discriminate candidate characters in the lattice. To locate mis-recognized character instances in the lattice, we use confusing similar characters as proxies and search for proxy-characters in the index file. The proxy-character driven search can significantly improve the performance compared with our previous character-synchronous dynamic search (CSDS) method. Experimental results on the online handwriting database CASIA-OLHWDB justify the effectiveness of the proposed method.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Engineering Applications of Artificial Intelligence - Volume 58, February 2017, Pages 49-61
نویسندگان
, , ,