کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4943187 1437626 2017 42 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Efficient character segmentation approach for machine-typed documents
ترجمه فارسی عنوان
روش تقسیم کاراکتر کارآمد برای اسناد ماشین تایپ شده
کلمات کلیدی
تقسیم بندی شخصیت، شخصیت شناسی، اسناد ماشین تایپ شده، اسناد چاپی ماشین
ترجمه چکیده
در این مقاله رویکرد کارآمد برای تقسیم کاراکترهای فردی از اسناد اسکن شده تایپ شده بر روی ماشین های قدیمی نشان داده شده است. رویکرد پیشنهاد شده در این مقاله عمدتا برای پردازش اسناد ماشین تایپ شده است، اما می تواند برای اسناد ماشین چاپ شده نیز استفاده شود. رویکرد تقسیم بندی شخصیت پیشنهادی با استفاده از تکنیک های پروفایل پیشنهادی اصلاح شده که بر اساس استفاده از پنجره کشویی برای به دست آوردن اطلاعات در مورد ساختار تصویر سند است. این به دنبال پردازش هیستوگرام به منظور تعیین فاصله بین خطوط، کلمات و شخصیت ها در تصویر سند است. منطق تصمیم گیری مورد استفاده در فرآیند تقسیم بندی شخصیت، توصیف و نشان دهنده ی بیشتر جنبه ی یکپارچه ی تکنیک پیشنهادی است. علاوه بر رویکرد تقسیم بندی شخصیت، معماری فوق سریع برای تحولات تصویر هندسی، که برای چرخش تصویر در فرایند اصلاح غلط استفاده می شود، ارائه شده است، و اجرای سریع آن با استفاده از محاسبات اشاره گر و یک روش معمول بهینه سازی شده در سطح پایین ارائه شده است . رویکرد تقسیم بندی شخصیت پیشنهادی نیمه اتوماتیک است و از مقادیر آستانه برای کنترل روند تقسیم بندی استفاده می کند. نتایج ارائه شده برای دقت تقسیم بندی نشان می دهد که رویکرد پیشنهادی در اغلب موارد از روش های پیشرفته تر برخوردار است. همچنین نتایج حاصل از جنبه پیچیدگی زمانی نشان می دهد که تکنیک جدید سریعتر از رویکردهای پیشرفته اجرا می شود و می تواند تصاویر کوچکتر سند را در کمتر از یک ثانیه پردازش کند و این رویکرد را برای زمان واقعی مناسب می کند وظایف در نهایت، تظاهرات بصری عملکرد اجرایی پیشنهادی با استفاده از اسناد اصلی توسط نیکولا تسلا به دست می آید.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
In this paper an efficient approach for segmentation of the individual characters from scanned documents typed on old typewriters is proposed. The approach proposed in this paper is primarily intended for processing of machine-typed documents, but can be used for machine-printed documents as well. The proposed character segmentation approach uses the modified projection profiles technique which is based on using the sliding window for obtaining the information about the document image structure. This is followed by histogram processing in order to determine the spaces between lines, words and characters in the document image. The decision-making logic used in the process of character segmentation is describes and represents the most an integral aspect of the proposed technique. Beside the character segmentation approach, the ultra-fast architecture for geometrical image transformations, which is used for image rotation in the process of skew correction, is presented, and its fast implementation using pointer arithmetic and a highly optimized low-level machine routine is provided. The proposed character segmentation approach is semi-automatic and uses threshold values to control the segmentation process. Provided results for segmentation accuracy show that the proposed approach outperforms the state-of-the-art approaches in most cases. Also, the results from the aspect of the time complexity show that the new technique performs faster than state-of-the-art approaches and can process even very large document images in less than one second, which makes this approach suitable for real-time tasks. Finally, visual demonstration of the proposed approach performances is achieved using original documents authored by Nikola Tesla.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Expert Systems with Applications - Volume 80, 1 September 2017, Pages 210-231
نویسندگان
, ,