الگوریتم اصلاح شده جداسازی حروف متون چاپی با برچسب زدن به کانتور بالایی کلمات

نویسندگان

چکیده

در این مقاله با اصلاح الگوریتم عزمی که مبتنی بر کانتور بالایی کلمات است، الگوریتم جداسازی مناسبی برای متون با کیفیت چاپی پایین ارائه شده است. برای حل مشکل نایکنواختی نوار زمینه خط،روش مناسبی برای تعیین نوار زمینه محلی پیشنهاد شده و با اصلاح روش بر چسب زنی کانتور بالایی وتکمیل قواعد جداسازی، دقت الگوریتم افزایش داده شده است. نرخ جداسازی درست حروف 97% است. بر اساس نتایج به دست آمده، بررسی دقیقی درباره علل خطاها ارائه شده است که می‌تواند راهگشای تحقیقات بعدی در این زمینه باشد

کلیدواژه‌ها


عنوان مقاله [English]

A Modified Character Segmentation Algorithm for Farsi Printed Text Using Upper Contour Labelling

نویسندگان [English]

  • H. Nezamabadi-Pour
  • E. Kabir and R. Azmi
چکیده [English]

In this paper, a modified segmentation algorithm for printed Farsi words is presented. This algorithm is based on a previous work by Azmi that uses the conditional labeling of the upper contour to find the segmentation points. The main objective is to improve the segmentation results for low quality prints. To achieve this, various modifications on local baseline detection, contour labeling and segmentation rules have been applied. In an experiment, the correct segmentation rate was 97%. Based on the results obtained, a detailed error analysis is presented which should be useful for furthur research on this topic.

کلیدواژه‌ها [English]

  • Character Segmentation
  • Farsi Printed text
  • Local baseline
  • Upper contour
  • Histogram
  • Segmental code
  • Labeling

تحت نظارت وف ایرانی