ارزیابی روشهای بازشناسی متون فارسی بر مبنای شکل کلی زیرکلمات
الموضوعات :حسین خسروی 1 , احساناله کبیر 2
1 - دانشگاه صنعتی شاهرود
2 - دانشگاه تربیت مدرس
الکلمات المفتاحية: بازشناسی متن شکل کلی خوشهیابی فارسی,
ملخص المقالة :
دو رویکرد برای بازشناسی متون فارسی با استفاده از شکل کلی زیركلمات ارائه شده و ضمن مقایسه آنها، مزایا و معایب استفاده از روشهای مبتنی بر شکل کلی بیان شده است. رویکرد اول بر بازشناسی زیرکلمات، بدون حذف نقاط و علائم آنها استوار است و رویکرد دوم مبتنی بر شکل بدنه زیرکلمات است که از حذف نقاط و علائم زیرکلمه حاصل میشود و پس از بازشناسی بدنه، اطلاعات نقاط و علائم افزوده میشود. هر دو رویکرد شامل دو مرحله آموزش و آزمایش هستند. در مرحله آموزش، زیرکلمات مجموعه آموزش، خوشهبندی میشوند. برای خوشهیابی از الگوریتم ISODATA استفاده شده و مراکز اولیه خوشهها توسط یک الگوریتم خوشهیابی سلسله مراتبی محاسبه شدهاند. در رویکرد اول، بازشناسی طی دو مرحله صورت میگیرد: یافتن خوشههای نزدیک به ورودی و یافتن نزدیکترین زیرکلمه از بین خوشههای نزدیک. در رویکرد دوم علاوه بر این مراحل، یک مرحله اضافی برای یافتن زیرکلمه نهایی بر اساس الگوی نقاط نیز وجود دارد. هر دو روش نتایج قابل قبولی روی تصاویر تمیز ارائه میدهند بهطوری که رویکرد بانقطه دقتی حدود 94% و رویکرد بدون نقطه دقتی حدود 93% در سطح کلمه ارائه میدهد. لیکن در برخورد با تصاویر کمکیفیت و نویزی دچار افت دقت میشوند که این کاهش در برخی موارد بسیار شدید است. دلایل این کاهش دقت ارزیابی شده و راهکاری برای بهبود آن ارائه شده است. همچنین ضمن مقایسه دو رویکرد، مزایا و معایب بازشناسی بر مبنای شکل کلی ارائه شده است.
[1] H. Y. Abdelazim and M. A. Hashish, "Arabic reading machine," in Proc. of the 10th National Computer Conf., Jeddah: Scientific Publishing Center, vol. 1, pp. 733-744, 1988.
[2] A. Amin, "Off-line Arabic character recognition: the state of the art," Pattern Recognition, vol. 31, no. 5, pp. 517-530, 1 Mar. 1998.
[3] M. Sarfraz, S. N. Nawaz, and A. Al - Khuraidly, "Offline Arabic text recognition system," in Proc. of Int. Conf. on Geometric Modeling and Graphics, pp. 30-35, 16-18 Jul. 2003.
[4] A. M. Gouda and M. A. Rashwan, "Segmentation of connected Arabic characters using hidden Markov models," in Prof. IEEE Int. Conf. on Computational Intelligence for Measurement Systems and Applications, pp. 115-119, 14-16 Jul. 2004.
[5] B. Kurdy and M. AlSabbagh, "Omnifont Arabic optical character recognition system," in Proc. of Int. Conf. on Information and Communication Technologies: from Theory to Applications, pp. 469-470, 19-23 Apr. 2004.
[6] A. I. Al - Shoshan, "Arabic OCR based on image invariants," in Proc. of the Int. Conf. on Geometric Modeling and Imaging- New Trends, pp. 150-154, London, UK, 16-18 Aug. 2006.
[7] س. ا. باقری یزدی و ب. ن. اعرابی، "استفاده همزمان از مدل مخفی مارکوف، برنامهنویسی پویا و ماشین بردار پشتیبان برای بازشناسی متن فارسی،" چهارمين كنفرانس بینایی ماشین و پردازش تصویر، مشهد، بهمن 1385.
[8] M. B. Menhaj and M. Adab, "Simultaneous segmentation and recognition of Farsi/Latin printed texts with MLP," in Proc. Int. Joint Conf. on Neural Networks, vol. 2, pp. 1534-1539, 12-17 May 2002.
[9] R. Mehran, H. Pirsiavash, and F. Razzazi, "A front-end OCR for omni-font Persian/Arabic cursive printed documents," Digital Imaging Computing: Techniques and Applications, p. 56, 6-08 Dec. 2005.
[10] R. Azmi and E. Kabir, "A new segmentation technique for omnifont Farsi text," Pattern Recognition Letters, vol. 22, no. 2, pp. 97-104, Feb. 2001.
[11] A. Ebrahimi and E. Kabir, "A pictorial dictionary for printed Farsi subwords," Pattern Recognition Letters, vol. 29, no. 5, pp. 656-663, Apr. 2008.
[12] B. Parhami and M. Taraghi, "Automatic recognition of printed Farsi texts," Pattern Recognition Letters, vol. 14, no. 1-6, pp. 395-403, 1981.
[13] ر. عزمی، بازشناسی متون چاپی فارسی، رساله دکتری، بخش مهندسی برق دانشگاه تربیت مدرس، 1378.
[14] س. رضوی و ا. کبیر، "یک پایگاه داده برای بازشناسی دستنوشتههای برخط فارسی،" ششمین كنفرانس سيستمهای هوشمند، صص. 225-218، كرمان، آذر 1383.
[15] H. Khosravi and E. Kabir, "Introducing a very large dataset of handwritten Farsi digits and a study on their varieties," Pattern Recognition Letters, vol. 28, no. 10, pp. 1133-1141, 15 Jul. 2007.
[16] G. H. Ball and D. I. Hall, "Some fundamental concepts and synthesis procedures for pattern recognition preprocessors," in Proc. Int. Conf. Microwaves, Circuit Theory, and Information Theory, pp. 113-114, Tokyo, Japan, 1964.
[17] ح. خسروی و ا. كبیر، "معرفی دو ویژگی سریع و كارآمد برای بازشناسی ارقام دستنویس فارسی،" چهارمين كنفرانس بینایی ماشین و پردازش تصویر، مشهد، صص 1131-1126، بهمن 1385.