در اين مقاله يك روش دو مرحله اي براي طبقه بندي زير- كلمات چاپي فارسي ارائه شده است. زير- كلمات چاپي با استفاده از ويژگيهاي مكان مشخصه و روش k- ميانگين، به 300 خوشه تقسيم شدهاند. از ميانگين ويژگيهاي زير- كلمات هر خوشه به عنوان نماينده آن خوشه استفاده شده است. براي يك زي أکثر
در اين مقاله يك روش دو مرحله اي براي طبقه بندي زير- كلمات چاپي فارسي ارائه شده است. زير- كلمات چاپي با استفاده از ويژگيهاي مكان مشخصه و روش k- ميانگين، به 300 خوشه تقسيم شدهاند. از ميانگين ويژگيهاي زير- كلمات هر خوشه به عنوان نماينده آن خوشه استفاده شده است. براي يك زير- كلمه ورودي، در مرحله اول با استفاده از ويژگيهاي مكان مشخصه و فاصله اقليدسي از ميانگين خوشه ها، طبقه بندي اوليه به 300 خوشه انجام ميشود و 10 خوشه نزديكتر تعيين ميشوند. در مرحله دوم با استفاده از توصيفگرهاي فوريه كانتور، زير- كلمه ورودي به اعضاي اين 10 خوشه طبقه بندي میشود.
مجموعه تمرين شامل زير- كلمات متداول فارسي براي چهار قلم لوتوس، ميترا، زر و ياقوت و سه اندازه 10، 12 و 14 است. در اين تحقيق از بدنه هاي بدون نقطه 12700 زير- كلمه متداول فارسي به عنوان مجموعه تمرين استفاده شده است. در يك آزمايش براي ارزيابي طبقه بندي از مجموعه اي شامل 500 زير- كلمه استفاده شد. با احتساب اولين انتخاب، پنج انتخاب اول و ده انتخاب اول به ترتيب 40/71%، 95% و 20/98% از اين زير- كلمات به درستي طبقهبندي شدند. در مرحله پس پردازش از نوع و ترتيب نقاط زير- كلمات براي بهبود بازشناسي آنها استفاده شد. در يك آزمايش براي بازشناسي يك مجموعه 500 زير- كلمه اي، در انتخاب اول 60/92% از آنها به درستي بازشناسي شدند.
تفاصيل المقالة
رایمگ
يقوم نظام رایمگ بتنفيذ جميع عمليات الاستلام والتقييم والحكم والتحرير وتخطيط الصفحة والنشر الإلكتروني للمجلات العلمية.