در اين مقاله يك روش دو مرحله اي براي طبقه بندي زير- كلمات چاپي فارسي ارائه شده است. زير- كلمات چاپي با استفاده از ويژگيهاي مكان مشخصه و روش k- ميانگين، به 300 خوشه تقسيم شدهاند. از ميانگين ويژگيهاي زير- كلمات هر خوشه به عنوان نماينده آن خوشه استفاده شده است. براي يك زي More
در اين مقاله يك روش دو مرحله اي براي طبقه بندي زير- كلمات چاپي فارسي ارائه شده است. زير- كلمات چاپي با استفاده از ويژگيهاي مكان مشخصه و روش k- ميانگين، به 300 خوشه تقسيم شدهاند. از ميانگين ويژگيهاي زير- كلمات هر خوشه به عنوان نماينده آن خوشه استفاده شده است. براي يك زير- كلمه ورودي، در مرحله اول با استفاده از ويژگيهاي مكان مشخصه و فاصله اقليدسي از ميانگين خوشه ها، طبقه بندي اوليه به 300 خوشه انجام ميشود و 10 خوشه نزديكتر تعيين ميشوند. در مرحله دوم با استفاده از توصيفگرهاي فوريه كانتور، زير- كلمه ورودي به اعضاي اين 10 خوشه طبقه بندي میشود.
مجموعه تمرين شامل زير- كلمات متداول فارسي براي چهار قلم لوتوس، ميترا، زر و ياقوت و سه اندازه 10، 12 و 14 است. در اين تحقيق از بدنه هاي بدون نقطه 12700 زير- كلمه متداول فارسي به عنوان مجموعه تمرين استفاده شده است. در يك آزمايش براي ارزيابي طبقه بندي از مجموعه اي شامل 500 زير- كلمه استفاده شد. با احتساب اولين انتخاب، پنج انتخاب اول و ده انتخاب اول به ترتيب 40/71%، 95% و 20/98% از اين زير- كلمات به درستي طبقهبندي شدند. در مرحله پس پردازش از نوع و ترتيب نقاط زير- كلمات براي بهبود بازشناسي آنها استفاده شد. در يك آزمايش براي بازشناسي يك مجموعه 500 زير- كلمه اي، در انتخاب اول 60/92% از آنها به درستي بازشناسي شدند.
Manuscript profile
Rimag
Rimag is an integrated platform to accomplish all scientific journal requirements such as submission, evaluation, reviewing, editing, DOI assignment and publishing in the web.