راهكاري ساده و مؤثر براي تشخیص حروف الفبای فارسی در زبان اشاره حرکات انگشتان
محورهای موضوعی : electrical and computer engineeringمحمدجواد برزگر سخویدی 1 , احمدرضا شرافت 2
1 - دانشگاه تربیت مدرس
2 - دانشگاه تربیت مدرس
کلید واژه: آشکارسازی پوست املای انگشتی فارسی تشخیص زبان اشاره شبكه عصبي نزدیکترین همسایه,
چکیده مقاله :
در سالهای اخیر، تشخیص حرکات اشاره (زبان اشاره) مورد توجه پژوهشگران قرار گرفته است. زبان اشاره، ترکیبی از حالات دست، حرکات دست و حالات چهره است. املای انگشتی، یک نمایش برای حروف الفبای کلماتی است که در لغتنامه زبان وجود ندارد. در این مقاله یک سامانه املای انگشتی برای تشخیص حروف الفبای فارسی ارائه شده که در آن برای هر حرف الفبا یک شکل دست در نظر گرفته شده است. این سامانه شامل پنج مرحله است: اول، جمعآوری داده تصویری؛ دوم، پیشپردازش؛ سوم، استخراج و آشکارسازی ویژگیهای شکل دست؛ چهارم، کاهش اندازه بردار ویژگی و پنجم، پیادهسازی تشخیص با استفاده از سه روش نزدیکترین همسایه (معيار فاصله اقليدسي و معيار فاصله اقليدسي نرماليزه) و شبكه عصبي. در این مقاله از تبدیل کسینوسی گسسته (DCT) برای کاهش اندازه بردار ویژگی استفاده شده است که نسبت به روشهای موجود، نظیر تبدیل فوریه گسسته و ضرايب توصيفگر فوريه عملکردی بهتر دارد. نتایج پیادهسازی با شبكه عصبي، دقت تشخیص حروف الفبا را 1/99% نشان داده است که نسبت به عملكرد سامانههاي موجود بهبود یافته است.
In recent years, automated recognition of gestures in the finger spelling paradigm has become an active research area. Gesture is a combination of hand postures, hand movements, and face gestures; and finger spelling is a way of presenting alphabets of a word that does not exist in the sign language dictionary. In this paper, we present a scheme for hand gesture recognition in finger spelling of Farsi alphabets, where a different shape for hand and fingers denote a different letter in the alphabet. Our scheme has five stages, namely, visual data gathering, preprocessing of the image, detection and extraction of hand’s features, feature reduction and consolidation, and finally, hand gesture recognition. For the last stage (hand gesture recognition), we employ three techniques, namely, the nearest neighbor using the Euclidian distance, the nearest neighbor using the normalized Euclidian distance, and neural networks. For reducing the feature space, we use the discrete cosine transform (DCT), which yields better results as compared to the discrete Fourier transform and Fourier coefficients. We achieved 99.1% correct recognition using neural networks, which is superior to existing schemes.
