در کاربرد تشخیص زبان گفتاری GMM-VSM در قالب سیستم GMM
محورهای موضوعی : فناوری اطلاعات و ارتباطاتفهیمه قاسمیان 1 , محمدمهدی همایون پور 2
1 - دانشگاه صنعتی اميرکبير
2 -
کلید واژه: مدل مخلوط گاوسی (GMM), بردار BOS, ماشین بردار پشتیبان (SVM), تشخیص زبان.,
چکیده مقاله :
مدل GMM یکی از پرکاربردترین و موفقترین مدلها در زمینه تشخیص خودکار زبان است. در این مقاله مدلی جدید با نام Adapted Weight-GMM(AW-GMM) ارائه شده است. این مدل مشابه GMM است با این تفاوت که وزن مولفههای آن در قالب سیستم GMM-VSM بر اساس قدرت مولفهها در تمایز یک زبان از سایر زبانها تعیین میگردد. همچنین با توجه به پیچیدگی محاسباتی که در سیستم GMM-VSM در حالتی که توالی 2تایی مولفهها در نظر گرفته شود، وجود دارد، تکنیکی برای ساخت توالی 2تایی مولفهها ارائه شده است که میتوان از آن برای ساخت توالیهای از مرتبه بالاتر نیز استفاده نمود. ارزیابیهای صورت گرفته بر روی 4 زبان انگلیسی، فارسی، فرانسوی و آلمانی از دادگان OGI کارایی تکنیکهای ارائه شده را نشان میدهد.
GMM is one of the most successful models in the field of automatic language identification. In this paper we have proposed a new model named adapted weight GMM (AW-GMM). This model is similar to GMM but the weights are determined using GMM-VSM LID system based on the power of each component in discriminating one language from the others. Also considering the computational complexity of GMM-VSM, we have proposed a technique for constructing bigram sequences of components which could be used for higher sequence orders and decreases the complexity. Experiments on four languages of OGI corpus including English, Farsi, French and German have shown the effectiveness of proposed techniques.