بهبود تولیدکنندههای گفتار سازهای و پیوندی با الهام از عملکرد فشردهسازهای گفتار
محورهای موضوعی : مهندسی برق و کامپیوترنوشین مقصودی 1 , محمدمهدی همایونپور 2
1 - دانشگاه صنعتی امیرکبیر
2 - دانشگاه صنعتی امیرکبیر
کلید واژه: STRAIGHT تحریک چندباندی روش پیوندی روش سازهای فشردهساز,
چکیده مقاله :
این مقاله به پیادهسازی و بهبود بخش تولید گفتار از یک سیستم تبدیل متن به گفتار میپردازد. با این هدف، روش تولید پیوندی مبتنی بر روش جمع همپوشان با پریود صحیح و تحریک چندباندی و روش تولید سازهای برای زبان فارسی پیادهسازی شده و بهمنظور بهبود در کیفیت خروجی از قدرت فشردهسازهای گفتاری استفاده شده است. بهعبارت دیگر در ایده مطرحشده در این مقاله برای رفع مشکلات تولیدکنندههای گفتار از فشردهسازهای موجود استفاده شده است. به این ترتیب که از فشردهساز STRAIGHT برای هموارسازی طیفی در تولیدکننده پیوندی و از فشردهساز پیشگویی خطی با تحریک ترکیبی در تولید گفتار به روش سازهای بهره گرفته شده است. نتایج ارزیابیها نشان داده که استفاده از این فشردهسازها به کاهش ناپیوستگیها در تولیدکننده پیوندی و افزایش معیارهای قابلیت فهم و طبیعیبودن در تولیدکننده سازهای کمک کرده است.
In this paper an approach to improve the quality of synthetic speech in formant and concatenative synthesis techniques is described. To deal with this problem we focused on using vocoders. In concatenative speech synthesis the idea is based on post processing the generated speech to reduce discontinuities. The post processing is consists of integrating Straight method to synthesis system in order to smooth the boundary between units. On the other hand, in formant synthesis we used multi excitation linear predictive method to replace simple excitation signal in Klatt method with multiband excitation. Our synthesis techniques were evaluated with respect to naturalness, fluidity and intelligibility based on subjective methods. These experiments clarified that the naturalness of synthetic speech can be improved by using our smoothing methods and multiband excitation signal.
