فهرس المقالات محمدمهدی همایون پور


  • المقاله

    1 - در کاربرد تشخیص زبان گفتاری GMM-VSM در قالب سیستم GMM
    فصلنامه فناوری ایران , العدد 5 , السنة 2 , بهار-تابستان
    مدل GMM یکی از پرکاربردترین و موفق‌ترین مدل‌ها در زمینه تشخیص خودکار زبان است. در این مقاله مدلی جدید با نام Adapted Weight-GMM(AW-GMM) ارائه شده است. این مدل مشابه GMM است با این تفاوت که وزن مولفه‌های آن در قالب سیستم GMM-VSM بر اساس قدرت مولفه‌ها در تمایز یک زبان از أکثر
    مدل GMM یکی از پرکاربردترین و موفق‌ترین مدل‌ها در زمینه تشخیص خودکار زبان است. در این مقاله مدلی جدید با نام Adapted Weight-GMM(AW-GMM) ارائه شده است. این مدل مشابه GMM است با این تفاوت که وزن مولفه‌های آن در قالب سیستم GMM-VSM بر اساس قدرت مولفه‌ها در تمایز یک زبان از سایر زبان‌ها تعیین می‌گردد. همچنین با توجه به پیچیدگی محاسباتی که در سیستم GMM-VSM در حالتی که توالی 2تایی مولفه‌ها در نظر گرفته شود، وجود دارد، تکنیکی برای ساخت توالی 2تایی مولفه‌ها ارائه شده است که می‌توان از آن برای ساخت توالی‌های از مرتبه بالاتر نیز استفاده نمود. ارزیابی‌های صورت گرفته بر روی 4 زبان انگلیسی، فارسی، فرانسوی و آلمانی از دادگان OGI کارایی تکنیک‌های ارائه شده را نشان می‌دهد. تفاصيل المقالة

  • المقاله

    2 - بهبود سرعت و دقت در استفاده از برنامه‌نويسي ژنتيک براي تصديق هويت گوينده
    فصلنامه مهندسی برق و مهندسی کامپيوتر ايران , العدد 24 , السنة 8 , زمستان 1389
    در تصديق هويت گوينده، سيستم هويت شخصي را که با سيستم تماس برقرار کرده است، بررسي کرده و تعيين مي‌کند که وي همان شخص مدعي است و يا دروغ مي‌گويد. در اين مقاله از برنامه‌نويسي ژنتيک به‌عنوان روشی برای مدل‌سازي گويندگان استفاده شد. با توجه به زمان زياد آموزش مدل‌ها توسط برن أکثر
    در تصديق هويت گوينده، سيستم هويت شخصي را که با سيستم تماس برقرار کرده است، بررسي کرده و تعيين مي‌کند که وي همان شخص مدعي است و يا دروغ مي‌گويد. در اين مقاله از برنامه‌نويسي ژنتيک به‌عنوان روشی برای مدل‌سازي گويندگان استفاده شد. با توجه به زمان زياد آموزش مدل‌ها توسط برنامه‌نويسي ژنتيک، ايده بهره‌مندي از فشرده‌سازي داده‌هاي آموزشي، به‌‌منظور کاهش زمان آموزش مدل‌ها مطرح گرديد و بدين ترتيب زمان لازم برای مدل‌سازی گويندگان با استفاده از برنامه‌نويسي ژنتيک در حدود 20 برابر کاهش داده شد. آموزش چندين درخت برنامه‌نويسي ژنتيک به‌عنوان مدل هر گوينده، ايده ديگري است که به‌منظور بهبود دقت تصديق هويت گوينده در اين مقاله مطرح شده است. در اين روش، داده‌هاي آموزشي به تعداد کمي خوشه تفکيک شده و به‌ازاي هر خوشه، يک درخت برنامه‌نويسي ژنتيک آموزش داده مي‌شود. بدين ترتيب يک گوينده با چندين درخت برنامه‌نويسي ژنتيک مدل مي‌شود. با استفاده از روش پيشنهادي، کارايي برنامه‌نويسي ژنتيک براي تصديق هويت گوينده از 50% به حدود 92% افزايش پيدا کرده است. نتايج حاصل از عملکرد برنامه‌نويسي ژنتيک با کارايي روش‌هاي تمايزي ديگري مثل شبکه‌های ‌عصبي MLP و LVQ و نيز روش‌هاي غير تمايزي مانند LBG، GMM، GMM-UBM و VQ-MAP مقايسه گرديد و مشاهده شد که برنامه‌نويسي ژنتيک کارايي بهتري را نسبت به ديگر روش‌ها نتيجه مي‌دهد. تفاصيل المقالة

  • المقاله

    3 - بهبود تولیدکننده‌های گفتار سازه‌ای و پیوندی با الهام از عملکرد فشرده‌ساز‌های گفتار
    فصلنامه مهندسی برق و مهندسی کامپيوتر ايران , العدد 26 , السنة 9 , تابستان 1390
    این مقاله به پیاده‌سازی و بهبود بخش تولید گفتار از یک سیستم تبدیل متن به گفتار می‌پردازد. با این هدف، روش تولید پیوندی مبتنی بر روش جمع هم‌پوشان با پریود صحیح و تحریک چندباندی و روش تولید سازه‌ای برای زبان فارسی پیاده‌سازی شده و به‌منظور بهبود در کیفیت خروجی از قدرت فشر أکثر
    این مقاله به پیاده‌سازی و بهبود بخش تولید گفتار از یک سیستم تبدیل متن به گفتار می‌پردازد. با این هدف، روش تولید پیوندی مبتنی بر روش جمع هم‌پوشان با پریود صحیح و تحریک چندباندی و روش تولید سازه‌ای برای زبان فارسی پیاده‌سازی شده و به‌منظور بهبود در کیفیت خروجی از قدرت فشرده‌سازهای گفتاری استفاده شده است. به‌عبارت دیگر در ایده مطرح‌شده در این مقاله برای رفع مشکلات تولیدکننده‌های گفتار از فشرده‌سازهای موجود استفاده شده است. به این ترتیب که از فشرده‌ساز STRAIGHT برای هموارسازی طیفی در تولیدکننده پیوندی و از فشرده‌ساز پیشگویی خطی با تحریک ترکیبی در تولید گفتار به روش سازه‌ای بهره گرفته شده است. نتایج ارزیابی‌ها نشان داده که استفاده از این فشرده‌سازها به کاهش ناپیوستگی‌ها در تولیدکننده پیوندی و افزایش معیارهای قابلیت فهم و طبیعی‌بودن در تولیدکننده سازه‌ای کمک کرده است. تفاصيل المقالة

  • المقاله

    4 - بهبود دقت مدل GMM با استفاده از کرنل PSK در کاربرد تشخيص زبان گفتاري
    فصلنامه مهندسی برق و مهندسی کامپيوتر ايران , العدد 27 , السنة 9 , پاییز 1390
    مدل مخلوط گاوسي (GMM)، روشي ساده و مؤثر براي مدل‌کردن آماري فضاي ويژگي‌هاست که به‌طور گسترده در کاربرد تشخيص زبان مورد استفاده قرار گرفته و از الگوريتم بيشينه‌سازي اميد رياضي براي آموزش پارامترهاي اين مدل استفاده مي‌شود. در اين مقاله با توجه به مشکلي که در آموزش مدل GMM أکثر
    مدل مخلوط گاوسي (GMM)، روشي ساده و مؤثر براي مدل‌کردن آماري فضاي ويژگي‌هاست که به‌طور گسترده در کاربرد تشخيص زبان مورد استفاده قرار گرفته و از الگوريتم بيشينه‌سازي اميد رياضي براي آموزش پارامترهاي اين مدل استفاده مي‌شود. در اين مقاله با توجه به مشکلي که در آموزش مدل GMM وجود دارد، مدلي جديد با نام PAW-GMM ارائه شده است. در اين مدل، قدرت هر مؤلفه از مدل GMMدر تمايز يک زبان از ساير زبان‌ها، براي تعيين وزن هر مؤلفه در نظر گرفته مي‌شود. مدل PAW-GMM به‌دليل در نظر گرفتن خواص تمايزي مؤلفه‌هاي مخلوط گاوسي، سبب افزايش دقت سيستم‌هاي تشخيص زباني مي‌شود که از اين مدل به‌عنوان جايگزين مدلGMM استفاده مي‌کنند. همچنين يکي از مشکلاتي که در سيستم GMM-PSK-SVMکه يکي از بهترين سيستم‌هاي تشخيص زبان است وجود دارد، پيچيدگي محاسباتي بالا خصوصاً با اضافه‌شدن تعداد زبان‌هاست. از اين رو سيستم UBM-PSK-SVM ارائه شده است که با ثابت نگه داشتن دقت سيستم GMM - PSK - SVM، سبب کاهش پيچيدگي محاسباتي آن شده و در نتيجه قدرت تعميم به زبان‌هاي بالاتر را افزايش مي‌دهد. آزمايش‌هاي صورت‌گرفته بر روي 4 سيستم تشخيص زبان مختلف با استفاده از داده‌هاي مربوط به 4 زبان انگليسي، فارسي، فرانسوي و آلماني دادگان OGI، کارايي تکنيک‌هاي ارائه‌شده را نشان مي‌دهد. تفاصيل المقالة