فهرس المقالات محمدحسن ساوجی


  • المقاله

    1 - فشرده‌سازي وفقي سيگنال صحبت باند وسيع و صوت با استفاده از تبديل موجک
    فصلنامه مهندسی برق و مهندسی کامپيوتر ايران , العدد 4 , السنة 2 , پاییز-زمستان 1383
    در اين مقاله طراحي يک کد كننده ديكد كننده جديد در نرخ بيت kb/s 32 براي سيگنال صحبت باند وسيع و صوت بررسي مي‌شود. اين كدر جايگزين خوبي براي کدرهاي باند وسيع قبلي مثل استاندارد G721 با نرخ بيت kb/s 32 و G722 با نرخ بيت kb/s 64 و 2/4 MOS= مي‌باشد. فشرده‌ساز يا کدر ما شامل أکثر
    در اين مقاله طراحي يک کد كننده ديكد كننده جديد در نرخ بيت kb/s 32 براي سيگنال صحبت باند وسيع و صوت بررسي مي‌شود. اين كدر جايگزين خوبي براي کدرهاي باند وسيع قبلي مثل استاندارد G721 با نرخ بيت kb/s 32 و G722 با نرخ بيت kb/s 64 و 2/4 MOS= مي‌باشد. فشرده‌ساز يا کدر ما شامل قسمتهاي کدگذار تبديلي، مدل روان شنيداري، چندي‌کننده و قسمت کدگذار با طول متغير است. در قسمت کدگذار تبديلي از بسته موجکي که داراي باندهاي خروجي نزديک به باندهاي بحراني است استفاده شده است. تفاوت اين قسمت با کارهاي مشابه در استفاده از هسته تبديل موجک توسعه يافته پارامتري جديد و نيز روشي است که شاخه هاي WP را گسترش داده‌ايم تا انطباق بيشتري با باندهاي بحراني شنوايي داشته باشند. فكر استفاده از مدل روان شنيداري را از MPEG1-Audio گرفته‌ايم اما به جاي استفاده از طيف توان براي محاسبه نسبت سيگنال به ماسک S/M مستقيماً از داده‌هاي خروجي بسته موجکي استفاده کرده‌ايم. به اين ترتيب، علاوه بر تطبيق مناسب خروجي‌هاي بسته موجکي با مدل روان شنيداري، از ميزان محاسبات نيز کاسته شده است. در چندي‌کننده با توجه به تعداد بيت‌هاي هر باند بحراني که قبلاً توسط مدل روان شنيداري حساب شده است به چندي کردن خروجي‌هاي بسته موجکي مي‌پردازيم. در قسمت VLC، از روش کدگذاري آنتروپي استفاده کرده‌ايم. براي اين کار از جداول دوباره کد کننده استاندارد JPEG استفاده شده است. اما تغييراتي براي تطبيق هر چه بهتر با شرايط سيگنال صحبت اعمال نموده‌ايم. کدر قابليت استفاده وفقي از هسته موجک پارامتري را داراست. کدر با تغيير نسبت S/M قابليت کم کردن نرخ بيت و کاهش کيفيت در حد کيفيت مورد نياز را دارد. بنابراين، در جاهايي که احتياج به نرخ بيت ثابتي باشد با تغيير S/M در اطراف نقطه کاري نرخ بيت به ميزان خواسته شده مي‌رسد. در نهايت اين كدر با نرخ بيت kb/s 32 کيفيت بسيار خوبي دارد که به راحتي از سيگنال PCM ورودي با نرخ نمونه برداري kHz 16 تعداد بيت 16 در هر نمونه قابل تشخيص نيست. تفاصيل المقالة

  • المقاله

    2 - کدگذاري گفتار با استفاده از پيش‌بيني غير خطي بر پايه بسط سري‌هاي ولترا
    فصلنامه مهندسی برق و مهندسی کامپيوتر ايران , العدد 9 , السنة 5 , بهار 1386
    در سال‌هاي اخير به منظور کاهش بيشتر نرخ بيت و از آنجا پهناي باند توجه روزافزوني به استفاده از مدل‌ها و تکنيک‌هاي غير خطي پيش‌بيني در کدگذاري گفتار شده است. معمولاً شبکه‌هاي عصبي براي اين هدف به کار مي‌روند که منجر به تا dB3 کاهش بيشتر در انرژي سيگنال تحريک مي‌شوند. پيش‌ أکثر
    در سال‌هاي اخير به منظور کاهش بيشتر نرخ بيت و از آنجا پهناي باند توجه روزافزوني به استفاده از مدل‌ها و تکنيک‌هاي غير خطي پيش‌بيني در کدگذاري گفتار شده است. معمولاً شبکه‌هاي عصبي براي اين هدف به کار مي‌روند که منجر به تا dB3 کاهش بيشتر در انرژي سيگنال تحريک مي‌شوند. پيش‌بيني غير خطي همچنين مي‌تواند بر پايه ‌بسط سري‌هاي ولترا انجام گيرد که در آن براي سادگي معمولاً بسط به بخش‌هاي نخست و دوم محدود مي‌شود (پيش‌بيني درجه دو). مطالعات اوليه نشان دادند که در مقايسه با شبکه‌هاي عصبي استفاده از فيلترهاي ولترا منجر به يک کاهش بسيار بيشتر در انرژي سيگنال تحريک مي‌شود (6 تا dB10). با اين وجود به دليل ناپايداري اين کاهش نمي‌تواند منجر به کاهش نرخ بيت يا بهبود نسبت سيگنال به نويز شود. اين ناپايداري در دکدکننده به دليل وجود خطاي محاسباتي (براي نمونه ناشي از چندي‌کردن سيگنال تحريک) و حساسيت بالاي محاسبات به اين خطا ايجاد مي‌شود. در کار اصيلي که در اينجا ارائه مي‌شود ناپايداري در کدک در هر دو نوع پيش‌بيني پيشرو و پسرو به ترتيب با استفاده از الگوريتم‌هاي کمترين مربع‌ها (LS) و کمترين ميانگين مربع‌هاي (LMS) سيگنال خطا بررسي مي‌شود. نشان داده مي‌شود که پايداري در عوض فداکردن بخش عمده‌اي از صرفه‌جويي به دست آمده در انرژي سيگنال تحريک به دست مي‌آيد به گونه‌اي که سطح کاهش نهايي اغلب همانند شبکه‌هاي عصبي مي‌باشد. در پيش‌بيني پيشرو پس از پايدارسازي و با وجود اندکي افزايش در پيچيدگي عملياتي در 20 تا 45٪ قالب‌ها افزودن بخش درجه دو سودمند خواهد بود. بر اين اساس الگوريتمي توسعه مي‌يابد که پيش‌بيني غير خطي تنها بر روي اين قالب‌ها انجام گيرد. اين الگوريتم باعث بهبود تا dB4 در نسبت سيگنال به نويز نهايي مي‌شود. پيش‌بيني غير خطي پسرو متوالي با وجودي که از نقطه نظر پياده‌سازي بسيار مناسب‌تر است در مقايسه با پيش‌بيني خطي کارايي بهتري را نتيجه نمي‌دهد. تفاصيل المقالة