در اين مقاله طراحي يک کد كننده ديكد كننده جديد در نرخ بيت kb/s 32 براي سيگنال صحبت باند وسيع و صوت بررسي ميشود. اين كدر جايگزين خوبي براي کدرهاي باند وسيع قبلي مثل استاندارد G721 با نرخ بيت kb/s 32 و G722 با نرخ بيت kb/s 64 و 2/4 MOS= ميباشد. فشردهساز يا کدر ما شامل More
در اين مقاله طراحي يک کد كننده ديكد كننده جديد در نرخ بيت kb/s 32 براي سيگنال صحبت باند وسيع و صوت بررسي ميشود. اين كدر جايگزين خوبي براي کدرهاي باند وسيع قبلي مثل استاندارد G721 با نرخ بيت kb/s 32 و G722 با نرخ بيت kb/s 64 و 2/4 MOS= ميباشد. فشردهساز يا کدر ما شامل قسمتهاي کدگذار تبديلي، مدل روان شنيداري، چنديکننده و قسمت کدگذار با طول متغير است. در قسمت کدگذار تبديلي از بسته موجکي که داراي باندهاي خروجي نزديک به باندهاي بحراني است استفاده شده است. تفاوت اين قسمت با کارهاي مشابه در استفاده از هسته تبديل موجک توسعه يافته پارامتري جديد و نيز روشي است که شاخه هاي WP را گسترش دادهايم تا انطباق بيشتري با باندهاي بحراني شنوايي داشته باشند. فكر استفاده از مدل روان شنيداري را از MPEG1-Audio گرفتهايم اما به جاي استفاده از طيف توان براي محاسبه نسبت سيگنال به ماسک S/M مستقيماً از دادههاي خروجي بسته موجکي استفاده کردهايم. به اين ترتيب، علاوه بر تطبيق مناسب خروجيهاي بسته موجکي با مدل روان شنيداري، از ميزان محاسبات نيز کاسته شده است. در چنديکننده با توجه به تعداد بيتهاي هر باند بحراني که قبلاً توسط مدل روان شنيداري حساب شده است به چندي کردن خروجيهاي بسته موجکي ميپردازيم. در قسمت VLC، از روش کدگذاري آنتروپي استفاده کردهايم. براي اين کار از جداول دوباره کد کننده استاندارد JPEG استفاده شده است. اما تغييراتي براي تطبيق هر چه بهتر با شرايط سيگنال صحبت اعمال نمودهايم. کدر قابليت استفاده وفقي از هسته موجک پارامتري را داراست. کدر با تغيير نسبت S/M قابليت کم کردن نرخ بيت و کاهش کيفيت در حد کيفيت مورد نياز را دارد. بنابراين، در جاهايي که احتياج به نرخ بيت ثابتي باشد با تغيير S/M در اطراف نقطه کاري نرخ بيت به ميزان خواسته شده ميرسد. در نهايت اين كدر با نرخ بيت kb/s 32 کيفيت بسيار خوبي دارد که به راحتي از سيگنال PCM ورودي با نرخ نمونه برداري kHz 16 تعداد بيت 16 در هر نمونه قابل
تشخيص نيست.
Manuscript profile
Nashriyyah -i Muhandisi -i Barq va Muhandisi -i Kampyutar -i Iran
,
Issue9,Year,
Spring
2007
در سالهاي اخير به منظور کاهش بيشتر نرخ بيت و از آنجا پهناي باند توجه روزافزوني به استفاده از مدلها و تکنيکهاي غير خطي پيشبيني در کدگذاري گفتار شده است. معمولاً شبکههاي عصبي براي اين هدف به کار ميروند که منجر به تا dB3 کاهش بيشتر در انرژي سيگنال تحريک ميشوند. پيش More
در سالهاي اخير به منظور کاهش بيشتر نرخ بيت و از آنجا پهناي باند توجه روزافزوني به استفاده از مدلها و تکنيکهاي غير خطي پيشبيني در کدگذاري گفتار شده است. معمولاً شبکههاي عصبي براي اين هدف به کار ميروند که منجر به تا dB3 کاهش بيشتر در انرژي سيگنال تحريک ميشوند. پيشبيني غير خطي همچنين ميتواند بر پايه بسط سريهاي ولترا انجام گيرد که در آن براي سادگي معمولاً بسط به بخشهاي نخست و دوم محدود ميشود (پيشبيني درجه دو). مطالعات اوليه نشان دادند که در مقايسه با شبکههاي عصبي استفاده از فيلترهاي ولترا منجر به يک کاهش بسيار بيشتر در انرژي سيگنال تحريک ميشود (6 تا dB10). با اين وجود به دليل ناپايداري اين کاهش نميتواند منجر به کاهش نرخ بيت يا بهبود نسبت سيگنال به نويز شود. اين ناپايداري در دکدکننده به دليل وجود خطاي محاسباتي (براي نمونه ناشي از چنديکردن سيگنال تحريک) و حساسيت بالاي محاسبات به اين خطا ايجاد ميشود.
در کار اصيلي که در اينجا ارائه ميشود ناپايداري در کدک در هر دو نوع پيشبيني پيشرو و پسرو به ترتيب با استفاده از الگوريتمهاي کمترين مربعها (LS) و کمترين ميانگين مربعهاي (LMS) سيگنال خطا بررسي ميشود. نشان داده ميشود که پايداري در عوض فداکردن بخش عمدهاي از صرفهجويي به دست آمده در انرژي سيگنال تحريک به دست ميآيد به گونهاي که سطح کاهش نهايي اغلب همانند شبکههاي عصبي ميباشد. در پيشبيني پيشرو پس از پايدارسازي و با وجود اندکي افزايش در پيچيدگي عملياتي در 20 تا 45٪ قالبها افزودن بخش درجه دو سودمند خواهد بود. بر اين اساس الگوريتمي توسعه مييابد که پيشبيني غير خطي تنها بر روي اين قالبها انجام گيرد. اين الگوريتم باعث بهبود تا dB4 در نسبت سيگنال به نويز نهايي ميشود. پيشبيني غير خطي پسرو متوالي با وجودي که از نقطه نظر پيادهسازي بسيار مناسبتر است در مقايسه با پيشبيني خطي کارايي بهتري را نتيجه نميدهد.
Manuscript profile
Rimag
Rimag is an integrated platform to accomplish all scientific journal requirements such as submission, evaluation, reviewing, editing, DOI assignment and publishing in the web.