Adaptive Acoustic Beamforming with Improved Differential Method
Subject Areas : electrical and computer engineeringNegar Sarshar 1 , Mehdi Bekrani 2
1 - Qom University of Technology, Qom, Iran
2 - Qom University of Technology
Keywords: Microphone array, white noise gain, beamforming, directivity factor,
Abstract :
Differential beamformers exhibit effective performance in broadband applications, such as acoustic applications, but they have limited white noise gain. To address this limitation, this paper introduces an adaptive weighting-based algorithm designed to enhance the white noise gain of the differential beamformer by leveraging the minimum variance distortionless response (MVDR) beamforming technique. For this purpose, differential beamforming is implemented in two stages: in the first stage, the spatial difference of observations is obtained, and in the second stage, the beamformer is optimized. Subsequently, by calculating the coefficients and combining the differential and MVDR beamformers, the proposed adaptive beamformer is derived. In this beamformer, to construct the output signal, the contribution of the differential and MVDR methods is dynamically adjusted using an adaptive combination coefficient, which is a function of frequency, microphone inter-distance, target angle, and the number of microphones. The proposed beamformer, considering four microphones spaced 2 cm apart reveals a remarkable enhancement in white noise gain by 35 dB and SNR gain by 18 dB at a frequency of 1 kHz. Additionally, the proposed adaptive algorithm demonstrates a 3.5 dB improvement in directivity factor over its differential counterpart.
[1] T. Tripathy and C. Novak, Acoustic Beamforming: Automotive Applications for Noise, Vibrations and Harshness, University of Windsor, 2017.
[2] J. Benesty, C. Pan, and J. Chen, Fundamentals of Differential Beamforming, Singapore: Springer, Apr. 2016.
[3] U. Michel, "History of acoustic beamforming," in Proc. 1st Berlin Beamforming Conf., 17 pp., Berlin, Germany, 21-22 Nov. 2006.
[4] J. Benesty, J. Chen, and Y. Huang, Microphone Array Signal Processing, Berlin: Springer-Verlag, 2008.
[5] M. Bekrani and M. Lotfizad, "A modified wavelet-domain adaptive filtering algorithm for stereophonic acoustic echo cancellation in the teleconferencing application," in Proc. Int. Symp. on Telecommunications, pp. 548-554, Tehran, Iran, 27-28 Aug. 2008.
[6] M. Bekrani, A. W. H. Khong, and M. Lotfizad, "Neural network based adaptive echo cancellation for stereophonic teleconferencing application," in Proc. IEEE Int. Conf. on Multimedia and Expo, Singapore, Singapore, pp. 1172-1177, 19-23 Jul. 2010.
[7] م. بکرانی، "طراحی و تحلیل یک الگوریتم وفقی LMS/Newton بهبودیافته در کاربرد حذف پژواک آکوستیکی،" نشریه مهندسی برق و مهندسی کامپيوتر ايران، ب- مهندسی کامپیوتر، سال 18، شماره 2، صص. 116-105، تابستان 1399.
[8] M. Bekrani and H. Zayyani, "A weighted soft-max PNLMS algorithm for sparse system identification," International J. of Information and Communication Technology Research, vol. 8, no. 3, pp. 7-14, Summer 2016.
[9] W. Yang, G. Huang, J. Benesty, and J. Chen, "On the design of flexible kronecker product beamformers with linear microphone arrays," in Proc. Int. Conf. on Acoustics, Speech and Signal Processing, ICASSP'19, pp. 441-445, Brighton, UK, 12-17 May 2019.
[10] G. Huang, J. Benesty, I. Cohen, and J. Chen, "A simple theory and new method of differential beamforming with uniform linear microphone arrays," IEEE/ACM Trans. on Audio, Speech, and Language Processing, vol. 28, pp. 1079-1093, 2020.
[11] G. Huang, Y. Wang, J. Benesty, I. Cohen, and J. Chen, "Combined differential beamforming with uniform linear microphone arrays," in Proc. Int. Conf. on Acoustics, Speech and Signal Processing, ICASSP'21, pp. 781-785, Toronto, Canada, 6-11 Jun. 2021.
[12] G. Huang, J. Chen, J. Benesty, I. Cohen, and X. Zhao, "Steerable differential beamformers with planar microphone arrays," EURASIP J. on Audio, Speech, and Music Processing, vol. 2020, Article ID: 15, 18 pp., 2020.
[13] G. Huang, J. Chen, and J. Benesty, "On the design of differential beamformers with arbitrary planar microphone array geometry," J. of the Acoustical Society of America, vol. 144, no. 1, Article ID: EL66, Jul. 2018.
[14] X. Wang, G. Huang, I. Cohen, J. Benesty, and J. Chen, "Robust steerable differential beamformers with null constraints for concentric circular microphone arrays," in Proc. Int. Conf. on Acoustics, Speech and Signal Processing, ICASSP'21, pp. 4465-4469, Toronto, Canada, 6-11 Jun. 2021.
[15] G. Huang, I. Cohen, J. Chen, and J. Benesty, "Continuously steerable differential beamformers with null constraints for circular microphone arrays," J. of the Acoustical Society of America, vol. 148, no. 3, pp. 1248-1258, Sept. 2020.
[16] G. Huang, J. Chen, and J. Benesty, "Insights into frequency-invariant beamforming with concentric circular microphone arrays," IEEE/ACM Trans. on Audio, Speech, and Language Processing, vol. 26, no. 12, pp. 2305-2318, Dec. 2018.
[17] G. Huang, J. Benesty, and J. Chen, "Design of robust concentric circular differential microphone arrays," J. of the Acoustical Society of America, vol. 141, no. 5, pp. 3236-3249, May 2017.
[18] J. Benesty, I. Cohen, and J. Chen, Fundamentals of Signal Enhancement and Array Signal Processing, John Wiley & Sons, Dec. 2017.
[19] G. Huang, J. Benesty, I. Cohen, and J. Chen, "Differential beamforming on graphs," IEEE/ACM Trans. on Audio, Speech, and Language Processing, vol. 28, pp. 901-913, Feb. 2020.
[20] G. Huang, J. Benesty, J. Chen, and I. Cohen, "Robust and steerable kronecker product differential beamforming with rectangular microphone arrays," in Proc. Int. Conf. on Acoustics, Speech and Signal Processing, ICASSP'20, pp. 211-215, Barcelona, Spain, 4-8 May 2020.
[21] M. Bekrani, A. H. T. Nguyen, and A. W. H. Khong, "An adaptive non-linear process for under-determined virtual microphone beamforming," in Proc. Int. Conf. on Acoustics, Speech and Signal Processing, ICASSP'21, pp. 4495-4499, Toronto, Canada, 6-11 Jun. 2021.
[22] G. Itzhak and I. Cohen, "Differential and constant-beamwidth beamforming with uniform rectangular arrays," in Proc. Int. Workshop on Acoustic Signal Enhancement, WAENC'22, 5 pp., Bamberg, Germany, 5-8 Sept. 2022.
[23] X. Wang, I. Cohen, J. Benesty, and J. Chen, "Study of the null directions on the performance of differential beamformers," in Proc. Int. Conf. on Acoustics, Speech and Signal Processing, ICASSP'22, pp. 4928-4932, Singapore, Singapore, 23-27 May 2022.
[24] G. Itzhak, I. Cohen, and J. Benesty, "Multistage approach for steerable differential beamforming with rectangular arrays," Speech Communication, vol. 142, pp. 61-76, Jul. 2022.
[25] A. A. Nugraha, K. Sekiguchi, M. Fontaine, Y. Bando, and K. Yoshii, "DNN-free low-latency adaptive speech enhancement based on frame-online beamforming powered by block-online FastMNMF," in Proc. Int. Workshop on Acoustic Signal Enhancement, IWAENC'22, 5 pp., Bamberg, Germany, 5-8 Sept. 2022.
[26] H. Kim, K. Kang, and J. W. Shin, "Factorized MVDR deep beamforming for multi-channel speech enhancement," IEEE Signal Processing Letters, vol. 29, pp. 1898-1902, 2022.
[27] X. Xiao, et al., "Deep beamforming networks for multi-channel speech recognition," in Proc. Int. Conf. on Acoustics, Speech and Signal Processing, ICASSP'16, pp. 5745-5749, Shanghai, China, 20-25 Mar. 2016.
[28] I. McCowan, Microphone Arrays: A Tutorial, Queensland University, Australia, pp. 1-38, Apr. 2001.
[29] E. A. P. Habets, J. Benesty, I. Cohen, S. Gannot, and J. Dmochowski, "New insights into the MVDR beamformer in room acoustics," IEEE Trans. on Audio, Speech, and Language Processing, vol. 18, no. 1, pp. 158-170, Jun. 2009.
[30] T. Dietzen, S. Doclo, M. Moonen, and T. V. Waterschoot, "Integrated sidelobe cancellation and linear prediction Kalman filter for joint multi-microphone speech dereverberation, interfering speech cancellation, and noise reduction," IEEE/ACM Trans. on Audion, Speech, and Language Processing, vol. 28, pp. 740-754, 2020.
54 نشریه مهندسی برق و مهندسی کامپیوتر ایران، ب- مهندسی کامپیوتر، سال 22، شماره 1، بهار 1403
مقاله پژوهشی
شکلدهی وفقی پرتو آکوستیکی با روش بهبودیافته تفاضلی
نگار سرشار و مهدی بکرانی
چکیده: شکلدهندههای پرتو تفاضلی عملکرد مؤثری در کاربردهای پهنباند نظیر کاربردهای آکوستیکی دارند؛ اما دارای بهره نویز سفید محدودی هستند. در این مقاله بهمنظور بهبود بهره نویز سفید شکلدهنده پرتو تفاضلی، یک الگوریتم شکلدهنده تفاضلی بر مبنای وزندهی وفقی ارائه شده که از روش شکلدهی پرتو پاسخ کمینه واریانس بدون اعوجاج (MVDR) بهره میگیرد. به این منظور، ابتدا شکلدهی پرتو تفاضلی در دو مرحله اجرا شده که در مرحله اول، تفاضل مکانی مشاهدهها بهدست آمده و در مرحله دوم شکلدهنده پرتو بهینه گردید. سپس با محاسبه ضرایب و تلفیق شکلدهندههای پرتو تفاضلی و MVDR، شکلدهنده پرتو وفقی پیشنهادی بهدست آمد. در شکلدهنده پیشنهادی، سهم روش تفاضلی و روش MVDR در ایجاد سیگنال خروجی توسط ضریب تلفیق وفقی که تابع فرکانس، فاصله بین میکروفنها، زاویه هدف و تعداد میکروفنها است، تعیین میگردد. شکلدهنده پرتو پیشنهادی با درنظرگرفتن چهار میکروفن و فاصله دو سانتیمتری بین میکروفنها منجر به بهبود بهره نویز سفید به مقدار
35 دسیبل و بهره SNR به مقدار 18 دسیبل نسبت به شکلدهنده پرتو تفاضلی در فرکانس 1 کیلوهرتز میشود. همچنین فاکتور جهتدهی در الگوریتم وفقی پیشنهادی به میزان 5/3 دسیبل نسبت به شکلدهنده پرتو تفاضلی بهبود پیدا کرده است.
کلیدواژه: آرایه میکروفن، بهره نویز سفید، شکلدهی پرتو، فاکتور جهتدهی.
1- مقدمه
شکلدهی پرتو آکوستیکی به مفهوم دریافت سیگنال صوتی مطلوب از یک زاویه یا مکان خاص و تضعیف سیگنالهای تداخلی با استفاده از فیلترهای مکانی و آرایه حسگرهای صوتی است [1]. روشهای شکلدهی پرتو آکوستیکی برای مکانیابی، ردیابی و شناسایی منابع صوتی متحرک ضروری است [2] و [3]. این روشها همچنین بهطور گسترده در ارتباطهای صوتی و سیستمهای رابط گفتاری انسان- ماشین استفاده میشوند تا سیگنال مطلوب را از مشاهدههای پرنویز بازیابی کنند [4].
امروزه، شکلدهی پرتو آکوستیکی کاربردهای گستردهای در ارتباطات صوتی دارد [2] که از آن جمله میتوان به تشخیص گفتار، واقعیت مجازی، رباتیک، بازیهای رایانهای، ارتباط گفتاری دستآزاد2، ضبط صدا با کیفیت بالا، نظارت صوتی، کنفرانس از راه دور [5] و [6]، حذف پژواک آکوستیکی [7] و [8]، تجزیه و تحلیل صحنههای صوتی، تلویزیون هوشمند، خانه هوشمند و سمعک اشاره کرد [2].
روشهای شکلدهی پرتو متعددی با استفاده از آرایههای میکروفنی خطی [9] تا [11]، مسطح [12] و [13] و دایروی [14] تا [17] ارائه شده است. شکلدهی پرتو تفاضلی3 زیرشاخهای از شکلدهی پرتو است که به دلیل ویژگیهای آن در آکوستیک اهمیت یافته است. اولین ویژگی این است که الگوهای پرتو تقریباً مستقل از فرکانس هستند که در کاربردهای مرتبط با سیگنالهای پهنباند نظیر گفتار بسیار مهم است. ویژگی دوم این است که روشهای تفاضلی بیشترین بهره را در حضور نویز فراهم میکنند. این دو ویژگی باعث میشود که شکلدهی پرتو تفاضلی در بسیاری از کاربردهای آکوستیکی مفید باشد. با این حال، ضعف اصلی این روش تقویت نویز سفید، بهخصوص در فرکانسهای پایین است [18].
در سالهای اخیر، روشهای متعددی برای طراحی با شکلدهنده تفاضلی و هندسههای مختلف آرایه میکروفنی ارائه شده است. در [14]، یک شکلدهنده تفاضلی برای آرایه میکروفنی دایروی بهصورت دوایر هممرکز ارائه شده است. در این روش با بهکارگیری تابع بسل در تابع انتقال فیلتر، صفرهای الگوی پرتو معین میشوند و همچنین یک رویکرد مقاوم ارائه شده که حلقههای مختلف میکروفن را با شعاعهای مناسب ترکیب میکند؛ بهصورتی که مشکل بهره نویز سفید کاهش پیدا کرد. در [12] از بسط ژاکوبی- انگر4 استفاده شده تا شکلدهنده تفاضلی برای هر نوع آرایه میکروفنی با هر شکل هندسی مسطحی قابل پیادهسازی باشد و سپس در [15] برای آرایه با شکل هندسی دایروی هممرکز، بسط مذکور برای هر حلقه از آرایه میکروفن دایرهای هممرکز اعمال میگردد. مرتبه بسط در هر حلقه به تعداد میکروفنهای آن حلقه مرتبط است که در حلقههای مختلف ممکن است متفاوت باشد. این روش، فاکتور جهتدهی و بهره نویز سفید را تا حدودی بهبود میبخشد. در [9]، فیلتر شکلدهی پرتو کلی با بهینهسازی دو شکلدهنده پرتو فرعی بهصورت آبشاری5 طراحی شده که باعث کنترل عملکرد و مصالحه بین معیارهای مختلف شکلدهی پرتو میشود. در [10] شکلدهی پرتو تفاضلی شامل دو مرحله تفاضلی و فیلتر است که باعث عملکرد بهتر شکلدهی پرتو میشود. شکلدهنده پرتو تفاضلی با تقریب الگوهای پرتو در [13] طراحی شدند که الگوهای پرتو میتوانند به چند جهت مختلف هدایت شوند و همچنین مشکل بهره نویز سفید که در فرکانسهای پایین وجود دارد، با افزایش تعداد میکروفنها کاهش مییابد. روش طراحی شکلدهنده پرتو تفاضلی در [16] فقط نیاز به اطلاعات صفرها از الگوی پرتو دارد و یک ویژگی مهم این روش طراحی این است که ميتوان به کمک آن، شکلدهندههای پرتو تفاضلی با هر الگوی پرتو متفاوتی را طراحی کرد. توسعه پردازش سیگنال برای پردازش دادهها در حوزه گراف در [19] بررسی شده که میکروفنها با گرهها و تعداد میکروفنها با مرتبه گراف
شکل 1: آرایه میکروفن خطی یکنواخت [2].
مطابقت دارد و باعث بهبود فاکتور جهتدهی میشود.
آرايه میکروفنی در مرجع [20] به دو زیرآرایه مستطیلی مجازی تجزیه شده است؛ بهطوری که بردار فرمان آرایه مستطیلی کلی، حاصلضرب کرونکر از بردارهای فرمان دو زیرآرایه مستطیلی مجازی کوچکتر تعریف میشود. این روش برای طراحی شکلدهنده مقاوم پرتو تفاضلی مفید و کاربردی است. در [21] بهمنظور بهبود عملكرد شكلدهنده پرتو، از ترکیب میکروفنهای واقعی و مجازی و استفاده از تابع غیرخطی برای پردازش سیگنالهای مجازی استفاده شده است. در [11] با استفاده از آرایههای میکروفن با اندازه کوچک، دو شکلدهنده پرتو فرعی بهصورت جداگانه بهینهسازی میشوند که باعث مصالحه بهره نویز سفید و فاکتور جهتدهی شده است. در [17] از آرایههای میکروفن دایرهای هممرکز استفاده میشود. با جایگزینی بسط ژاکوبی- انگر و برابرساختن الگوی پرتو طراحیشده با الگوی پرتو هدف، یک معادله خطی ساخته شده و با حل این معادله، فیلتر شکلدهنده پرتو بهدست میآید. الگوی پرتو طراحیشده میتواند به هر جهت در صفحهای که میکروفنها در آن قرار دارند، هدایت شود. با این حال روش مبتنی بر بسط نیاز به دانستن الگوی پرتو هدف دارد که اغلب در دسترس نیست. در [22] یک شکلدهنده پرتو با پهنای ثابت در امتداد محور عمودی و یک شکلدهنده پرتو فوق هدایتکننده در امتداد محور افقی در نظر گرفته میشود، بهطوری که از يك پارامتر قابل تنظيم، یک مصالحه بین بهره نویز سفید و فاکتور جهتدهی با یک پارامتر قابل تنظیم ایجاد میشود.
در [23]، شکلدهندههای پرتو تفاضلی بهعنوان تابعی از جهتهای صفر پیشنهاد شده است. عملکرد یک شکلدهنده پرتو تفاضلی در صورت وجود صفر نزدیک جهت مطلوب بهطور قابل توجهی تخریب میشود که با افزایش مرتبه شکلدهنده پرتو تفاضلی میتوان به بهبود عملکرد کمک کرد. در [24] یک عملگر مکانی میانگین چندمرحلهای دوبعدی ارائه شده که مستقلاً بر روی ستونها و ردیفهای سیگنالهای مشاهدهشده یک آرایه میکروفن مستطیلی یکنواخت عمل میکند. رویکرد چندمرحلهای، انعطافپذیری بالایی را امکانپذیر میکند و همچنین بهره نویز سفید شکلدهنده پرتو را بهبود میبخشد.
در سالهای اخیر روشهایی برای شکلدهی پرتو آکوستیکی بر پایه یادگیری عمیق ارائه شده است [25] تا [27]. برای نمونه در [25] از شبکه عصبی عمیق 6(DNN) برای تخمین ماسکهای لازم برای محاسبه ماتریس کوواریانس منابع مطلوب و نویز استفاده شده است. مرجع [26] از DNN برای تخمین ماتریسهای کوواریانس نویز و گفتار برای استفاده در شکلدهنده پرتو 7MVDR استفاده کرده است. ترکیب شکلدهی پرتو با شبکه عصبی موجب بهینهسازی دادههای چندکاناله میشود [27].
در این مقاله، یک روش بهبودیافته شکلدهی پرتو آکوستیکی تفاضلی برای آرایه میکروفنی خطی یکنواخت ارائه میشود. در این روش با استفاده از ترکیب شکلدهندههای پرتو MVDR و تفاضلی به یک شکلدهنده وفقی پرتو تفاضلی دست یافتیم که علاوه بر بهبود بهره نویز سفید و نسبت سیگنال به نویز 8(SNR) خروجی، فاکتور جهتدهی نیز بهبود یافته است. در شکلدهنده پیشنهادی، سهم روش شکلدهی تفاضلی پرتو و روش MVDR در ایجاد سیگنال خروجی، توسط ضریب تلفیق وفقی که تابع فرکانس، فاصله بین میکروفنها، زاویه هدف و تعداد میکروفنها است، تعیین میگردد. با بهبود بهره نویز سفید، الگوریتم پیشنهادی در برابر اثرات غیرایدهآل مثل نویز میکروفنها، اثرات غیرخطی و اشباع میکروفنها و فاصله آنها از هم مقاومتر میشود و همچنین با بهبود فاکتور جهتدهی، تمرکز آرایه روی زاویه مطلوب بهتر میشود و اثرات تداخلی را کاهش میدهد.
2- شکلدهی پرتو آکوستیکی
2-1 شکلدهی پرتو با آرایه میکروفن خطی یکنواخت
فرض میکنیم یک سیگنال منبع باند باریک در میدان دور از زاویه سمت9 در یک محیط آکوستیک با سرعت صوت منتشر میشود و به یک آرایه خطی یکنواخت شامل میکروفن مطابق شکل 1 برخورد میکند. در این حالت بردار فرمان متناظر برابر است با
(1)
که قسمت موهومی، فرکانس، تأخیر بین دو میکروفن متوالی در با فاصله بین میکروفنها و سرعت صوت است [2]. سیگنال میکروفن بهصورت (2) تعریف میشود
(2)
که سیگنال میکروفن ام با و بردار سیگنال نویز جمعشونده میباشد. همچنین سیگنال منبع مطلوب دریافتی توسط میکروفنها بهصورت است. خروجی شکلدهنده پرتو بهصورت (3) بیان میشود
(3)
که در آن علامت نماد مزدوج مختلط، وزن شکلدهنده پرتو و بردار ضرایب شکلدهنده پرتو بهصورت (4) است
(4)
2-2 معیارهای ارزیابی شکلدهندههای پرتو
معیارهای متعددی جهت ارزیابی عملکرد شکلدهنده پرتو تعریف شده است. برای ارزیابی میزان کاهش نویز منابع ناخواسته از مقایسه میزان SNR ورودی به آرایه میکروفن و SNR خروجی شکلدهنده پرتو استفاده میشود. میزان SNR ورودی، نسبت توان سیگنال مطلوب به توان نویز ناخواسته تعریف شده که از (5) حاصل میشود [18]
(5)
که در آن و بهترتیب واریانس و واریانس (اولین عنصر ) بوده و امید ریاضی را نشان میدهد. همچنین SNR خروجی بهصورت (6) تعریف میشود [18]
(6)
هر شکلدهنده پرتو آکوستیکی حساسیتهای متفاوتی نسبت به امواج صوتی که از جهتهای مختلف میرسد، دارد. الگوی پرتو، حساسیت شکلدهنده پرتو را به یک موج تخت (سیگنال منبع) که از جهت به آرایه برخورد میکند، توصیف مینماید. در این صورت داریم [18]
(7)
در شکلدهندههای پرتو تفاضلی برای اطمینان از اینکه شکلدهی بهصورت تفاضلی انجام میشود، فرض میگردد سیگنال منبع مطلوب از زاویه (یعنی در راستای جهت آرایه) منتشر میشود و بهدلیل تقارن بردار فرمان، تنها جهتهایی که میتوان هر نوع الگوی پرتو را طراحی کرد در راستای زاویههای صفر و هستند؛ در جهتهای دیگر، طراحی الگوهای پرتو بسیار محدود است [2]. بنابراین داریم
(8)
بهره نویز سفید 10(WNG)، معیاری با هدف ارزیابی توانایی آرایه برای کاهش یا حذف نویز ناهمبسته است که در شکلدهنده پرتو تفاضلی بهصورت (9) تعریف میشود [7]
(9)
همچنین فاکتور جهتدهی 11(DF)، میزان جهتدهی زاویهای شکلدهنده پرتو را تعیین میکند که بهصورت (10) تعریف میشود
(10)
که در آن
(11)
و است [14].
با توجه به (9) و (10)، تفاوت در معیارهای DF و WNG به ماتریس برمیگردد و بنابراین حداکثرسازی یک معیار نمیتواند منتهی به بهبود معیار دیگر شود؛ بلکه لازم است مصالحهای بین این دو معیار در طراحی شکلدهنده پرتو در نظر گرفته شود [11].
2-3 روش شکلدهی پرتو تأخیر و جمع
در شکلدهی پرتو تأخیر و جمع12، سیگنالهای دریافتی صرفاً با اعمال تأخیر نسبت به یکدیگر جمع میشوند که میزان این تأخیرها بستگی به ساختار فیزیکی آرایههای میکروفن دارد. بردار وزن شکلدهنده پرتو تأخیر و جمع در (12) تعریف میشود
(12)
پیادهسازی سختافزاری شکلدهندههای پرتو تأخیر و جمع آسان است و نیازی به پردازنده قوی ندارند. با این حال توانايي آنها براي مهار نويز در فركانسهاي پايين از هر زاویه ورودی، پایین است [28].
2-4 روش شکلدهی پرتو MVDR
شکلدهنده پرتو MVDR بردار وزن را بهصورتی محاسبه میکند که توان خروجی شکلدهنده پرتو را تحت یک قید خطی در پاسخ آرایه نسبت به سیگنال مطلوب به حداقل برساند [1] و [29]. قید خطی مزبور برای بهحداکثررساندن حساسیت شکلدهنده پرتو در جهت دریافت سیگنال منبع مطلوب است. بردار وزن شکلدهنده پرتو MVDR در (13) تعریف میشود که فقط به آمار نویز بستگی دارد [18]
(13)
که ماتریس چگالی طیف توان 13(PSD) نویز است و بهصورت زیر تعریف میشود
(14)
3- روشهای شکلدهی پرتو تفاضلی
شکلدهی پرتو تفاضلی از تفاضل خروجیهای آرایه میکروفن استفاده میکند و شاخهای از روشهای شکلدهی پرتو ثابت (غیروفقی) محسوب میشود. بر این اساس، آرایههای میکروفنی تفاضلی از نظر فیزیکی به آن دسته از آرایههای میکروفن گفته میشود که به مشتقهای مکانی یک میدان فشار صوتی مقیاسپذیر پاسخ میدهند. در عمل فاصله میکروفن، ، بسیار کوچکتر از طول موج صوت است. طول موج صوت را میتوان با رابطه محاسبه کرد که در آن فرکانس صوت و سرعت آن است. با این فرض میتوان تفاضلهای فشار آکوستیک واقعی را با تفاضلهای محدود خروجی میکروفنها تقریب زد [2].
شکلدهنده پرتو تفاضلی در سادهترین حالت بهصورت دوگوشی (دومیکروفنی) پیادهسازی میشود. شکلدهنده پرتو تفاضلی دومیکروفنی برای طراحی الگوهای پرتو، دو شرط دارد که باید برآورده شوند: پاسخ بدون اعوجاج (بهره یک در ) و یک صفر در فاصله [2]
(15)
(16)
که (صفر در زاویه ) در داده میشود. پس بردار وزن شکلدهنده پرتو تفاضلی دومیکروفنی طبق (17) تعریف میشود
(17)
شکلدهنده پرتو تفاضلی فوق را میتوان به حالتهای چندمیکروفنی تعمیم داد. در این حالت بردار وزن شکلدهنده پرتو تفاضلی در (18) تعریف میشود [10]
(18)
که در رابطه بالا عملگر تفاضل مکانی پیشرو14 میباشد که با تعریف بهعنوان مرتبه آرایه میکروفن با ، عملگر با ابعاد بهصورت (19) تعریف میشود
(19)
و برداری به طول بهصورت رابطه زیر است [10]
(20)
در [11] چند روش شکلدهنده پرتو تفاضلی که بین فاکتور جهتدهی و بهره نویز سفید مصالحه برقرار میکند، ارائه شده که در این روشها آرایه میکروفنی به دو زیرآرایه تجزیه میشود. برای استخراج شکلدهندههای پرتو بهینه میتوان از حداکثرسازی معیار WNG و یا DF استفاده کرد. با بهحداکثررساندن WNG، شکلدهنده پرتو تفاضلی بهدست میآید [11]
(21)
که و ثابتی است که برای مصالحه بین فاکتور جهتدهی و بهره نویز سفید در نظر گرفته شده و با حداکثرکردن DF، شکلدهنده پرتو تفاضلی بهدست میآید [11]
(22)
شکلدهنده پرتو در حالت غیرتفاضلی برای بهرهمندی از حداکثر بهره نویز سفید از شکلدهنده پرتو تأخیر و جمع استفاده میکند که با نشان داده میشود [11]
(23)
در شکلدهنده پرتو همچنین میتوان DF را حداکثر کرد که شکلدهنده پرتو MDF بهدست میآید [11]
(24)
و در نهایت چهار نوع ترکیب شکلدهنده پرتو تفاضلی به فرمهای زیر بهدست میآید
(25)
(26)
(27)
(28)
جهت بهرهمندی از حداکثر بهره نویز سفید از ترکیب (26) استفاده میشود. برای بهحداکثررساندن فاکتور جهتدهی از ترکیب (27) و نیز برای مصالحه بین فاکتور جهتدهی و بهره نویز سفید از ترکیبهای (25) و (28) استفاده میشود [11].
4- روش شکلدهی پرتو پیشنهادی
از جمله نقاط ضعف شکلدهنده پرتو تفاضلی میتوان به تقویت نویز سفید، تخریب الگوهای پرتو در فرکانسهای بالا در صورتی که فاصله بین میکروفنها زیاد باشد و کاهش فاکتور جهتدهی در فرکانسهای بالا اشاره کرد. چنانچه گفته شد، روش تأخیر و جمع توانایی کمی برای مهار نویزهای جهتی در فرکانسهای پایین دارد؛ ولی بهره نویز سفید خوبی دارد. بهره نویز سفید در روش MVDR در فرکانسهای پایین کمتر است؛ ولی فاکتور جهتدهی خوبی دارد. با توجه به مزایای روش تفاضلی به دیگر روشها، روش شکلدهی وفقی تفاضلی بهبودیافتهای با تلفیق روش MVDR ارائه میکنیم که علاوه بر بهرهمندی از مزایای آنها بهبود بهره نویز سفید و فاکتور جهتدهی را نیز در بر داشته باشد.
بردار وزن شکلدهنده پرتو وفقی پیشنهادی با تلفیق شکلدهنده پرتو MVDR و شکلدهنده پرتو تفاضلی در (29) تعریف میشود
(29)
در اینجا نحوه محاسبه ضرایب تلفیق وفقی شکلدهنده پرتو MVDR و شکلدهنده پرتو تفاضلی بیان میشود. خروجی شکلدهنده پرتو تلفیقشده بهصورت (30) محاسبه میگردد
(30)
با درنظرگرفتن قید بدون اعوجاج داریم
(31)
برای بهدستآوردن ضریب وفقی تلفیق ، نحوه وزندهی دو شکلدهنده پرتو بهصورت (32) و (33) خواهد بود
(32)
(33)
با جاگذاری (18) در (33) ضریب تلفیق طبق (34) بهدست میآید
(34)
با توجه به (34)، ضریب تلفیق بهدستآمده تابع شرایط سیستم بوده و
با تغییر فرکانس، فاصله بین میکروفنهای آرایه، زاویه هدف و تعداد میکروفنها میتواند با شرایط جدید سیستم وفق یابد.
لازم به ذکر است که در این مقاله، آرایه میکروفن را بهصورت خطی و با فواصل یکنواخت در نظر گرفتیم؛ اما در صورتی که هندسه آرایه میکروفنی تغییر کند، با انجام محاسبات جدید برای بردار فرمان، روشهای تفاضلی و MVDR میتوان روش تلفیقی پیشنهادشده را برای آرایههای میکروفنی غیرخطی و غیریکنواخت نیز تعمیم داد. در جدول 1 شبهکد روش پیشنهادی بیان شده است.
شکل 2: نمودار WNG شکلدهنده پرتو در حالت دو میکروفن.
شکل 3: نمودار DF شکلدهنده پرتو در حالت دو میکروفن.
شکل 4: نمودار WNG شکلدهنده پرتو در حالت چهار میکروفن.
5- نتایج شبیهسازی
در جدول 2 پارامترهای شبیهسازی آمدهاند. جهت ارزیابی روشها از معیارهای بهره نویز سفید، فاکتور جهتدهی و نسبت سیگنال به نویز استفاده میشود.
همچنین در شبیهسازیها نویز سفید اعمال خواهد شد. چگالی طیف توان نویز با توجه به (14) با استفاده از تخمین زمانی ماتریس کوواریانس سیگنال نویز محاسبه میشود. نمودارهای بهره نویز سفید و فاکتور جهتدهی این شکلدهنده پرتو پیشنهادی در حالت دو میکروفنی و چهار میکروفنی بهصورت شکلهای 2 تا 5 بهدست آمد.
شکل 5: نمودار DF شکلدهنده پرتو در حالت چهار میکروفن.
جدول 1: شبهکد روش پیشنهادی.
محاسبات | مرحله |
مقادیر اولیه پیشفرض: | 1 |
بردار فرمان و چگالی طیف توان نویز
| 2 |
تابع شکلدهی پرتو MVDR
| 3 |
محاسبه از (19) و (20) و
| 4 |
تابع شکلدهی تفاضلی
| 5 |
ضریب تلفیق پیشنهادی
| 6 |
تابع شکلدهنده پرتو
| 7 |
خروجی شکلدهنده پرتو
| 8 |
جدول 2: پارامترهای شبیهسازی.
پارامترها | توضیحات | مقادیر |
| فرکانس | 20 تا 4000 هرتز |
| سرعت صوت | m/s 340 |
| فاصله بین میکروفنها | cm 2 |
| تعداد میکروفنها | 2 و 4 |
| زاویه هدف | 0 درجه |
در شکلهای مذکور، شکلدهنده پرتو غیرتفاضلی با حداکثر WNG، شکلدهنده پرتو غیرتفاضلی با حداکثر DF، روش تفاضلی، روش MVDR و تا چهار نوع شکلدهنده ترکیبی اشارهشده در (25) تا (28) است. لازم به ذکر است که روشهای ترکیبی نیاز به حداقل 4 میکروفن دارند و بنابراین در نمودارهای حالت دومیکروفنی شکل 2 و 3 جهت مقایسه وارد نشدهاند.
شکل 6: نمودار SNR خروجی برحسب SNR ورودی شکلدهندههای پرتو در فرکانس 1 کیلوهرتز.
شکل 7: سیگنال صوتی منبع مطلوب.
شکل 8: شکل موج ورودی نویزدار شکلدهنده پرتو پیشنهادی در یک میکروفن.
در شکل 2، روش پیشنهادی نسبت به روشهای تفاضلی، MVDR و شکلدهنده با حداکثر DF، بهره نویز سفید بالاتری دارد. از طرفی در مقایسه با روش غیرتفاضلی که WNG را به حداکثر میرساند و در تمام فرکانسها عملکرد یکسانی برای WNG دارد، شکلدهنده پرتو پیشنهادی متناسب با ضریب تلفیق محاسبهشده، موجب مصالحه بین WNG و DF میشود و بنابراین نسبت به ، بهره نویز سفید کمتری دارد. مطابق شکلها مشاهده میشود بهره نویز سفید و فاکتور جهتدهی روش پیشنهادی نسبت به روشهای تفاضلی و روش MVDR بهبود یافته است.
شکل 9: نمودار خروجی شکلدهنده پرتو پیشنهادی.
شکل 10: نمودار برحسب فرکانس بهازای مقادیر مختلف .
شکل 6، میزان SNR خروجی را در روشهای مورد بررسی در حالت چهارمیکروفنه بهازای SNR ورودی در بازه 20- تا 30 دسیبل نشان میدهد. همان طور که مشاهده میشود، SNR خروجی شکلدهنده پرتو پیشنهادی نسبت به سایر روشها بالاتر است و بهطور میانگین، حدود
5 دسیبل نسبت به روش ترکیبی بهبود بیشتری نشان میدهد. لازم به ذکر است که بهبودهای حاصل در میزان SNR خروجی، بهره نویز سفید و فاکتور جهتدهی در شکلدهنده پرتو پیشنهادی نسبت به سایر شکلدهندههای پرتو منجر به افزایش پیچیدگی محاسباتی الگوریتم پیشنهادی شده است. افزايش پيچيدگي محاسباتي، ناشي از تلفيق الگوريتم شکلدهنده تفاضلی و MVDR و همچنین مربوط به محاسبه ضرايب تلفيق میباشد.
در ادامه از سیگنالهای صوتی استفاده میکنیم. در شبیهسازیها فرکانس نمونهبرداری برابر در نظر گرفته شد. تبدیل STFT از پنجرههای Hann با تعداد نمونه و با 50 درصد همپوشانی بین پنجره ها در نظر گرفته شد. از فایلهای ضبطشده آزمایشگاه بخش مهندسی برق (ESAT) در KU Leuven استفاده شده است [30]. در شکلدهنده پرتو پیشنهادی مقدار SNR ورودی، 15 دسیبل در نظر گرفته میشود. نمودارهای سیگنال اولیه، شکل موج ورودی نویزدار و خروجی شکلدهنده پرتو پیشنهادی بهصورت شکلهای 7 تا 9 خواهد شد. با توجه به شکل 9 میتوان دریافت که میزان نویز سیگنال منبع بهخوبی کاهش یافته است. در نمونه مورد بررسی، میزان SNR سیگنال خروجی شکلدهنده پرتو پیشنهادی به 31 دسیبل رسیده است.
در شکل 10، نمودار تغییرات ضریب تلفیق برحسب فرکانس بهازای فواصل مختلف بین میکروفنها رسم شده است. با توجه به شکل مشاهده میشود با افزایش فرکانس و همچنین با افزایش فاصله بین میکروفنها، ضریب تلفیق افزایش مییابد.
6- نتیجهگیری
در این مقاله، روشهای شکلدهی پرتو تأخیر و جمع، MVDR و تفاضلی بررسی شد. دو معیار مهم در شکلدهی پرتو، بهره نویز سفید و فاکتور جهتدهی هستند که برای شکلدهندههای پرتو تأخیر و جمع، MVDR و تفاضلی بررسی گردید. همچنین روش بهبودیافته شکلدهی پرتو تفاضلی ارائه شد که علاوه بر مزایای روش تفاضلی از مزایای روش MVDR برخوردار باشد. نتایج شبیهسازیها نشان داد که شکلدهنده پرتو پیشنهادشده دارای بهره نویز سفید، SNR خروجی و فاکتور جهتدهی بهتر نسبت به شکلدهندههای پرتو تفاضلی و MVDR میباشد.
مراجع
[1] T. Tripathy and C. Novak, Acoustic Beamforming: Automotive Applications for Noise, Vibrations and Harshness, University of Windsor, 2017.
[2] J. Benesty, C. Pan, and J. Chen, Fundamentals of Differential Beamforming, Singapore: Springer, Apr. 2016.
[3] U. Michel, "History of acoustic beamforming," in Proc. 1st Berlin Beamforming Conf., 17 pp., Berlin, Germany, 21-22 Nov. 2006.
[4] J. Benesty, J. Chen, and Y. Huang, Microphone Array Signal Processing, Berlin: Springer-Verlag, 2008.
[5] M. Bekrani and M. Lotfizad, "A modified wavelet-domain adaptive filtering algorithm for stereophonic acoustic echo cancellation
in the teleconferencing application," in Proc. Int. Symp. on Telecommunications, pp. 548-554, Tehran, Iran, 27-28 Aug. 2008.
[6] M. Bekrani, A. W. H. Khong, and M. Lotfizad, "Neural network based adaptive echo cancellation for stereophonic teleconferencing application," in Proc. IEEE Int. Conf. on Multimedia and Expo, Singapore, Singapore, pp. 1172-1177, 19-23 Jul. 2010.
[7] م. بکرانی، "طراحی و تحلیل یک الگوریتم وفقی LMS/Newton بهبودیافته در کاربرد حذف پژواک آکوستیکی،" نشریه مهندسی برق و مهندسی کامپيوتر ايران، ب- مهندسی کامپیوتر، سال 18، شماره 2، صص. 116-105، تابستان 1399.
[8] M. Bekrani and H. Zayyani, "A weighted soft-max PNLMS algorithm for sparse system identification," International J. of Information and Communication Technology Research, vol. 8, no. 3, pp. 7-14, Summer 2016.
[9] W. Yang, G. Huang, J. Benesty, and J. Chen, "On the design of flexible kronecker product beamformers with linear microphone arrays," in Proc. Int. Conf. on Acoustics, Speech and Signal Processing, ICASSP'19, pp. 441-445, Brighton, UK, 12-17 May 2019.
[10] G. Huang, J. Benesty, I. Cohen, and J. Chen, "A simple theory and new method of differential beamforming with uniform linear microphone arrays," IEEE/ACM Trans. on Audio, Speech, and Language Processing, vol. 28, pp. 1079-1093, 2020.
[11] G. Huang, Y. Wang, J. Benesty, I. Cohen, and J. Chen, "Combined differential beamforming with uniform linear microphone arrays," in Proc. Int. Conf. on Acoustics, Speech and Signal Processing, ICASSP'21, pp. 781-785, Toronto, Canada, 6-11 Jun. 2021.
[12] G. Huang, J. Chen, J. Benesty, I. Cohen, and X. Zhao, "Steerable differential beamformers with planar microphone arrays," EURASIP J. on Audio, Speech, and Music Processing, vol. 2020, Article ID: 15, 18 pp., 2020.
[13] G. Huang, J. Chen, and J. Benesty, "On the design of differential beamformers with arbitrary planar microphone array geometry," J. of the Acoustical Society of America, vol. 144, no. 1, Article ID: EL66, Jul. 2018.
[14] X. Wang, G. Huang, I. Cohen, J. Benesty, and J. Chen, "Robust steerable differential beamformers with null constraints for concentric circular microphone arrays," in Proc. Int. Conf. on Acoustics, Speech and Signal Processing, ICASSP'21, pp. 4465-4469, Toronto, Canada, 6-11 Jun. 2021.
[15] G. Huang, I. Cohen, J. Chen, and J. Benesty, "Continuously steerable differential beamformers with null constraints for circular microphone arrays," J. of the Acoustical Society of America, vol. 148, no. 3, pp. 1248-1258, Sept. 2020.
[16] G. Huang, J. Chen, and J. Benesty, "Insights into frequency-invariant beamforming with concentric circular microphone arrays," IEEE/ACM Trans. on Audio, Speech, and Language Processing,
vol. 26, no. 12, pp. 2305-2318, Dec. 2018.
[17] G. Huang, J. Benesty, and J. Chen, "Design of robust concentric circular differential microphone arrays," J. of the Acoustical Society of America, vol. 141, no. 5, pp. 3236-3249, May 2017.
[18] J. Benesty, I. Cohen, and J. Chen, Fundamentals of Signal Enhancement and Array Signal Processing, John Wiley & Sons, Dec. 2017.
[19] G. Huang, J. Benesty, I. Cohen, and J. Chen, "Differential beamforming on graphs," IEEE/ACM Trans. on Audio, Speech, and Language Processing, vol. 28, pp. 901-913, Feb. 2020.
[20] G. Huang, J. Benesty, J. Chen, and I. Cohen, "Robust and steerable kronecker product differential beamforming with rectangular microphone arrays," in Proc. Int. Conf. on Acoustics, Speech and Signal Processing, ICASSP'20, pp. 211-215, Barcelona, Spain, 4-8 May 2020.
[21] M. Bekrani, A. H. T. Nguyen, and A. W. H. Khong, "An adaptive non-linear process for under-determined virtual microphone beamforming," in Proc. Int. Conf. on Acoustics, Speech and Signal Processing, ICASSP'21, pp. 4495-4499, Toronto, Canada, 6-11 Jun. 2021.
[22] G. Itzhak and I. Cohen, "Differential and constant-beamwidth beamforming with uniform rectangular arrays," in Proc. Int. Workshop on Acoustic Signal Enhancement, WAENC'22, 5 pp., Bamberg, Germany, 5-8 Sept. 2022.
[23] X. Wang, I. Cohen, J. Benesty, and J. Chen, "Study of the null directions on the performance of differential beamformers," in Proc. Int. Conf. on Acoustics, Speech and Signal Processing, ICASSP'22, pp. 4928-4932, Singapore, Singapore, 23-27 May 2022.
[24] G. Itzhak, I. Cohen, and J. Benesty, "Multistage approach for steerable differential beamforming with rectangular arrays," Speech Communication, vol. 142, pp. 61-76, Jul. 2022.
[25] A. A. Nugraha, K. Sekiguchi, M. Fontaine, Y. Bando, and K. Yoshii, "DNN-free low-latency adaptive speech enhancement based on frame-online beamforming powered by block-online FastMNMF," in Proc. Int. Workshop on Acoustic Signal Enhancement, IWAENC'22, 5 pp., Bamberg, Germany, 5-8 Sept. 2022.
[26] H. Kim, K. Kang, and J. W. Shin, "Factorized MVDR deep beamforming for multi-channel speech enhancement," IEEE Signal Processing Letters, vol. 29, pp. 1898-1902, 2022.
[27] X. Xiao, et al., "Deep beamforming networks for multi-channel speech recognition," in Proc. Int. Conf. on Acoustics, Speech and Signal Processing, ICASSP'16, pp. 5745-5749, Shanghai, China, 20-25 Mar. 2016.
[28] I. McCowan, Microphone Arrays: A Tutorial, Queensland University, Australia, pp. 1-38, Apr. 2001.
[29] E. A. P. Habets, J. Benesty, I. Cohen, S. Gannot, and J. Dmochowski, "New insights into the MVDR beamformer in room acoustics," IEEE Trans. on Audio, Speech, and Language Processing, vol. 18, no. 1, pp. 158-170, Jun. 2009.
[30] T. Dietzen, S. Doclo, M. Moonen, and T. V. Waterschoot, "Integrated sidelobe cancellation and linear prediction Kalman filter for joint multi-microphone speech dereverberation, interfering speech cancellation, and noise reduction," IEEE/ACM Trans. on Audion, Speech, and Language Processing, vol. 28, pp. 740-754, 2020.
نگار سرشار تحصيلات خود را در مقاطع كارشناسي و كارشناسي ارشد مهندسی برق گرایش الکترونیک بهترتيب در سالهاي 1398 و 1401 از دانشگاههای تربیت دبیر شهیدرجایی و صنعتی قم به پايان رسانده است. زمينههاي تحقيقاتي مورد علاقه ايشان عبارتند از: پردازش سیگنال، پردازش تصویر و افزارههای نوری گرافن.
مهدی بکرانی تحصيلات خود را در مقطع كارشناسي مهندسي برق در سال 1381 از دانشگاه فردوسي مشهد و در مقاطع كارشناسي ارشد و دكتراي مهندسي برق، بهترتيب در سالهاي 1383 و 1389 از دانشگاه تربيت مدرس به پايان رسانده است. وي در سالهاي 1389 تا 1391 بهعنوان دستيار پژوهشي در دانشگاه صنعتي نانيانگ مشغول به فعاليت بود و از سال 1391 تاكنون عضو هيأت علمي دانشگاه صنعتي قم ميباشد. زمينههاي پژوهشي مورد علاقه ايشان عبارتند از: پردازش سيگنالهاي آكوستيكي و فراصوتي، و الگوريتمهاي وفقي.
[1] این مقاله در تاریخ 22 اسفند ماه 1401 دریافت و در تاریخ 8 آبان ماه 1402 بازنگری شد.
نگار سرشار، دانشكده مهندسي برق و كامپيوتر، دانشگاه صنعتی قم، قم، ايران،
(email: sarshar.n@qut.ac.ir).
مهدی بکرانی (نویسنده مسئول)، دانشكده مهندسي برق و كامپيوتر، دانشگاه صنعتی قم، قم، ايران، (email: bekrani@qut.ac.ir).
[2] . Hands-Free
[3] . Differential Beamforming
[4] . Jacobi-Anger
[5] . Cascade
[6] . Deep Neural Network
[7] . Minimum Variance Distortionless Response
[8] . Signal to Noise Ratio
[9] . Azimuth Angle
[10] . White Noise Gain
[11] . Directivity Factor
[12] . Delay and Sum
[13] . Power Spectral Density
[14] . Forward Spatial Difference