Performance Enhancement of Unfalsified Adaptive Control Using the Model Reference
Subject Areas : electrical and computer engineering
1 -
Keywords: Unfalsified adaptive control, data-driven control, controller set update, supervisory control,
Abstract :
Unfalsified adaptive control is a new approach in supervisory control that ensures the selection of a stabilizing controller from a control set based on the system input-output data. A prerequisite for ensuring stability is the existence of a pre-designed controller set that contains a stabilizing controller. The supervisor selects the controller based on the cost function calculated with the system input-output data. In this method, the control system performance is restricted to the controllers of the control set. In this paper, the controller set update is performed by introducing the concept of performance falsification along with the stability falsification of the active controller. To falsify the performance of the controller set, the structure of the model reference is proposed to evaluate the performance of the control system. In case of performance falsification, a new controller is designed and added to the controller set based on system data and without using any model. To design the controller, a linear matrix inequality problem is solved. In this paper, no system model is used, and the presented method is completely model-free and data-oriented. The simulation results show the performance improvement of the proposed method compared to other methods in a standard robust adaptive benchmark system.
[1] A. S. Morse, D. Q. Mayne, and G. C. Goodwin, "Applications of hysteresis switching in parameter adaptive control," IEEE Trans. on Automatic Control, vol. 37, no. 9, pp. 1343-1354, Sep. 1992.
[2] H. Jin and M. G. Safonov, "Unfalsified adaptive control: controller switching algorithms for nonmonotone cost functions," International J. of Adaptive Control and Signal Processing, vol. 26, no. 8, pp. 692-704, Aug. 2012.
[3] R. Wang, A. Paul, M. Stefanovic, and M. G. Safonov, "Cost detectability and stability of adaptive control systems," International J. of Robust and Nonlinear Control: IFAC-Affiliated J., vol. 17, no. 5-6, pp. 549-561, Mar. 2007.
[4] M. G. Safonov and T. C. Tsao, "The unfalsified control concept: a direct path from experiment to controller," In: B. A. Francis and A.R. Tannenbaum, (eds.) Feedback Control, Nonlinear Systems, and Complexity. Lecture Notes in Control and Information Sciences, vol. 202. Springer, Berlin, Heidelberg pp. 196-214, 1995.
[5] S. Baldi, G. Battistelli, E. Mosca, and P. Tesi, "Multi-model unfalsified adaptive switching supervisory control," Automatica, vol. 46, no. 2, pp. 249-259, Feb. 2010.
[6] S. Baldi, G. Battistelli, E. Mosca, and P. Tesi, "Multi-model unfalsified adaptive switching control: test functionals for stability and performance," International J. of Adaptive Control and Signal Processing, vol. 25, no. 7, pp. 593-612, Jul. 2011.
[7] G. Battistelli, J. P. Hespanha, E. Mosca, and P. Tesi, "Model-free adaptive switching control of time-varying plants," IEEE Trans. on Automatic Control, vol. 58, no. 5, pp. 1208-1220, May 2013.
[8] S. V. Patil, Y. C. Sung, and M. G. Safonov, "Unfalsified adaptive control for nonlinear time-varying plants," IEEE Trans. on Automatic Control, vol. 67, no. 8, pp. 3892-3904, Aug. 2022.
[9] م. نوری منظر و ع. خاکی صدیق، "کنترل نظارتی پیشبین ابطالناپذیر مدل چندگانه،" مجله کنترل، جلد 9، شماره 2، صص. 24-14، تابستان 1394.
[10] B. Sadeghi Forouz, M. Nouri Manzar, and A. Khaki-Sedigh, "Multiple model unfalsified adaptive generalized predictive control based on the quadratic inverse optimal control concept," Optimal Control Applications and Methods, vol. 42, no. 3, pp. 769-785, May/Jun. 2021.
[11] M. Nouri Manzar, G. Battistelli, and A. Khaki-Sedigh, "Input-constrained multi-model unfalsified switching control," Automatica, vol. 83, pp. 391-395, Sept. 2017.
[12] M. Nouri Manzar and A. Khaki-Sedigh, "Self-falsification in multimodel unfalsified adaptive switching control," International J. of Adaptive Control and Signal Processing, vol. 31, no. 11, pp. 1723-1739, Nov. 2017.
[13] S. I. Habibi, A. Khaki-Sedigh, and M. Nouri Manzar, "Performance enhancement of unfalsified adaptive control strategy using fuzzy logic," International J. of Systems Science, vol. 50, no. 15, pp. 2752-2763, 2019.
[14] S. I. Habibi and A. Bidram, "Unfalsified switching adaptive voltage control for islanded microgrids," IEEE Trans. on Power Systems, vol. 37, no. 5, pp. 3394-3407, Sep. 2022.
[15] A. Hokmabadi and M. Khodabandeh, "Unfalsified control design using a generalized cost function for a quadrotor," Aircraft Engineering and Aerospace Technology, vol. 93, no. 2, pp. 241-250, 2021.
[16] C. de Persis and P. Tesi, "Formulas for data-driven control: stabilization, optimality, and robustness," IEEE Trans. on Automatic Control, vol. 65, no. 3, pp. 909-924, Mar. 2019.
[17] H. Kwakernaak, The Polynomial Approach to H∞-Optimal Regulation, in H∞-Control Theory, Springer, pp. 141-221, 1991.
[18] M. Grant and S. Boyd, CVX: Matlab Software for Disciplined Convex Programming, Version 2.2, 2020.
نشریه مهندسی برق و مهندسی كامپیوتر ایران، الف- مهندسی برق، سال 20، شماره 4، زمستان 1401 301
مقاله پژوهشی
بهبود عملکرد کنترل تطبیقی ابطالناپذیر با بهکارگیری مدل مرجع
مجتبی نوری منظر
چكیده: کنترل تطبیقی ابطالناپذیر، رویکرد جدیدی در کنترل نظارتی است که تنها با توجه به دادههای ورودی- خروجی از سیستم و یک بانک کنترلی، انتخاب کنترلکننده پایدارساز را تضمین میکند. تنها شرط لازم برای اثبات پایداری، وجود یک بانک کنترلکننده طراحیشده از قبل است که حداقل یک کنترلکننده از کنترلکنندههای موجود در بانک کنترلی، پایدارساز باشد. انتخاب کنترلکنندهها توسط ناظر بر اساس تابع هزینهای است که با دادههای ورودی- خروجی سیستم محاسبه میشوند. در این روش، عملکرد سیستم کنترلی محدود به کنترلکنندههای موجود در بانک کنترلی است. در این مقاله با استفاده از معرفی ایده ابطال عملکرد بانک کنترلی موجود، در کنار مفهوم ابطال پایداری کنترلکننده فعال، بهروزرسانی بانک کنترلی انجام میشود. برای ابطال عملکرد بانک کنترلی، ساختار مدل مرجع برای ارزیابی عملکرد سیستم کنترلی پیشنهاد شده است. بعد از ابطال عملکرد، یک کنترلکننده جدید بر اساس دادههای سیستم و بدون استفاده از هیچ مدلی طراحی شده و کنترلکننده جدید به بانک کنترلکنندهها افزوده میشود. برای طراحی کنترلکننده، یک مسأله ناتساوی ماتریسی خطی حل میشود. در این مقاله از هیچ مدلی از سیستم استفاده نشده و روش ارائهشده کاملاً بدون مدل و دادهمحور است. نتایج شبیهسازی، بهبود عملکرد روش پیشنهادی را نسبت به سایر روشها بر روی یک سیستم رایج که در ارزیابی عملکرد سیستمهای کنترل تطبیقی مقاوم استفاده میشود، نشان میدهند.
کلیدواژه: کنترل تطبیقی ابطالناپذیر، کنترل دادهمحور، بهروزرسانی بانک کنترلی، کنترل نظارتی.
1- مقدمه
کنترل تطبیقی ابطالناپذیر، روش دادهمحوری است که با استفاده از دادههای سیستم به دنبال یافتن کنترلکننده پایدارساز از میان بانک کنترلی طراحی شده است. در این روش بدون فعالسازی کنترلکنندهها، عملکرد آنها به کمک مفهوم جدیدی به نام سیگنال مرجع مجازی2 ارزیابی میشود. در هر لحظه از زمان با استفاده از دادههای ورودی- خروجی برخط از سیستم و تابع تبدیل کنترلکننده، سیگنال مرجع مجازی محاسبه میشود. ایده اصلی سیگنالهای مرجع مجازی این است که چه سیگنال ورودی مرجعی، دقیقاً همان داده مشاهدهشده از سیستم را تولید میکند. این سیگنال مرجع مجازی برای تمامی کنترلکنندهها در بانک کنترلی در هر لحظه از زمان محاسبه شده و سپس تابع هزینه برای هر کنترلکننده به دست میآید.
مطابق توابع هزینه که برای هر یک از اعضای بانک کنترلی محاسبه میشود، ناظر بر اساس یک منطق کلیدزنی، کنترلکننده فعال را در هر لحظه از زمان مشخص میکند. ناظر برای انتخاب از میان توابع هزینه میتواند از منطقهای کلیدزنی متفاوتی مانند الگوریتم هیسترزیس [1] و یا 3LICLA [2] استفاده کند. برای اثبات پایداری در روش هیسترزیس، تابع هزینه باید یکنوا افزایشی در زمان باشد [3] در حالی که در الگوریتم LICLA چنین فرضی لازم نیست.
ایده اصلی کنترل ابطالناپذیر در [4] ارائه گردیده و نهایتاً در سال 2007 در [3] اثبات پایداری سیستم به طور کامل ارائه شده است. هدف در کنترل ابطالناپذیر، تعیین کنترلکننده پایدارساز از بانک کنترلی فقط بر اساس دادههای سیستم به صورت برخط است. به این ترتیب، در لحظات گذرا امکان فعالسازی کنترلکنندههای ناپایدارساز اجتنابناپذیر است. فعالسازی کنترلکننده ناپایدارساز موجب کاهش عملکرد شده و به این پدیده 4DAL میگویند. تضعیف پدیده DAL و بهبود عملکرد از شاخههای اصلی پژوهشها در زمینه کنترل ابطالناپذیر است. در رویکرد دیگری به نام کنترل تطبیقی ابطالناپذیر مدل چندگانه 5(MMUAC) از بانک مدل در کنار الگوریتم ابطالپذیری استفاده گردیده که بهبود عملکرد سیستم کنترلی در نهایت حاصل شده است [5]. توابع هزینه مختلف و ویژگیهای آن برای رویکرد MMUAC در [6] ارائه گردیده است. با توجه به این که تابع هزینه از زمان اولیه محاسبه میشد، عملاً امکان استفاده و دستیابی به عملکرد بهینه برای سیستمهای متغیر با زمان محدود میگردید. با معرفی مفهوم بازنشانی زمانی6 برای سیستمهای تغییرپذیر با زمان، تابع هزینه در یک پنجره زمانی با طول متغیر، محاسبه و بدین ترتیب دادههای نامعتبر گذشته حذف میشود. با استفاده از بازنشانی، پایداری سیستم خطی و غیر خطی تغییرپذیر با زمان اثبات شده است [7] و [8]. بانک کنترلکنندههای پیشبین تعمیمیافته برای روش MMUAC در [9] و [10] پیشنهاد شده است. برای استفاده از کنترل پیشبین در کنترل ابطالناپذیر، نیاز به معکوس کنترلکننده وجود دارد که با توجه به مقیدبودن مسأله، این عمل با حل مسأله بهینهسازی معکوس7 انجام میشود. در این روش، الگوریتم نهایی نسبتاً پیچیده بوده و برای پیادهسازی عملی نیاز به حل چندین مسأله بهینهسازی وجود دارد. با توجه به وجود قید در تمامی سیستمهای واقعی، چالش پیادهسازی واقعی برای کنترل ابطالناپذیر وجود داشت. اثبات پایداری سیستم با ورودی مقید در [11] ارائه شده که در این مقاله با اصلاح تابع هزینه و معرفی سیگنال مرجع مجازی جدیدی پایداری سیستم مقید بررسی شده است. اگرچه در ساختار در نظر گرفته شده، تنها در سیستمهایی که ذاتاً پایدار هستند امکان اجرای الگوریتم پیشنهادی وجود دارد. در [12] با استفاده از مفهوم
شکل 1: نمایش بلوکی کلی ساختار سیستم حلقه بسته با کنترل تطبیقی ابطالناپذیر.
خودابطالپذیری برای MMUAC و همچنین استفاده از بازنشانی در روش LICLA، عملکرد سسیتم کنترلی بهبود یافته است. این بهبود عملکرد اثبات نگردیده و تنها به کمک شبیهسازی نشان داده شده است. همچنین در [13] برای بهبود عملکرد به کمک روش فازی، توابع هزینه وزندهی شده است. چالش تنظیم درست سیستم فازی برای بهبود عملکرد در این مقاله وجود دارد. کنترل تطبیقی ابطالناپذیر در کاربردهای گوناگونی استفاده شده است. به عنوان مثال در تنظیم ولتاژ یک سیستم ریزشبکه8 [14] و برای کنترل یک کوادروتور9 [15] مورد استفاده قرار گرفته است. مراجع [14] و [15] کاربرد کنترل تطبیقی ابطالناپذیر برای سیستمهای واقعی مختلف را نشان داده و همچنین بیانگر عملکرد قابل قبول کنترل تطبیقی ابطالناپذیر برای سیستمهای دارای عدم قطعیت زیاد هستند. در تمامی مراجع در ادبیات کنترل تطبیقی ابطالناپذیر تا امروز بانک کنترلی ثابت فرض گردیده که این امر موجب محدودیت عملکرد سیستم شده است.
در این مقاله به بهروزرسانی ساختار کنترل ابطالناپذیر پرداخته شده است. بهبود عملکرد کنترلی یکی از مهمترین رویکردها در زمینه کنترل تطبیقی ابطالناپذیر است. تا به اینجا تمامی مقالات در زمینه کنترل ابطالناپذیر با بانک کنترلی ثابت کار میکردند که به این جهت عملکرد محدودی داشتند. بدین منظور، عملکرد بانک کنترلی به کمک مدل مرجع ارزیابی میشود. بعد از ابطال عملکرد بانک کنترلی، یک کنترلکننده بر اساس حل یک ناتساوی ماتریسی خطی طراحی شده و به بانک کنترلی افزوده میشود.
ساماندهی این مقاله به صورت زیر است: در بخش 2 به تشریح مسأله کنترل تطبیقی ابطالناپذیر پرداخته شده و تعاریف و مفاهیم لازم در این مبحث تجزیه و تحلیل میگردند. بخش 3 به بهروزرسانی ساختار کنترل تطبیقی ابطالناپذیر میپردازد. در این بخش، الگوریتم پیشنهادی برای ابطال عملکرد بانک کنترلی به کمک مدل مرجع توضیح داده شده و در ادامه، نحوه طراحی کنترلکننده با استفاده از حل یک مسأله ناتساوی ماتریسی خطی ارائه میشود. در بخش انتهایی، عملکرد روش پیشنهادی بر روی سیستم ارابههای متصل به یکدیگر ارزیابی شده و بهبود عملکرد در شرایط کاملاً یکسان نسبت به کنترل تطبیقی ابطالناپذیر نشان داده شده است.
2- کنترل تطبیقی ابطالناپذیر با تابع هزینه غیر یکنوا
نماد نشاندهنده نرم با فاکتور فراموشی برای بردار تا زمان بوده و طبق رابطه زیر محاسبه میشود
(1)
که در این رابطه، نرم اقلیدسی و فاکتور فراموشی به فرم است. بانک کنترلی با تعداد عضوهای محدود به صورت در نظر گرفته شده که تابع تبدیل هر کنترلکننده به شکل زیر است
(2)
که در آن اپراتور تأخیر واحد (یک گام رو به عقب) میباشد. و چندجملهایهایی بر حسب بوده که نسبت به هم اول در نظر گرفته شده (یا عوامل مشترک آنها پایدار هستند) و چندجملهای یکه10 است .
سیستم حلقه بسته با کلیدزنی در شکل 1 نشان داده شده است. مطابق شکل، کنترلکننده فعال در هر لحظه با استفاده از سیگنال کلیدزنی که میتواند یکی از مقادیر صحیح 1 تا را داشته باشد، مشخص میشود. به این ترتیب کنترلکننده فعال در لحظه جاری با نشان داده میشود. انتخاب کنترلکننده فعال بر اساس تابع هزینه و یک الگوریتم کلیدزنی انجام میگردد. تابع هزینه اولیه مرسوم در کنترل ابطالناپذیر برای هر یک از کنترلکنندههای به صورت رابطه زیر محاسبه میشود
(3)
که در این رابطه سیگنال کنترل، سیگنال خروجی و یک عدد ثابت مثبت است. همچنین نمایانگر سیگنال مرجع مجازی برای کنترلکننده ام است و در ادامه تعریف میشود. تابع هزینه نهایی بیشینه تابع هزینه اولیه در یک پنجره زمانی ثابت محدود به طول است و به صورت زیر در نظر گرفته میشود
(4)
که در آن یک عدد صحیح مثبت است.
تعریف 1 (سیگنال مرجع مجازی): مطابق شکل 2 با در نظر گرفتن بردار ورودی و خروجی سیستم به صورت ، سیگنال مرجع مجازی برای کنترلکننده از بانک کنترلی، یک سیگنال مرجع فرضی است که اگر کنترلکننده در حلقه کنترلی بود، دقیقاً همان داده ورودی- خروجی تولید میشد.
هدف اصلی در محاسبه سیگنال مرجع مجازی، ارزیابی عملکرد کنترلکنندههای غیر فعال میباشد. با فرض کمینه فاز بودن تمامی کنترلکنندههای بانک کنترلی، سیگنال مرجع مجازی برای کنترلکننده به صورت زیر قابل محاسبه است
(5)
در ادامه به تشریح مفهوم پایداری استفادهشده در مقاله پرداخته میشود.
(الف)
(ب)
شکل 2: (الف) نمایش بلوکی حلقه اصلی سیستم کنترلی با ورودی سیگنال مرجع واقعی و (ب) نمایش بلوکی حلقه مجازی سیستم کنترلی با ورودی سیگنال مرجع مجازی.
تعریف 2 (پایداری): سیستم حلقه بسته با ورودی مرجع و خروجی پایدار است، اگر برای تمامی ورودیهای مرجع ، پارامترهای و وجود داشته باشند به طوری که نامساوی زیر برقرار باشد
(6)
در این مقاله برای منطق کلیدزنی از الگوریتم افزایش خطی سطح تابع هزینه (LICLA) استفاده میشود که این الگوریتم در ادامه تشریح گردیده است.
الگوریتم 1) LICLA [2]
1) مقداردهی اولیه: ، ، : دلخواه و
2) جمعآوری دادهها و محاسبه توابع هزینه
3) اگر ، کنترلکننده ابطال شده
آن گاه:
اگر
آن گاه:
در غیر این صورت
4) و بازگشت به گام 2.
در این الگوریتم برای ابطال پایداری، توابع هزینه با سطح مقایسه میشوند و زمانی که کنترلکننده فعال در حلقه ابطال شود، این کنترلکننده از مجموعه کنترلی حذف میگردد. با ابطال کنترلکننده فعال، کنترلکنندهای در حلقه قرار میگیرد که کمترین مقدار تابع هزینه را داشته باشد و همچنین سطح ابطال به میزان افزایش مییابد. زمانی که تمام کنترلکنندههای 1 تا از بانک کنترلی حذف شوند و بانک کنترلی خالی گردد، مجدداً تمام کنترلکنندههای 1 تا به بانک کنترلی وارد میشوند.
فرض 1 (مسأله کنترل تطبیقیشدنی11): یک کنترلکننده پایدارساز در میان بانک کنترلکنندهها وجود دارد.
در ادامه به طور خلاصه به بررسی رویه اثبات پایداری پرداخته میشود. به این ترتیب اگر فرض کنیم که کنترلکننده پایدارساز باشد، ثابتهای مثبت و وجود دارند به طوری که
(7)
با در نظر گرفتن این رابطه میتوان نشان داد که تابع هزینه این کنترلکننده در همه زمانها مقداری محدود خواهد داشت
(8)
همچنین نشان داده شده که حداکثر تعداد کلیدزنی با الگوریتم LICLA مقدار بوده که در آن کوچکترین عدد صحیح است که در رابطه زیر صدق کند
(9)
که در این رابطه مقدار اولیه بوده و تابع هزینه کنترلکننده پایدارساز است. به این ترتیب کلیدزنی در زمان محدود متوقف شده و تابع هزینه آخرین کنترلکننده، مقدار محدودی دارد. میتوان نشان داد که ثابتهای مثبت و وجود دارند به طوری که
(10)
فرض 2: معکوس تمامی کنترلکنندهها پایدار است.
برای تکمیل اثبات پایداری میتوان نشان داد که برای کنترلکننده نهایی ، ثابتهای مثبت و وجود دارند به طوری که رابطه زیر برقرار باشد
(11)
اما برای کنترلکنندههایی که معکوس پایدار ندارند از نمایش کسری ماتریسی 12(MFD) برای کنترلکنندهها استفاده میشود. با در نظر گرفتن ، سیگنال مرجع مجازی جدید به فرم زیر به دست میآید
(12)
و نهایتاً تابع هزینه نیز به صورت زیر اصلاح میشود
(13)
3- کنترل تطبیقی ابطالناپذیر با بهروزرسانی ساختار
با توجه به این که ساختار کنترلی در کنترل ابطالناپذیر ثابت در نظر گرفته میشود، عملکرد کنترلی محدود به کنترلکنندههای موجود در بانک کنترلی است. در ادامه به توضیح نحوه بهروزرسانی بانک کنترلی پرداخته شده است.
3-1 ابطال عملکرد بانک کنترلی
در این قسمت نیز مشابه کنترل ابطالناپذیر، برقراری فرض کنترل تطبیقیشدنی در نظر گرفته میشود. برای ابطال عملکرد بانک کنترلی، ایده مدل مرجع در کنار ساختار کنترل تطبیقی ابطالناپذیر پیشنهاد شده است. بدین جهت برای ابطال عملکرد سیستم، مطابق شکل 3 از خطای مدل مرجع و خروجی سیستم استفاده میشود. برای اطمینان باید خطای مدل مرجع در پنجره زمانی مشخصی از باند ابطال عملکرد بیشتر باشد. خطای مدل مرجع با خروجی سیستم از رابطه زیر محاسبه میشود
(14)
شکل 3: ساختار پیشنهادی کنترل تطبیقی ابطالناپذیر با بانک کنترلی بهروزشونده.
که این خطا در لحظات مختلفی ممکن است از محدوده عملکرد مجاز خارج شود. برای اطمینان از ابطال عملکرد بانک کنترلی، لازم است که این خطا در یک محدوده زمانی پیوسته مشخص، در محدود مجاز نباشد. سپس رویه طراحی کنترلکننده آغاز شده و یک کنترلکننده جدید به بانک کنترلی اضافه میشود. الگوریتم 2 نحوه دقیق اجرای این روش پیشنهادی را ارائه میکند.
الگوریتم 2) ابطال عملکرد بانک کنترلی
1) مقداردهی اولیه: و
2) جمعآوری دادهها و محاسبه
3) اگر
آن گاه: اگر
آن گاه:
و اگر
آن گاه:
4) اگر و
آن گاه: طراحی کنترلکننده
5) بازگشت به گام 2.
الگوریتم 2 به طور متناوب اجرا میگردد. در گام 3 اگر خطا از محدوده بیشتر باشد، به پارامتر یک واحد اضافه میشود. این پارامتر تضمین میکند که در یک پنجره پیوسته زمانی، میزان خطا خارج از محدوده مورد نظر است. در گام 4 این الگوریتم، اگر خروج خطا از محدوده برقرار باشد، رویه طراحی کنترلکننده جدید آغاز میشود. برای جلوگیری از ورود تعداد نامحدود از کنترلکنندهها به بانک کنترلی، این تعداد نیز با پارامتر محدود میشود.
3-2 طراحی مستقیم کنترلکننده بر مبنای داده
ورودی- خروجی
برای طراحی کنترلکننده از یک روش دادهمحور جدید استفاده میشود [16]. در این روش تنها به کمک دادههای ورودی- خروجی سیستم و بدون هیچ مدلسازی و یا خطیسازی، مستقیماً کنترلکننده طراحی میشود. در ادامه به طور مختصر به تشریح روش ارائهگردیده در [16] پرداخته میشود. فرض کنید که مدل فضای حالت سیستم با در نظر گرفتن به صورت (15) نمایش داده شود.
(15)
در این رابطه 0 ماتریس صفر و ماتریس واحد با ابعاد مناسب است. با ذخیره دادهها در طول پنجرهای به طول ، ماتریسهای ، و با قراردادن ستونی کنار یکدیگر مقادیر ورودی و حالتها، به صورت زیر تشکیل میشود
(16)
که حالتها و ورودی سیستم است. برای طراحی کنترلکننده لازم است که ورودی به اندازه کافی غنی13 باشد.
فرض 3: ماتریس دارای رتبه کامل سطری است.
سیستم غیر خطی به صورت (17) را در نظر بگیرید
(17)
بسط تیلور این سیستم غیر خطی به صورت زیر است
(18)
نمادهای و ، متغیر انحرافی حالت و ورودی را به صورت و نشان میدهند و ماتریسهای و به صورت زیر تعریف میشوند
(19)
متغیر حاوی جملات مرتبه بالاتر است. اگر مقادیر در یک بردار به صورت زیر قرار گیرد، پایداری سیستم غیر خطی قابل بررسی خواهد بود
(20)
توجه کنید که این ماتریس قابل اندازهگیری نیست ولی میتوان شرط (21) را برای جملات مرتبه بالاتر در نظر گرفت.
فرض 4: ماتریس دارای رتبه کامل سطری است و مثبت وجود دارد، به طوری که
(21)
قضیه [16]: سیستم غیر خطی (17) برای نقطه کار را در نظر بگیرید. هر پاسخ که در نامعادله ماتریسی (22) برقرار باشد، با شرط ، یک بهره پایدارساز محلی فیدبک حالت به صورت تولید میکند
(22)
اثبات: با در نظر گرفتن قانون کنترل ، معادلات سیستم با (17) نمایشی به فرم زیر دارد
(23)
که در آن ماتریس است به طوری که رابطه زیر برآورده شود
(24)
برای بررسی پایداری تابع لیاپانوف به صورت زیر تعریف میشود.
(25)
که در آن ماتریس مثبت معین است. برای پایداری باید تغییرات سطح انرژی سیستم بر اساس این تابع لیاپانوف نزولی باشد و بنابراین
(26)
با تعریف و طبق رابطه برای مثبت معین بودن باید رابطه زیر برقرار باشد
(27)
با بازنویسی، رابطه به صورت زیر است
(28)
این ناتساوی به کمک ناتساوی شور14 به صورت زیر بازنویسی میشود
(29)
با شرط پایداری را تضمین میکند. بهره کنترلی نیز به صورت بوده و از رابطه زیر قابل محاسبه است
(30)
از ویژگیهای مهم این روش میتوان به مقاومت در برابر نویز، کاربرد برای سیستمهای پیوسته و همچنین حفظ پایداری برای سیستمهای غیر خطی نیز اشاره کرد. برای جزئیات بیشتر به [16] مراجعه کنید.
در شکل 4 به طور دقیق، الگوریتم ابطال پایداری و الگوریتم ابطال عملکرد پیشنهادشده برای یک سیستم در یک روندنما تشریح گردیده است. این روندنما شامل دو قسمت کلی است. یکی رویه ابطال پایداری که طبق آن کنترلکننده پایدارساز انتخاب میشود. رویه ابطال عملکرد بررسی میکند که آیا کنترلکنندههای موجود عملکرد مناسبی دارند یا خیر. در صورت ابطال عملکرد، کنترلکننده جدیدی به بانک کنترلی افزوده میگردد. برای طراحی کنترلکننده از بهینهسازی (22) استفاده میشود.
4- نتایج شبیهسازی
در این قسمت عملکرد روش پیشنهادی روی یک سیستم رایج ارزیابی میشود. برای این منظور از سیستم ارابههای متصل که به عنوان یک محک15 روشهای تطبیقی مقاوم شناخته شده است، استفاده میگردد. مدل فضای حالت این سیستم به صورت (31) است
(31)
که در آن جرم دو ارابه و سختی فنر مدلشده میان دو ارابه است که مقداری نامعین دارد. زمان نمونهبرداری برای شبیهسازی ثانیه در نظر گرفته میشود.
بانک کنترلی با استفاده از روش کنترل مقاوم ارائهشده در [17] طراحی میشود. اگر کنترلکننده به صورت در نظر گرفته شود، کنترلکننده مقاوم مطابق (32) طراحی میگردد
(32)
که بوده و معادله مشخصه حلقه بسته سیستم است. دو کنترلکننده برای مقادیر و طراحی شده و تابع تبدیل آنها به صورت زیر است
(33)
این بانک کنترلی حداقل یک کنترلکننده پایدارساز برای بازه دارد که در نتیجه، فرض بانک کنترلیشدنی را برآورده میکند. کنترلکنندههای طراحیشده کمینه فاز نیستند و باید از تابع هزینه (13) در این شبیهسازی استفاده شود.
برای شبیهسازی فرض کنید که سختی فنر سیستم در 3000 نمونه ابتدایی مقدار 31/0 داشته و سپس به طور ناگهانی مقدار آن به مقدار
5/0 تغییر کند. به این ترتیب تغییرات سیستم به صورت شکل 5 در زمان است.
در ادامه برای مقایسه عملکرد، دو شبیهسازی با شرایط کاملاً یکسان انجام میشود. در اولین شبیهسازی از روش کنترل تطبیقی ابطالناپذیر با الگوریتم LICLA استفاده میگردد.
[1] این مقاله در تاریخ 25 آبان ماه 1400 دریافت و در تاریخ 7 شهریور ماه 1401 بازنگری شد.
مجتبی نوری منظر (نویسنده مسئول)، دانشكده مهندسي برق، دانشگاه شهید بهشتی، تهران، ایران، (email: m_nourimanzar@sbu.ac.ir).
[2] . Fictitious Reference Signal
[3] . Linearly Increasing Cost Level Algorithm
[4] . Dehghani-Anderson-Lanzon
[5] . Multi-Model Unfalsified Adaptive Control
[6] . Reset Time
[7] . Inverse Optimization
[8] . Microgrid
[9] . Quadrotor
[10] . Monic
[11] . Feasible Adaptive Control Problem
[12] . Matrix Fraction Description
[13] . Persistently Excited
[14] . Schur Complement
[15] . Benchmark
شکل 4: روندنمای الگوریتم کنترل تطبیقی ابطالناپذیر با بانک کنترلی بهروزشونده.
شکل 5: نمودار تغییر سختی فنر سیستم .
پارامترهای کنترلی در این شبیهسازی عبارت است از ، ، (اولیه) و . کنترلکننده ناپایدارساز
به عنوان اولین کنترلکننده در نظر گرفته میشود. نتایج شبیهسازی در شکلهای 6 و 7 نمایش داده شده است. مطابق شکل 6، الگوریتم به درستی کنترلکننده پایدارساز را بعد از زمان کوتاهی انتخاب میکند. بعد از تغییر سیستم در لحظه 300 ثانیه، کنترلکننده فعال دیگر پایدارساز نیست. در این صورت نیز بعد از لحظاتی ناظر به درستی کنترلکننده پایدارساز را انتخاب میکند. همان طور که در شکل 6 نیز مشخص است، کنترلکننده انتخابشده اگرچه پایدارساز میباشد ولی عملکرد قابل قبولی ندارد.
این مشکل در روش کنترل تطبیقی ابطالناپذیر به دلیل این که از یک بانک کنترلی ثابت استفاده میکند، اجتنابناپذیر است. برای بهبود عملکرد در این مقاله، بهروزرسانی بانک کنترلی پیشنهاد گردیده است. در ادامه
به شبیهسازی روش پیشنهادی پرداخته میشود. بدین منظور الگوریتم 2
با مقادیر ، ، (اولیه) و برای شبیهسازی در نظر گرفته میشود. برای بهروزرسانی بانک کنترلی، زمانی که عملکرد بانک کنترلی ابطال میشود، طراحی برخط کنترلکننده به وسیله حل معادلات ناتساوی ماتریسی (22) با در نظر گرفتن انجام میشود. برای حل این معادلات ناتساوی ماتریسی، در نرمافزار Matlab جعبهابزار CVX استفاده [18] و نتایج شبیهسازی در شکل 7 نمایش داده شده است. نتایج تا قبل از لحظه 300 ثانیه کاملاً مشابه قبل میباشد. بعد از این لحظه که سیستم تغییر میکند نیز ناظر به درستی کنترلکننده پایدارساز را انتخاب مینماید. تفاوت در اینجا آن است که بعد از لحظاتی ناظر متوجه میشود که عملکرد کنترلکننده مناسب نیست و
(الف)
(ب)
شکل 6: روش کنترل تطبیقی ابطالناپذیر، (الف) نمودار خروجی و سیگنال مرجع و (ب) سیگنال انتخاب کنترلکننده.
(الف)
(ب)
شکل 7: روش پیشنهادی کنترل تطبیقی ابطالناپذیر با بانک کنترلی بهروزشونده، (الف) نمودار خروجی و سیگنال مرجع و (ب) سیگنال انتخاب کنترلکننده.
جدول 1: مقایسه عملکرد روش پیشنهادی و کنترل ابطالناپذیر.
کنترل ابطالناپذیر | روش پیشنهادی |
|
01/0 | 4-10 × 33/1 | واریانس خروجی |
4-10 × 67/1 | 5-10 × 18/3 | واریانس سیگنال کنترل |
بدین ترتیب وارد رویه طراحی کنترلکننده جدید میشود. این طراحی کنترلکننده به صورت مستقیم بوده و تنها با توجه به دادههای ورودی- خروجی سیستم است. بدون ساخت هیچ مدلی به کمک روش دادهمحور، کنترلکننده مستقیماً طراحی و به بانک کنترلی وارد میشود. کنترلکننده حاصل از حل ناتساوی ماتریسی به صورت (34) است
(34)
ناظر از کنترلکنندههای موجود در بانک کنترلی بر اساس توابع هزینه تصمیم میگیرد که کدام کنترلکننده عملکرد بهتری دارد. مقادیر توابع هزینه و دنباله در شکلهای 8 و 9 نشان داده شده است. مطابق شکل 8، مقدار تابع هزینه بانک کنترلی محدود بوده که نشاندهنده شدنیبودن
(الف)
(ب)
شکل 8: روش کنترل تطبیقی ابطالناپذیر، (الف) نمودار توابع هزینه و (ب) سیگنال .
(الف)
(ب)
شکل 9: روش پیشنهادی کنترل تطبیقی ابطالناپذیر با بانک کنترلی بهروزشونده، (الف) نمودار توابع هزینه و (ب) سیگنال .
بانک کنترلی میباشد، اما عملکرد مطلوب حاصل نگردیده است. در زمان 423 ثانیه مطابق شکل 9، عملکرد کنترلی ابطال و کنترلکننده 3 وارد بانک کنترلی شده است.
با مقایسه شکل 6 و 7 مشخص است که روش پیشنهادی، عملکرد بهتری داشته و خروجی نوسانات کمتری دارد. مطابق جدول 1، واریانس خروجی و سیگنال کنترل در روش پیشنهادی به مراتب کمتر از کنترل ابطالناپذیر با بانک کنترلی ثابت است.
5- نتیجهگیری و جمعبندی
با توجه به این که در کنترل تطبیقی ابطالناپذیر، بانک کنترلی ثابت فرض میشود، بهترین عملکرد این سیستم کنترل نظارتی وابسته به بانک کنترلی خواهد بود. نوآوری اصلی مقاله، معرفی کنترل تطبیقی ابطالناپذیر با بانک کنترلی بهروزشونده است که موجب بهبود عملکرد سیستم میشود. در این مقاله با بهکارگیری یک مدل مرجع، عملکرد بانک کنترلی مورد ارزیابی قرار گرفته و با معرفی مفهوم ابطال عملکرد، بهروزرسانی بانک کنترلی انجام میشود. دو مسأله اصلی وجود دارد: یکی این که چه زمانی بانک کنترلی بهروزرسانی شود و دیگری این که کنترلکننده جدید چگونه طراحی شود. برای زمان بهروزرسانی از خطای مدل مرجع استفاده شده و برای طراحی کنترلکننده جدید از یک روش دادهمحور نوین که تنها بر اساس دادههای ورودی- خروجی سیستم کار میکند، استفاده گردیده است. طراحی کنترلکننده جدید به کمک حل یک مسأله ناتساوی ماتریسی است. طراحی کنترلکننده ردیاب دادهمحور هنوز جزء مسایل حلنشده بوده و روش پیشنهادی برای ورودی مرجع ثابت، کارا است.
در یک مثال کاربردی نشان داده شد زمانی که بانک کنترلی حاوی کنترلکننده با عملکرد مناسب نیست، روش پیشنهادی بهبود عملکرد قابل توجهی دارد.
مراجع
[1] A. S. Morse, D. Q. Mayne, and G. C. Goodwin, "Applications of hysteresis switching in parameter adaptive control," IEEE Trans. on Automatic Control, vol. 37, no. 9, pp. 1343-1354, Sep. 1992.
[2] H. Jin and M. G. Safonov, "Unfalsified adaptive control: controller switching algorithms for nonmonotone cost functions," International J. of Adaptive Control and Signal Processing, vol. 26, no. 8, pp. 692-704, Aug. 2012.
[3] R. Wang, A. Paul, M. Stefanovic, and M. G. Safonov, "Cost detectability and stability of adaptive control systems," International J. of Robust and Nonlinear Control: IFAC-Affiliated J., vol. 17,
no. 5-6, pp. 549-561, Mar. 2007.
[4] M. G. Safonov and T. C. Tsao, "The unfalsified control concept: a direct path from experiment to controller," In: B. A. Francis and A.R. Tannenbaum, (eds.) Feedback Control, Nonlinear Systems, and Complexity. Lecture Notes in Control and Information Sciences, vol. 202. Springer, Berlin, Heidelberg pp. 196-214, 1995.
[5] S. Baldi, G. Battistelli, E. Mosca, and P. Tesi, "Multi-model unfalsified adaptive switching supervisory control," Automatica,
vol. 46, no. 2, pp. 249-259, Feb. 2010.
[6] S. Baldi, G. Battistelli, E. Mosca, and P. Tesi, "Multi-model unfalsified adaptive switching control: test functionals for stability and performance," International J. of Adaptive Control and Signal Processing, vol. 25, no. 7, pp. 593-612, Jul. 2011.
[7] G. Battistelli, J. P. Hespanha, E. Mosca, and P. Tesi, "Model-free adaptive switching control of time-varying plants," IEEE Trans. on Automatic Control, vol. 58, no. 5, pp. 1208-1220, May 2013.
[8] S. V. Patil, Y. C. Sung, and M. G. Safonov, "Unfalsified adaptive control for nonlinear time-varying plants," IEEE Trans. on Automatic Control, vol. 67, no. 8, pp. 3892-3904, Aug. 2022.
[9] م. نوری منظر و ع. خاکی صدیق، "کنترل نظارتی پیشبین ابطالناپذیر مدل چندگانه،" مجله کنترل، جلد 9، شماره 2، صص. 24-14، تابستان 1394.
[10] B. Sadeghi Forouz, M. Nouri Manzar, and A. Khaki-Sedigh, "Multiple model unfalsified adaptive generalized predictive control based on the quadratic inverse optimal control concept," Optimal Control Applications and Methods, vol. 42, no. 3, pp. 769-785, May/Jun. 2021.
[11] M. Nouri Manzar, G. Battistelli, and A. Khaki-Sedigh, "Input-constrained multi-model unfalsified switching control," Automatica, vol. 83, pp. 391-395, Sept. 2017.
[12] M. Nouri Manzar and A. Khaki-Sedigh, "Self-falsification in multimodel unfalsified adaptive switching control," International J. of Adaptive Control and Signal Processing, vol. 31, no. 11, pp. 1723-1739, Nov. 2017.
[13] S. I. Habibi, A. Khaki-Sedigh, and M. Nouri Manzar, "Performance enhancement of unfalsified adaptive control strategy using fuzzy logic," International J. of Systems Science, vol. 50, no. 15, pp. 2752-2763, 2019.
[14] S. I. Habibi and A. Bidram, "Unfalsified switching adaptive voltage control for islanded microgrids," IEEE Trans. on Power Systems, vol. 37, no. 5, pp. 3394-3407, Sep. 2022.
[15] A. Hokmabadi and M. Khodabandeh, "Unfalsified control design using a generalized cost function for a quadrotor," Aircraft Engineering and Aerospace Technology, vol. 93, no. 2, pp. 241-250, 2021.
[16] C. de Persis and P. Tesi, "Formulas for data-driven control: stabilization, optimality, and robustness," IEEE Trans. on Automatic Control, vol. 65, no. 3, pp. 909-924, Mar. 2019.
[17] H. Kwakernaak, The Polynomial Approach to H∞-Optimal Regulation, in H∞-Control Theory, Springer, pp. 141-221, 1991.
[18] M. Grant and S. Boyd, CVX: Matlab Software for Disciplined Convex Programming, Version 2.2, 2020.
مجتبی نوری منظر تحصيلات خود را در مقاطع كارشناسي، كارشناسي ارشد و دکتری در رشته مهندسی برق گرایش کنترل بهترتیب در دانشگاههای علم و صنعت، تهران و خواجه نصیرالدین طوسی گذرانده و هماكنون استادیار دانشكده مهندسي برق
دانشگاه شهید بهشتی ميباشد. زمينههاي تحقيقاتي مورد علاقه ايشان عبارتند از: کنترل دادهمحور، کنترل نظارتی کلیدزن، کنترل تطبیقی و کنترل تحت شبکه.