Manuscript ID : 1401100440550 Visit : 3552 Page: 229 - 242

Article Type: Original Research

Data-Driven Sliding Mode Control Based on Projection Recurrent Neural Network for HIV Infection: A Singular Value Approach

Subject Areas : electrical and computer engineering

Ashkan Zarghami ¹ , mehdi Siahi ² , Fereidoun Nowshiravan Rahatabad ³

1 - 1Department of Electrical Engineering, Central Tehran Branch, Islamic Azad University
2 - Islamic Azad University Science and Research Branch
3 - Department of Biomedical Engineering, Science and Research Branch, Islamic Azad University, Tehran, Iran

Received: 2022-12-25 Accepted : 2024-03-13 Published : 2024-03-17

Keywords: Data-driven sliding mode control, local dynamic linearization, projection recurrent neural network, singular value approach, HIV infection,

Abstract :

In the present study, drug treatment of HIV infection is investigated using a Data-Driven Sliding Mode Control (DDSMC) combined with a Projection Recurrent Neural Network (PRNN). The major objective is to establish the control law that eliminates the need for HIV infection mathematical formulae and ensures that the physical limits of the actuator are reached. This is accomplished by creating the concepts of model-free adaptive control, in which the relation between input and output is described using local dynamic linearized models based on quasi-partial derivatives. To determine the DDSMC law, a performance index is first defined based on the fulfillment of a discrete-time exponential reaching condition. By turning this index into a quadratic programming problem, the dynamics of the PRNN are extracted based on projection theory. The closed-loop system is explicitly determined using the optimizer output equation and the closed-loop stability analysis is evaluated using the singular value approach. The simulation results reveal that the proposed algorithm has robust performance in conducting the state variables of HIV infection to the healthy equilibrium point in the face of model uncertainty and external disturbances when compared to one of the newest control techniques.

References:

[1] R. V. Culshaw, S. Ruan, and R. J. Spiteri, "Optimal HIV treatment by maximising immune response," J. of Mathematical Biology, vol. 48, no. 5, pp. 545-562, 2004.
[2] D. Y. Lu, H. Y. Wu, N. S. Yarla, B. Xu, J. Ding, and T. R. Lu, "HAART in HIV/AIDS treatments: future trends," Infectious Disorders-Drug Targets, vol. 18, no. 1, pp. 15-22, 2018.
[3] A. Sharafian, A. Sharifi, and W. Zhang, "Fractional sliding mode based on RBF neural network observer: application to HIV infection mathematical model," Computers & Mathematics with Applications, vol. 79, no. 11, pp. 3179-3188, 1 Jun. 2020.
[4] Z. Zhang, J. Zhang, F. Cheng, and F. Liu, "A novel stability criteria of a class nonlinear fractional-order HIV-1 system with multiple delay," International J. of Control, Automation and Systems, vol. 17, no. 9, pp. 2274-2283, Sept. 2019.
[5] R. S. Butt, I. Ahmad, R. Iftikhar, and M. Arsalan, "Integral backstepping and synergetic control for tracking of infected cells during early antiretroviral therapy," IEEE Access, vol. 7, pp. 69447-69455, 2019.
[6] H. Jahanshahi, "Smooth control of HIV/AIDS infection using a robust adaptive scheme with decoupled sliding mode supervision," The European Physical J. Special Topics, vol. 227, no. 7, pp. 707-718, 2018.
[7] A. J. Anelone and S. K. Spurgeon, "Prediction of the containment of HIV infection by antiretroviral therapy-a variable structure control approach," IET Systems Biology, vol. 11, no. 1, pp. 44-53, Feb. 2017.
[8] P. S. Rivadeneira and C. H. Moog, "Impulsive control of single-input nonlinear systems with application to HIV dynamics," Applied Mathematics and Computation, vol. 218, no. 17, pp. 8462-8474, 1 May 2012.
[9] Y. Pei, N. Shen, J. Zhao, Y. Yu, and Y. Chen, "Analysis and simulation of a delayed HIV model with reaction-diffusion and sliding control," Mathematics and Computers in Simulation, vol. 212, pp. 382-405, Oct. 2023.
[10] D. Shi, S. Ma, and Q. Zhang, "Sliding mode dynamics and optimal control for HIV model," Mathematical Biosciences and Engineering, vol. 20, no. 4, pp. 7273-7297, 13 Feb. 2023.
[11] A. Izadbakhsh, A. A. Kalat, and S. Khorashadizadeh, "Observer-based adaptive control for HIV infection therapy using the Baskakov operator," Biomedical Signal Processing and Control, vol. 65, Article ID: 102343, Mar. 2021.
[12] N. H. Jo, "Robust drug treatment for HIV-1 infection model with completely unknown parameters," International J. of Control, Automation and Systems, vol. 17, no. 12, pp. 3113-3121, Dec. 2019.
[13] Y. Ding, Z. Wang, and H. Ye, "Optimal control of a fractional-order HIV-immune system with memory," IEEE Trans. on Control Systems Technology, vol. 20, no. 3, pp. 763-769, May 2011.
[14] H. D. Kwon, J. Lee, and S. D. Yang, "Optimal control of an age-structured model of HIV infection," Applied Mathematics and Computation, vol. 219, no. 5, pp. 2766-2779, Nov. 2012.
[15] H. Wang, et al., "A Caputo-Fabrizio fractional-order model of HIV/AIDS with a treatment compartment: sensitivity analysis and optimal control strategies," Entropy, vol. 23, no. 5, Article ID: e23050610, 2021.
[16] E. A. Hernandez-Vargas, P. Colaneri, and R. H. Middleton, "Optimal therapy scheduling for a simplified HIV infection model," Automatica, vol. 49, no. 9, pp. 2874-2880, Sept. 2013.
[17] A. E. Abharian, S. Z. Sarabi, and M. Yomi, "Optimal sigmoid nonlinear stochastic control of HIV-1 infection based on bacteria foraging optimization method," Biomedical Signal Processing and Control, vol. 10, pp. 184-191, Mar. 2014.
[18] P. Di Giamberardino and D. Iacoviello, "LQ control design for the containment of the HIV/AIDS diffusion," Control Engineering Practice, vol. 77, pp. 162-173, Aug. 2018.
[19] N. A. Reisi, S. H. Lakmesari, M. J. Mahmoodabadi, and S. Hadipour, "Optimum fuzzy control of human immunodeficiency virus type1 using an imperialist competitive algorithm," Informatics in Medicine Unlocked, vol. 16, Article ID: 100241, 2019.
[20] M. H. A. Biswas, M. M. Haque, and U. K. Mallick, "Optimal control strategy for the immunotherapeutic treatment of HIV infection with state constraint," Optimal Control Applications and Methods, vol. 40, no. 4, pp. 807-818, Jul./Aug. 2019.
[21] S. B. Chen, et al., "Antiretroviral therapy of HIV infection using a novel optimal type-2 fuzzy control strategy," Alexandria Engineering J., vol. 60, no. 1, pp. 1545-1555, Feb. 2021.
[22] E. Shamsara, Z. Afsharnezhad, and S. Effati, "Optimal drug control in a four‐dimensional HIV infection model," Optimal Control Applications and Methods, vol. 41, no. 2, pp. 469-486, Mar./ Apr. 2020.
[23] T. Jang, H. D. Kwon, and J. Lee, "Free terminal time optimal control problem of an HIV model based on a conjugate gradient method," Bulletin of Mathematical Biology, vol. 73, no. 10, pp. 2408-2429, Oct. 2011.
[24] P. Di Giamberardino and D. Iacoviello, "HIV infection control: a constructive algorithm for a state-based switching control," International J. of Control, Automation and Systems, vol. 16, no. 3, pp. 1469-1473, Jun. 2018.
[25] F. Sun and K. Turkoglu, "Estimation of CD4+T cell count parameters in HIV/AIDS patients based on real-time nonlinear receding horizon control," International J. of Control, Automation and Systems, vol. 16, no. 4, pp. 1805-1813, Aug. 2018.
[26] G. Pannocchia, M. Laurino, and A. Landi, "A model predictive control strategy toward optimal structured treatment interruptions in anti-HIV therapy," IEEE Trans. on Biomedical Engineering, vol. 57, no. 5, pp. 1040-1050, May 2010.
[27] D. Kinderlehrer and G. Stampacchia, An Introduction to Variational Inequalities and Their Applications, Society for Industrial and Applied Mathematics, 2000.
[28] Q. Liu and J. Wang, "A one-layer recurrent neural network with a discontinuous activation function for linear programming," Neural Computation, vol. 20, no. 5, pp. 1366-1383, May 2008.
[29] Y. Xia and J. Wang, "A bi-projection neural network for solving constrained quadratic optimization problems," IEEE Trans. on Neural Networks and Learning Systems, vol. 27, no. 2, pp. 214-224, Feb. 2015.
[30] A. Golbabai and S. Ezazipour, "A projection-based recurrent neural network and its application in solving convex quadratic bilevel optimization problems," Neural Computing and Applications, vol. 32, no. 8, pp. 3887-3900, Apr. 2020.
[31] Y. Xia, J. Wang, and W. Guo, "Two projection neural networks with reduced model complexity for nonlinear programming," IEEE Trans. on Neural Networks and Learning Systems, vol. 31, no. 6, pp. 2020-2029, Jun. 2019.
[32] Y. Yang and X. Xu, "The projection neural network for solving convex nonlinear programming," in Proc. Int. Conf. on Intelligent Computing, Springer, pp. 174-181, Qingdao, China, 21-24 Aug. 2007.
[33] Q. Liu and J. Wang, "A projection neural network for constrained quadratic minimax optimization," IEEE Trans. on Neural Networks and Learning Systems, vol. 26, no. 11, pp. 2891-2900, Nov. 2015.
[34] Y. Zhang, S. Chen, S. Li, and Z. Zhang, "Adaptive projection neural network for kinematic control of redundant manipulators with unknown physical parameters," IEEE Trans. on Industrial Electronics, vol. 65, no. 6, pp. 4909-4920, Jun. 2017.
[35] M. Yang, Y. Zhang, and H. Hu, "Posture coordination control of two-manipulator system using projection neural network," Neurocomputing, vol. 427, pp. 179-190, Feb. 2021.
[36] Z. Li, H. Xiao, C. Yang, and Y. Zhao, "Model predictive control of nonholonomic chained systems using general projection neural networks optimization," IEEE Trans. on Systems, Man, and Cybernetics: Systems, vol. 45, no. 10, pp. 1313-1321, Oct. 2015.
[37] N. H. Jo and Y. Roh, "A two-loop robust controller for HIV infection models in the presence of parameter uncertainties," Biomedical Signal Processing and Control, vol. 18, pp. 245-253, Apr. 2015.
[38] H. Shim, N. H. Jo, H. Chang, and J. H. Seo, "A system theoretic study on a treatment of AIDS patient by achieving long-term non-progressor," Automatica, vol. 45, no. 3, pp. 611-622, Mar. 2009.
[39] Z. Hou and S. Xiong, "On model-free adaptive control and its stability analysis," IEEE Trans. on Automatic Control, vol. 64, no. 11, pp. 4555-4569, Nov. 2019.
[40] H. Du, X. Yu, M. Z. Chen, and S. Li, "Chattering-free discrete-time sliding mode control," Automatica, vol. 68, pp. 87-91, Jun. 2016.
[41] Y. Xia and J. Wang, "A general methodology for designing globally convergent optimization neural networks," IEEE Trans. on Neural Networks, vol. 9, no. 6, pp. 1331-1343, Nov. 1998.
[42] S. Liu and J. Wang, "A simplified dual neural network for quadratic programming with its KWTA application," IEEE Trans. on Neural Networks, vol. 17, no. 6, pp. 1500-1510, Nov. 2006.
[43] S. Skogestad and I. Postlethwaite, Multivariable Feedback Control: Analysis and Design, New York: Wiley, vol. 2, 2007.
[44] C. D. Meyer, Matrix Analysis and Applied Linear Algebra, vol. 71, SIAM, 2000.
[45] M. J. Mahmoodabadi and S. H. Lakmesari, "Adaptive sliding mode control of HIV-1 infection model," Informatics in Medicine Unlocked, vol. 25, Article ID: 100703, 2021.

Full-Text:

معرفي يک روش جديد خوشه‌يابي خودکار

مقاله پژوهشی

کنترل مد لغزشی مبتنی بر داده مبتنی بر شبکه عصبی بازگشتی
تصویر برای عفونت HIV: یک رویکرد مقدار تکین

اشکان ضرغامی، مهدی سیاهی و فریدون نوشیروان راحت‌آباد

چکیده: در این مقاله، جبران‌سازی عفونت HIV با استفاده از کنترل مد لغزشی مبتنی بر داده در تلفیق با شبکه عصبی بازگشتی تصویر مورد توجه قرار گرفته است. اهداف اصلی تعیین قوانین کنترلی به‌گونه‌ای است که نیازی به معادلات ریاضی عفونت HIV نباشد و محدودیت فیزیکی محرک نیز برآورده شود. این کار با توسعه مبانی کنترل تطبیقی مستقل از مدل صورت می‌گیرد که در آن از خطی‌سازی دینامیکی محلی مبتنی بر تخمین مشتق شبه‌جزئی برای توصیف رابطه بین ورودی و خروجی استفاده می‌شود. برای تعیین قانون کنترل، نخست یک شاخص عملکرد مبتنی بر تحقق شرط دسترسی نمایی زمان گسسته تعریف می‌شود. با تبدیل این شاخص به یک مسئله برنامه‌ریزی مرتبه دو مقید، دینامیک شبکه عصبی بازگشتی تصویر بر اساس نظریه تصویر استخراج می‌شود. به کمک معادله خروجی بهینه‌سازی، دینامیک حلقه بسته به‌صورت صریح تعیین می‌گردد و تحلیل پایداری حلقه بسته به کمک رویکرد مقدار تکین مورد بررسی قرار می‌گیرد. نتایج شبیه‌سازی الگوریتم پیشنهادی در قیاس با یکی از جدیدترین رویکردهای کنترلی، نشان‌دهنده کیفیت بالای الگوریتم در هدایت دینامیک عفونت HIV به نقطه تعادل سالم در حضور عدم قطعیت مدل و اغتشاشات خارجی است.

کلیدواژه: کنترل مد لغزشی مبتنی بر داده، شبکه عصبی بازگشتی تصویر، رویکرد مقدار تکین، عفونت HIV.

1- مقدمه

کنترل بیماری ²HIV یکی از مسائل چالش‌برانگیز در طی چند دهه اخیر است. یکی از مهم‌ترین دلایل جبران‌سازی عفونت HIV، جلوگیری از بروز بیماری ³AIDS است. عدم جبران‌سازی عفونت HIV موجب تضعیف سیستم امینی بدن در گذر زمان شده و برای بیماران مبتلا به AIDS می‌تواند بسیار تهدیدآمیز باشد. در چنین شرایطی، غلظت سلول‌های معیوب به‌تدریج افزایش یافته و این متناظر با کاهش غلظت سلول‌های سالم و افزایش تعداد ویروس‌های آزاد است. بخشی از سلول‌های سالم که عموماً به سلول‌های کمک‌کننده معروف هستند، نقشی حیاتی در حمله به ویروس‌های HIV را بر عهده دارند. این سلول‌ها سیگنال‌هایی را به سلول‌های پاسخ ایمنی برای مقابله با هجوم ویروس‌ها و افزایش سلول‌های معیوب ارسال می‌کنند [1].

عموم تحقیقات انجام‌گرفته در این حوزه معطوف به معرفی مدل‌های تحلیلی در چارچوب ریاضیاتی با هدف توسعه تکنیک‌های درمانی مؤثر است. یکی از مهم‌ترین رویکردهای تحلیلی برای توصیف مبتنی بر درمان HIV، درمان ضد رتروویروسی بسیار فعال ⁴(HAART) می‌باشد که
در آن از مهارکننده‌های ترانس کریپتاز معکوس ⁵(RTI) برای مهار معکوس فعالیت ترانس کریپتاز و جلوگیری از انتقال سلول به سلول و مهارکننده‌های پروتئاز ⁶(PI) برای مهار تولید ویروس پیش‌سازه‌ای پروتئین و جلوگیری از تولید ویریون‌ها توسط سلول‌های آلوده استفاده می‌شود. در این داروی ترکیبی، RTI برای کاهش نرخ عفونت سلول‌های سالم از ویروس‌های آزاد و PI برای کاهش رشد سلول‌های ویروسی از سلول‌های معیوب استفاده می‌شود [2].

با کنترل مؤثر تزریق دارو می‌توان به‌طور غیرمستقیم، غلظت سلول‌های سالم در پلاسمای خون را با کاهش نرخ عفونت افزایش داد که این کار منجر به کاهش غلظت سلول‌های ویروسی در پلاسمای خون می‌شود. در طول یک دهه اخیر، برنامه‌های کنترلی متعددی مبتنی بر مدل ریاضیاتی HIV با مرتبه‌های مختلف برای دست‌یابی به شیوه درمانی مؤثر مبتنی بر تزریق صحیح دارو توسعه یافته و در عموم تحقیقات انجام‌شده، قابلیت اندازه‌گیری غلظت سلول‌های سالم ضروری است؛ در حالی که غلظت سلول‌های معیوب و تعداد ویروس‌های آزاد می‌تواند به شیوه‌ای مناسب تخمین زده شود.

مدل دینامیکی عفونت HIV ماهیتی غیرخطی داشته و شامل عدم قطعیت پارامتری یا غیرپارامتری است. تکنیک‌های کنترل فیدبک غیرخطی از جمله راهکارهای درمان مؤثر این عفونت به‌ویژه در حضور عدم قطعیت‌های مدل هستند. در [3] از یک رؤیتگر مد لغزشی در تلفیق با شبکه عصبی تابع پایه شعاعی برای تخمین بخش غیرخطی دینامیک مرتبه کسری عفونت HIV استفاده شده است. شرط پایداری رؤیتگر به کمک تئوری لیاپانوف تعیین گردیده و الگوریتم ارائه‌شده قادر به تضمین پایداری زمان محدود است. در [4]، دینامیک HIV به‌صورت معادلات دیفرانسیل مرتبه کسری توصیف شده است. تحلیل پایداری مجانبی با استفاده تکنیک لیاپانوف- کراووسکی با و بدون تأخیر متغیر با زمان انجام شده است.

در [5] با تعریف متغیر ماکرو مبتنی بر سیگنال‌های خطا، قانون کنترل کمکی برای کاهش بار ویروس به‌دست آمده و به‌علاوه، کنترل پسگام انتگرالی برای جبران‌سازی سلول‌های ویروسی نیز طراحی شده است؛ به‌طوری که پایداری نمایی سیستم حلقه بسته تضمین می‌شود. اما مسئله قوام سیستم نسبت به عدم قطعیت یا اغتشاشات خارجی مورد بررسی
قرار نگرفته است. در [6] از ترکیب کنترل مد لغزشی و کنترل‌کننده PI برای تولید میزان تزریق داروی صحیح به یک مدل HIV مرتبه پنج استفاده شده است. بهره‌های PI به شیوه‌ای تطبیقی و با مقدار لحظه‌ای سطح لغزش به‌روز می‌شوند. قانون کنترل مد لغزشی بر اساس رویکرد تفکیک‌شده و برای چهار متغیر حالت نخست استخراج می‌گردد و برای جبران‌سازی اثرات چترینگ از تکنیک لایه مرزی استفاده شده است. تضمین پایداری حلقه بسته با ترکیب دو الگوریتم کنترلی بحث نشده و رویکرد حذف چترینگ با کاهش دقت عملکردی همراه است.

در [7]، شرط قابل دسترس‌بودن با هدف مهار عفونت HIV به کمک الگوریتم کنترل مد لغزشی مورد بررسی قرار گرفته که این کار با یافتن شرط وجود مد لغزشی بر اساس متغیرهای حالت HIV صورت گرفته است. سپس به کمک داده‌های آزمایشگاهی، پارامترهای مجهول شرط مذکور به کمک تکنیک درون‌یابی مکعبی تکه‌ای خطی تخمین زده می‌شوند. در [8]، مدل دینامیکی HIV به‌صورت یک سیستم کنترل ضربه‌ای با تحقق شروط دسترسی‌پذیری و کنترل‌پذیری توصیف شده است. سپس از تکنیک خطی‌سازی ضربه‌ای برای استخراج قانون کنترل فیدبک ضربه‌ای، استفاده و شرایط لازم و کافی برای تضمین پایداری حلقه بسته تعیین شده است.

در [9]، یک مدل واکنش ایمنی (انتشار تأخیری ویروس) برای بررسی استفاده از کنترل لغزشی و چندپایداری در تنظیم اثر درمانی HIV پیشنهاد گردیده است. این مقاله وجود و ثبات تعادل‌ها، انشعاب فضایی Hopf، دامنه لغزشی و دوشاخه‌های گره مرزی را بررسی می‌کند. سپس از طریق شبیه‌سازی‌ها، اثرات آستانه درمانی، دامنه لغزشی و چندپایداری بر درمان HIV، ارزیابی و آستانه درمانی مناسب برای بیماران آلوده با پارامترهای فیزیولوژیکی مشخص تعیین شده است.

در [10]، مدلی ریاضی برای دینامیک و کنترل انتقال HIV ارائه گردیده که بر این اساس، رویکردی آستانه‌ای برای کنترل سلول‌ها و ویروس‌های آلوده پیشنهاد شده است؛ به‌طوری که تعداد کل سلول‌های آلوده بدن از حد آستانه تحمل معینی فراتر نرود. همچنین یک استراتژی کنترل بهینه برای به‌حداقل‌رساندن غلظت سلول‌ها و ویروس‌های آلوده
با حداقل هزینه کنترلی معرفی گردیده است. نوآوری اصلی این مقاله توسعه یک تابع کنترل تکه‌ای خطی برای مدل HIV با انتقال سلول به سلول، تجزیه و تحلیل دینامیک حالت لغزشی و نشان‌دادن اثربخشی استراتژی‌های کنترلی از طریق شبیه‌سازی‌های عددی است.

عموم روش‌های فیدبک غیرخطی ارائه‌شده به مدل ریاضیاتی HIV کاملاً وابسته هستند و نیاز به آگاهی از پارامترهای توصیف‌کننده مدل دارند؛ در حالی که این پارامترها از شخصی به شخص دیگر متفاوت است. به‌علاوه، مسائلی چون محدودیت سیگنال کنترلی و حداقل هزینه کنترلی بررسی نشده‌اند.

یکی از تکنیک‌های مورد استفاده برای جبران‌سازی عفونت HIV، استفاده از تکنیک خطی‌سازی ورودی- خروجی برای تعیین قانون کنترل به شیوه‌ای تحلیلی است. در عموم این رویکردها، قانون فیدبک خروجی در تلفیق با یک رؤیتگر حالت برای تخمین متغیرهای حالت غیرقابل اندازه‌گیری به‌دست می‌آید. در [11] ابتدا به کمک تکنیک خطی‌سازی ورودی- خروجی، دینامیک اصلی به مدل فضای حالت جدید شامل عدم قطعیت تبدیل می‌شود. سپس یک رؤیتگر حالت مبتنی بر عملگر بسکاکو⁷ با هدف تخمین متغیرهای حالت غیرقابل اندازه‌گیری طراحی شده است. ترم عدم قطعیت به کمک تعدادی توابع پایه به فرم رگرسیون توصیف می‌شود که در آن ضرایب مجهول به شیوه‌ای تطبیقی به‌روز می‌شوند. نشان داده شده که این رؤیتگر، کران‌داری نهایتاً یکنواخت را تضمین می‌کند. قانون کنترل به کمک تخمین ترم بردار حالت و ترم عدم قطعیت تعیین می‌شود.

در [12] ابتدا کنترل نامی مبتنی بر تکنیک خطی‌سازی فیدبک برای یک مدل مرتبه سه HIV استخراج می‌شود. سپس با فرض دراختیارداشتن غلظت ویروس، متغیرهای حالت به کمک یک رؤیتگر حالت غیرخطی تخمین زده می‌شوند و نهایتاً از یک جبران‌ساز اغتشاش برای مواجهه با عدم قطعیت‌های پارامتری استفاده شده است. شرایط پایداری حلقه بسته به کمک نظریه اختلال تکین مورد بررسی قرار گرفته است. حساسیت
به تغییرات مدل در رویکردهای مبتنی بر خطی‌سازی بالاست و وابستگی به ماهیت تغییرپذیر نقاط تعادل عفونت HIV نیز چالشی مهم به شمار می‌آید. به‌علاوه، تضمین کران‌داری سیگنال کنترلی به شیوه‌ای تحلیلی بحث نشده است.

مهم‌ترین و پرکاربردترین روش کنترلی برای تزریق مؤثر دارو و جبران‌سازی عفونت HIV، رویکردهای مبتنی بر کنترل بهینه هستند. اساس طراحی، تعریف یک شاخص عملکرد مناسب بر مبنای اهداف عملکردی از پیش تعیین‌شده و کمینه‌سازی آن با روشی مناسب است. در [13] با هدف کمینه‌کردن مقادیر سلول‌های معیوب و ویروس‌های آزاد و حداقل هزینه کنترلی در یک بازه زمانی محدود، یک شاخص عملکرد تعریف شده است. با استخراج شرایط بهینگی، قانون کنترل به شیوه‌ای بازگشتی و با حل دسته‌ای از معادلات جبری تعیین می‌شود. رویکرد حل مسئله بهینه زمان‌بر بوده و با پیچیدگی زیادی همراه است. در [14] شاخص عملکردی با هدف کمینه‌سازی هزینه کنترل و جمعیت ویروس‌ها، تعریف و شرایط بهینگی به کمک مقادیر مرزی استخراج شده است. سپس دینامیک بهینه به کمک تکنیک گسسته‌سازی به‌دست آمده و جواب بهینه به کمک اصل حداقل پونتریاگین تعیین شده است. مشکل اساسی این روش، عدم ارائه روشی سامانمند برای حل مسئله بهینه‌سازی و پیچیدگی حل آن است.

در [15]، یک استراتژی کنترل بهینه برای مدل مرتبه کسری HIV با یک بخش درمان ارائه شده است. ابتدا شرایط لازم برای کنترل بهینه بیماری با استفاده از کنترل میزان تماس افراد مستعد و عفونی، کنترل میزان ART جمعیت بخش تحت درمان و کنترل میزان تغییرات در عادات جنسی افراد مستعد به‌دست آمده است. سپس شبیه‌سازی‌های لازم برای چهار استراتژی با استفاده از یک طرح کسری سه‌مرحله‌ای آدامز- باشفورث انجام شده است. نتایج شبیه‌سازی‌ها نشان می‌دهند که بهترین استراتژی، استفاده از تمامی تلاش‌های کنترلی به‌طور همزمان است. کنترل‌کننده بهینه پیشنهادشده در کنترل بیماری مؤثر بوده و می‌تواند در مطالعات آینده به یک کنترل‌کننده حلقه بسته تبدیل شود تا عملکرد آن در مقابله با خطاهای مدل‌سازی، عدم قطعیت‌ها و اختلالات خارجی افزایش یابد.

در [16] مدل دینامیکی HIV به‌صورت یک سیستم سوئیچ‌شده، توصیف ‌و ثابت می‌شود که قانون کنترل بهینه یکتایی مبتنی بر جواب بهینه پونتریاگین وجود دارد. سپس شرایط وجود جواب بهینه بررسی گردیده و نشان داده می‌شود که هر جواب، معرف یک مد لغزشی است. همچنین فضای نامتغیر مثبت متناظر با جواب پونتریاگین، تعیین و در نتیجه، قانون کنترل بهینه کلیدزنی استخراج شده است. رویکرد ارائه‌شده با درنظرگرفتن فرضیات محدودکننده زیادی توسعه یافته و ممکن است که منجر به بروز چترینگ شود.

در [17] قانون کنترل بهینه با هدف اجتناب سلول‌های معیوب از تولید ذرات ویروس با تعریف شاخص عملکرد انتگرالی به‌دست آمده است. سیگنال کنترلی، ماهیتی غیرخطی با پارامترهای تصادفی دارد که متغیرهای آن به کمک الگوریتمی بازگشتی مبتنی بر ارزیابی مونت‌کارلو تعیین می‌شوند. روش ارائه‌شده قادر به جبران‌سازی HIV در حضور عدم قطعیت پارامتری است. در [18] از شاخص عملکرد خطی مرتبه دو برای تعیین قوانین کنترل بهینه مدل مرتبه پنج HIV استفاده شده است. برای حل مسئله بهینه‌سازی، ابتدا دینامیک اصلی حول نقطه تعادل خطی خود خطی شده و سپس کنترل فیدبک بهینه با حل مسئله ردیابی ⁸LQ به‌دست می‌آید. متغیر غیرقابل دسترس دینامیک خطی‌شده به کمک یک رؤیتگر حالت تخمین زده می‌شود. در [19] جبران‌سازی دینامیک عفونت HIV به کمک کنترل فازی مبتنی بر موتور استنتاج ضرب، فازی‌گر تکین و فازی‌زدای میانگین مرکز انجام شده است. با تعریف تابع هدف مناسب، متغیرهای طراحی سیستم فازی به کمک الگوریتم رقابت امپریالیستی به‌صورت بهینه تعیین می‌شوند. قانون کنترل نهایی معرف مجموع وزن‌دار خروجی‌های سیستم فازی است. در [20] شاخص عملکرد انتگرالی با هدف بیشینه‌سازی تعداد سلول‌های سالم و حداقل‌کردن هزینه کنترلی متناظر با مقدار بهینه تزریق دارو تعریف گردیده است. شرایط بهینگی به کمک تابع همیلتونیان و اصل حداکثر، تعیین و تحلیل مسئله بهینه در حضور محدودیت حالت انجام شده است. نهایتاً قوانین کنترل بهینه با درنظرگرفتن تعدادی فرض محدودکننده استخراج شده‌اند.

در [21]، یک استراتژی جدید بهینه کنترل فازی نوع 2 برای درمان ضد رتروویروسی عفونت HIV پیشنهاد شده است. سیستم کنترلی برای افزایش تعداد سلول‌های سالم، کاهش تعداد سلول‌ها و ویروس‌های آلوده و درنظرگرفتن عواملی مانند هزینه دارو، عوارض جانبی و اهمیت سرعت درمان طراحی گردیده است. در این مقاله همچنین استراتژی‌های کنترل مختلفی که برای سیستم‌های ایمنی HIV اعمال شده‌اند، از جمله کنترل پسگام، کنترل بهینه و کنترل‌کننده‌های فازی مورد بحث قرار گرفته‌اند.

در [22] ابتدا تحلیل پایداری مدل بدون درمان HIV بر اساس نقاط تعادل سیستم بررسی شده و سپس از تکنیک دوشاخه‌شدن و اصل حداقل پونتریاگین برای استخراج قوانین کنترلی استفاده گردیده است. این کار با بررسی شرط وجود دوشاخگی حول یک نقطه تعادل پارامتری انجام گرفته است. در [23] بر روی مسئله کنترل ردیابی بهینه مدل مرتبه شش HIV تمرکز شده و ابتدا شاخص عملکرد مناسب، تعریف و شرایط کافی برای بهینگی سیستم بررسی گردیده است. سپس با تعریف تابع لاگرانژ و شرط وجود زمان ترمینال بهینه، قانون کنترل نهایی استخراج شده است. در [24] قوانین کنترلی با معرفی یک شاخص عملکرد انتگرالی به‌دست می‌آیند که هدف اصلی در آن، کمینه‌سازی تعداد سلول‌های معیوب است. به‌منظور کاهش پیچیدگی ناشی از توابع وابسته به حالت، فضای حالت به نواحی‌ای با توابع ثابت تکه‌ای خطی متعلق به هر ناحیه پارتیشن‌بندی می‌شود. متغیر تأثیرگذار در هر ناحیه، تعداد سلول‌های معیوب است. سپس شرایط بهینگی شاخص عملکرد به کمک اصل همیلتونیان، بررسی و جواب کنترلی بهینه در بازه زمانی محدود تعیین شده است.

در [25] با درنظرگرفتن مدل دینامیکی HIV به‌عنوان سیستم راه‌انداز، یک سیستم پاسخ کنترل‌شونده تعریف شده و سپس با تعریف خطای هم‌زمان‌سازی بین دو سیستم، قانون تطبیق پارامترهای نامعلوم به‌دست آمده است. قانون کنترل به کمک تکنیک کنترل افق رو به عقب غیرخطی زمان حقیقی تعیین می‌شود. این کار با تعریف یک شاخص عملکرد انتگرالی و حل آن به کمک تابع همیلتونیان و استخراج شرایط بهینگی انجام می‌گیرد. نهایتاً از روش جاروب رو به عقب برای یافتن جواب بهینه استفاده شده است. در [26] از کنترل مدل پیش‌بین برای تعیین قانون کنترل بهینه عفونت HIV استفاده گردیده است. ابتدا با تعریف متغیرهای حالت، مدل بسط‌یافته استخراج می‌شود و سپس مسئله کنترل بهینه افق محدود با درنظرگرفتن محدودیت کنترلی معرفی شده است. تعیین جواب بر مبنای تکنیک وقفه‌های درمانی ساختاریافته صورت می‌گیرد که به‌طور قابل توجهی موجب بهبود مصونیت نسبت به HIV می‌شود. مهم‌ترین مشکل رویکردهای کنترل بهینه در ادبیات موضوع، وابستگی صریح آنها به دینامیک HIV است؛ به‌طوری که وجود جواب بهینه در صورت تغییر پارامترهای توصیف‌کننده HIV یا بروز عدم قطعیت‌های غیرساختاریافته با دشواری همراه است. به‌علاوه، رویکردی مؤثر برای درنظرگرفتن محدودیت کنترلی ارائه نشده است.

در این مقاله، الگوریتم کنترل بهینه مستقل از مدل مبتنی بر تکنیک خطی‌سازی دینامیکی و کنترل مد لغزشی ارائه می‌شود که در آن، قانون کنترل بهینه به کمک شبکه عصبی بازگشتی تصویر به‌عنوان بهینه‌سازی عددی تعیین می‌گردد. این شبکه‌ها بر اساس نظریه نامساوی تغییرات برای حل یک مسئله بهینه‌سازی مقید استخراج می‌شوند [27]. از مهم‌ترین مسائل بهینه‌سازی که توسط PRNNها حل شده‌اند می‌توان به برنامه‌ریزی خطی [28]، برنامه‌ریزی مرتبه دو [29] و [30]، برنامه‌ریزی غیرخطی [31] و [32] و بهینه‌سازی min-max [33] اشاره کرد. به‌علاوه، این شبکه‌ها به‌طور گسترده‌ای در حوزه رباتیک [34] و [35] و کنترل مدل پیش‌بین [36] استفاده شده‌اند. بدین منظور، نخست مدل‌های دینامیکی خطی‌سازی‌شده محلی بر حسب مشتقات شبه‌جزئی به‌عنوان پارامترهای طراحی تنها به کمک داده‌های ورودی و خروجی معرفی می‌شوند و سپس با طرح شاخص عملکرد مناسب، قوانین تطبیق پارامتر به‌دست می‌آیند. در ادامه، شاخص عملکرد کنترلی بر مبنای شروط دسترسی نمایی زمان گسسته، تعریف و به یک مسئله برنامه‌ریزی مرتبه دو مقید تبدیل می‌شود. برای حل ⁹CQP، مدل دینامیکی و جبری ¹⁰PRNN استخراج می‌گردد. تحلیل پایداری حلقه بسته به کمک رویکرد مقدار تکین و با استخراج دینامیک حلقه بسته به کمک معادله خروجی بهینه‌ساز عددی انجام می‌گیرد.

نوآوری‌های الگوریتم پیشنهادی به‌صورت زیر خلاصه می‌شود:

• توسعه کنترل مد لغزشی مبتنی بر خطی‌سازی دینامیکی محلی

• توسعه شبکه عصبی بازگشتی تصویر برای حل آنلاین برنامه‌ریزی مرتبه دو

• تضمین پایداری حلقه بسته به کمک رویکرد مقدار تکین

• عدم وابستگی به مدل ریاضیاتی عفونت HIV

• استخراج قانون کنترل بهینه مبتنی بر داده‌های ورودی- خروجی

جدول 1: مقادیر عددی پارامترهای HIV [37].

پارامتر	مقدار
	295
	182/0
	00000389/0
	02/1
	5890
	24

• درنظرگرفتن حداقل هزینه کنترلی

ساختار مقاله به این شرح است که در بخش دوم، مدل تحلیلی HIV معرفی و عملکرد آن حول نقاط تعادل خود بررسی می‌شود. بخش سوم شامل توصیف عفونت HIV بر حسب مدل‌های خطی‌سازی محلی، طرح مسئله کنترل مد لغزشی بهینه با تشکیل یک مسئله برنامه‌ریزی مرتبه دو مقید و حل آن به کمک PRNN است. تحلیل پایداری حلقه بسته در بخش چهارم آمده و نتایج شبیه‌سازی و نتیجه‌گیری به ترتیب در بخش‌های پنجم و ششم مطرح می‌شوند.

2- مدل ریاضی عفونت HIV

مدل دینامیکی درمان عفونت HIV به کمک معادلات دیفرانسیلی زیر قابل توصیف است [37]

(1)

که در آن ، و به ترتیب معرف غلظت سلول‌های T سالم، غلظت سلول‌های T معیوب و غلظت ذرات ویروس‌های آزاد هستند. پارامتر و به‌ترتیب معرف نرخ تولید و نرخ مرگ طبیعی سلول‌های سالم می‌باشند. به‌علاوه، سلول‌های سالم هنگام اندرکنش با ویروس‌ها با نرخ آلوده می‌شوند؛ سلول‌های معیوب با نرخ می‌میرند و ذرات ویروس با نرخ ایجادشده و با نرخ از بین می‌روند.

مقادیر نامی پارامترهای HIV در جدول 1 آمده است. این پارامترها بر اساس داده‌های مربوط به آزمایش‌های بالینی به شیوه‌ای مناسب تخمین زده شده‌اند.

مطابق با (1)، دو نوع متفاوت داروی ضد ویروسی برای درمان عفونت HIV شامل RTI و PI در نظر گرفته می‌شود. تزریق این دارو در معادلات دینامیکی با متغیرهای و بیان شده که مقادیری بین صفر و یک را اختیار می‌کنند. در واقع مقادیر صفر و یک به ترتیب به معنی بدون دارو و داروی کامل هستند. داروی RTI با جلوگیری از رونویسی معکوس HIV منجر به مهار ویروس در آلوده‌کردن سلول‌های جدید می‌شود؛ در حالی که داروی PI با مهار آنزیم‌های پروتئاز ویروسی، از قطع زنجیره‌های پروتئینی که منجر به تولید ذرات ویروس غیرعفونی می‌شوند، ممانعت می‌کند.

نکته 1: از آنجا که داروی PI دینامیک ویروس را تحت تأثیر قرار می‌دهد، نیاز به مدل دقیق‌تر و کامل‌تری از دینامیک ذرات ویروس آزاد برای استفاده از این نوع دارو است. به همین دلیل در بسیاری از تحقیقات، تنها داروی RTI به‌عنوان سیگنال کنترلی در نظر گرفته شده و از داروی PI صرف نظر می‌شود و به عبارت دیگر است [38]؛ در نتیجه، دینامیک عفونت HIV به‌صورت زیر بازنویسی می‌شود

(2)

برای توسعه برنامه کنترلی، نخست لازم است که نقاط تعادل دینامیک عفونت HIV وقتی هیچ درمان دارویی وجود ندارد، تعیین شود. این کار با حل معادلات جبری در شرایط حالت دائم انجام می‌گیرد که در آن، نرخ تغییرات متغیرهای حالت صفر است. در این صورت (2) به‌صورت زیر خلاصه می‌شود

(3)

که ، و به ترتیب مقدار حالت دائم غلظت سلول‌های سالم، غلظت سلول‌های معیوب و غلظت ذرات ویروس آزاد هستند. به‌علاوه مقدار حالت دائم سیگنال کنترلی است. با حل معادلات جبری (3)، نقاط تعادل عفونت HIV به‌صورت زیر هستند

(4)

مطابق با (4)، دینامیک داخلی عفونت HIV شامل دو نقطه تعادل سالم و معیوب است. بر اساس مقادیر عددی پارامترهای HIV، نقاط تعادل برابر با و هستند. بدیهی است که هدف اصلی، هدایت متغیرهای حالت عفونت HIV به سمت نقطه تعادل سالم از هر شرایط اولیه است. این به معنی تزریق بهینه دارو به کمک یک برنامه کنترلی مناسب با هدف دست‌یابی به حداکثر غلظت سلول‌های سالم و حداقل غلظت سلول‌های معیوب و ذرات ویروس آزاد است.

نقطه تعادل معیوب به وضعیتی اطلاق می‌شود که در آن، ویروس HIV به‌طور مداوم در جمعیت حضور دارد و بدن نمی‌تواند به‌طور کامل
با آن مبارزه کند. این وضعیت ممکن است که به علت عدم اثربخشی درمان‌های موجود، مقاومت به داروها، نقض تطابق درمانی یا دلایل دیگری باشد. نقطه تعادل معیوب می‌تواند انتشار بیماری را بیشتر کند و موجب افزایش میزان ابتلا به HIV در جمعیت‌های مختلف شود.

رفتار حلقه باز دینامیک عفونت HIV به ازای شرایط اولیه مختلف در شکل 1 نشان داده است. با توجه به شکل، دینامیک داخلی HIV ماهیتاً تمایل به همگرایی به نقطه تعادل معیوب دارد. این نشان‌دهنده لزوم طراحی یک سیستم کنترلی با هدف تزریق کارآمد دارو برای هدایت متغیرهای حالت HIV به سمت نقطه تعادل سالم است.

3- کنترل مد لغزشی تطبیقی مستقل از داده

در این بخش، مراحل تعیین قانون کنترل مد لغزشی بهینه مقید بر مبنای رویکرد کنترل تطبیقی مستقل از مدل و شبکه عصبی بازگشتی تصویر ارائه می‌شود. الگوریتم پیشنهادی به‌طور کلی از پنج بخش اساسی زیر تشکیل گردیده است:

• معرفی مدل‌های داده خطی‌سازی‌شده دینامیکی

• تخمین مشتقات شبه‌جزئی به شیوه‌ای بازگشتی

• تعریف شاخص عملکرد با هدف تحقق شرط دسترسی نمایی

شکل 1: همگرایی متغیرهای حالت HIV به نقطه تعادل معیوب به ازای شرایط اولیه مختلف.

• تشکیل مسئله برنامه‌ریزی مرتبه دو مقید

• استخراج مدل دینامیکی و جبری شبکه عصبی بازگشتی تصویر

رویکرد پیشنهادی مستقل از مدل ریاضیاتی عفونت HIV بوده و تنها بر اساس داده‌های ورودی و خروجی، تزریق بهینه دارو را تعیین می‌کند.

3-1 مدل‌های داده خطی‌سازی‌شده دینامیکی

یکی از رویکردهای قدرتمند برای توسعه مدل‌های مبتنی بر داده، کنترل تطبیقی مستقل از مدل است. این روش مبتنی بر استخراج مدل‌های داده خطی‌سازی دینامیکی بر اساس نرخ تغییرات لحظه‌ای ورودی و خروجی می‌باشد. پارامتر اساسی در این مدل‌ها مفهومی به نام مشتق شبه‌جزئی است که تخمین صحیح آن، اهمیت بالایی در توصیف صحیح رفتار یک سیستم دینامیکی دارد.

در حالت کلی، فرض می‌شود که دینامیک عفونت HIV را می‌توان به‌صورت یک سیستم غیرخطی چندخروجی- تک‌ورودی مجهول که وابسته به اطلاعات گذشته ورودی و خروجی است، توصیف کرد. به عبارت دیگر [39]

(5)

که در آن و به‌ترتیب بردار متغیرهای حالت و سیگنال کنترلی، و به‌ترتیب مرتبه‌های نامعلوم خروجی و ورودی و یک تابع غیرخطی نامعلوم است.

فرض 1: مشتق جزئی مؤلفه‌های بردار نسبت به متغیرهای حالت پیوسته است.

فرض 2: مدل دینامیکی (5) شرط لیپشیتز¹¹ تعمیم‌یافته زیر را برای برقرار می‌کند

(6)

و یک ثابت مثبت است و نیز دو متغیر و معرف شبه‌مرتبه‌های سیستم هستند.

با تعریف و با فرض ، و ، دینامیک (5) را می‌توان به فرم مدل دینامیکی مرتبه کامل زیر تبدیل کرد [39]

(7)

و معرف بردار شبه‌گرادیان است. در این مقاله فرض می‌شود که و است و در نتیجه، دینامیک (7) به‌صورت مدل دینامیکی فرم بسته زیر خلاصه می‌شود

(8)

که و معرف مشتق شبه‌جزئی است.

به‌منظور شناسایی صحیح (8)، پارامترهای مشتقات شبه‌جزئی باید به کمک یک الگوریتم تخمین پارامتر مناسب به‌طور لحظه‌ای تعیین شوند. برای این منظور، شاخص عملکرد زیر را در نظر بگیرید

(9)

که معرف نرخ همگرایی است. هدف از کمینه‌سازی رابطه فوق، تخمین صحیح مشتق شبه‌جزئی به‌گونه‌ای است که دینامیک (8) رفتار دینامیک عفونت HIV را به‌درستی توصیف کند.

با فرض ، (9) را می‌توان به‌صورت زیر بازنویسی کرد

(10)

رابطه فوق را می‌توان به‌صورت زیر بسط داد

(11)

با مشتق‌گیری از (11) نسبت به نرخ تغییرات مشتقات شبه‌جزئی داریم

(12)

پس الگوریتم تخمین مشتق شبه‌جزئی معرف رابطه بازگشتی زیر است

(13)

که ثابت‌های مثبت هستند. در ادامه، طرح مسئله کنترل مد لغزشی بهینه مقید بر اساس مدل‌های خطی‌سازی‌شده دینامیکی (8) بیان می‌شود.

3-2 کنترل مد لغزشی بهینه مقید

کنترل مد لغزشی یکی از ابزارهای قدرتمند برای تحقق اهداف عملکردی به‌ویژه در حضور عدم قطعیت مدل و اغتشاشات خارجی است. هدف اصلی در این روش، هدایت متغیرهای حالت از هر شرایط اولیه به روی سطح لغزش و باقی‌ماندن بر روی آن است. این کار با تحقق شرط دسترسی که تضمین‌کننده پایداری حلقه بسته نیز است صورت می‌گیرد. ابتدا سطوح لغزش زیر را در نظر بگیرد

(14)

که در آن معرف مؤلفه‌های بردار نقطه تعادل سالم است. در ادامه، شروط دسترسی نمایی زمان گسسته به‌صورت زیر تعریف می‌شوند [40]

(15)

که در آن زمان نمونه‌برداری و و پارامترهای طراحی مثبت هستند. با جایگذاری (14) در (15) می‌توان نوشت

(16)

که در آن و هستند. از طرفی (16) به کمک (8) به‌صورت زیر بازنویسی می‌شود

(17)

رابطه فوق در فرم بردار ماتریسی به‌صورت زیر خلاصه می‌شود

(18)

که در آن

برای تحقق شرط دسترسی (18) که مبتنی بر مدل خطی‌سازی‌شده دینامیکی است، شاخص عملکرد زیر تعریف می‌شود

(19)

که ماتریس وزنی مثبت معین دلخواه و متغیر مؤلفه وزنی کنترلی است که نقشی اساسی در کنترل دامنه سیگنال کنترلی بر عهده دارد. با کمینه‌سازی رابطه فوق، دو هدف اصلی شامل برآورده‌شدن شرط دسترسی و حداقل هزینه کنترلی برآورده می‌شود. مطابق با (8)، معادله دینامیکی خطی‌سازی برای هر متغیر حالت از مرتبه 1 است و بدان معناست که با محاسبه تفاضلی هر متغیر حالت برای یک گام به جلو می‌توان سیگنال کنترلی را مشاهده کرد. به همین دلیل، سطوح لغزش در (14) تابعی از متغیر حالت در لحظه فعلی هستند؛ به‌گونه‌ای که با محاسبه (15) به سهولت می‌توان سیگنال کنترلی را در (17) مشاهده کرد.

نکته 2: متغیر بهینه‌سازی در شاخص عملکرد (19)، نرخ تغییرات سیگنال کنترلی است که باید در یک فضای مقید تعیین شود. برای نیل به این هدف، اطلاعات لحظه‌ای سطوح لغزش به‌علاوه تخمین مشتقات شبه‌جزئی مورد نیاز است. با بسط (19) خواهیم داشت

(20)

ترم سوم (20) وابستگی صریح به متغیر بهینه‌سازی ندارد و گرادیان آن نسبت به این متغیر صفر است. به‌علاوه، متناظر با تحقق شرط دسترسی، این ترم کمینه شده و در نتیجه با صرف نظر از ترم سوم (20) و تعریف متغیرهای زیر

می‌توان نوشت

(21)

از طرفی با توجه به اینکه سیگنال کنترلی بین صفر و یک است، کران بالا و پایین متغیر بهینه‌سازی به‌صورت زیر تعیین می‌شود

(22)

در نتیجه، شاخص عملکرد کنترلی مقید به‌صورت زیر قابل بیان است

(23)

رابطه (22) برنامه‌ریزی مرتبه دو مقید در فضای بسته است.

نکته 3: مؤلفه وزنی همواره مثبت معین و در نتیجه، متغیر بهینه‌سازی در (22) متعلق به فضایی محدب است. به‌علاوه، تابع که می‌تواند مقادیر مثبت و منفی را اختیار کند، تأثیری بر محدب‌بودن فضای بهینه‌سازی ندارد و موجب آفست در جواب بهینه می‌شود.

باید یادآور شد که مسئله بهینه (23) همواره از ناپایداری عددی اجتناب می‌کند و این به دلیل ضریب وزنی است که باعث غیرصفرشدن می‌شود. برای تعیین جواب بهینه (23) از شبکه عصبی بازگشتی تصویر استفاده می‌گردد که در ادامه به آن اشاره شده است.

3-3 شبکه عصبی بازگشتی تصویر

برای حل عددی برنامه‌ریزی مرتبه دو مقید (23) از الگوریتم‌های بهینه‌سازی مختلفی می‌توان استفاده کرد. عوامل زیادی در انتخاب یک بهینه‌ساز عددی دخالت دارند که از جمله آنها می‌توان به سرعت همگرایی بالا، قابلیت پیاده‌سازی زمان حقیقی و تضمین پایداری داخلی اشاره کرد. شبکه عصبی بازگشتی تصویر به‌عنوان ابزاری قدرتمند برای حل کلاس وسیعی از مسائل مختلف بهینه‌سازی مقید در طول دو دهه اخیر شناخته شده‌اند. آنها ساختار ساده‌ای دارند، به سهولت قابل پیاده‌سازی هستند، عموم آنها از تضمین همگرایی برخوردار بوده و سرعت بالایی در تعیین جواب بهینه دارند. مسئله مهم دیگر اینکه برخی از انواع این شبکه‌ها، ابزاری کنترل‌محور هستند که می‌توانند برای تحلیل پایداری حلقه بسته مورد استفاده قرار بگیرند. بر اساس (24)، تابع هزینه و بردار نامساوی قیود به‌صورت زیر بیان می‌شوند

(24)

بر مبنای شرایط بهینگی ¹²KKT، بردار جواب بهینه (23) در فضای مقید است، اگر و فقط اگر روابط زیر برآورده شوند [41]

(25)

که معرف متغیر تصمیم‌گیری است و نقشی اساسی در برآورده‌شدن قیود کنترلی دارد. با استفاده از (24)، (25) به‌صورت زیر بازنویسی می‌شود

(26)

با تعریف متغیر می‌توان نوشت

(27)

با توجه به نقش متغیر تصمیم‌گیری در فعال‌سازی قیود می‌توان نشان داد که رابطه زیر بین جواب بهینه و متغیر برقرار است [38]

(28)

با تعریف عملگر تصویر زیر برای عددی دلخواه

(29)

رابطه (28) را می‌توان بر مبنای رابطه تصویر زیر توصیف کرد

(30)

هدف عملگر تصویر یافتن برداری در فضای مقید است که نزدیک‌ترین فاصله را با جواب بهینه داشته باشد.

لم 1: جواب بهینه مسئله CQP در (23) است اگر و فقط اگر در رابطه تصویر زیر صدق کند [41]

(31)

که در آن معرف ثابتی دلخواه است. با توجه به (27) و لم 1 می‌توان نتیجه گرفت که جواب بهینه (30) نیز می‌باشد. حال معادله دینامیکی زیر را در نظر بگیرید

(32)

که معرف نرخ همگرایی است. چنانچه دینامیک (32) پایدار مجانبی باشد (یعنی به نقطه تعادل خود همگرا شود)، در این صورت رابطه سمت آن به مبدأ همگرا می‌گردد که بدان معناست که همگرایی مجانبی (32) متناظر با برقراری (31) است. به عبارت دیگر، جواب بهینه CQP با تضمین پایداری مجانبی دینامیک (32) حاصل می‌شود. با توجه به آنکه فرمول‌بندی الگوریتم پیشنهادی در فضای زمان گسسته انجام گرفته است، دینامیک (32) در فرم زمان گسسته زیر می‌تواند توصیف شود

(33)

که در آن است. از طرفی با استفاده از (27)، جواب بهینه کنترلی به‌صورت زیر به‌دست می‌آید

(34)

در نتیجه، مدل دینامیکی و جبری شبکه عصبی بازگشتی تصویر به‌صورت زیر قابل بیان است

(35)

نکته 4: دلیل اصلی نام‌گذاری معادلات فوق به PRNN این است که ایده اصلی توسعه آنها برگرفته از شبکه عصبی هوپفیلد می‌باشد که در آن، یک تابع هزینه مقید یا غیرمقید را می‌توان در قالب تابع انرژی هوپفیلد نوشت. در نتیجه، همواره یک شبکه ‌هوپفیلد وجود دارد که نقاط تعادل آن نشان‌دهنده جواب‌های مسئله بهینه‌سازی مقید یا غیرمقید است. ساختار شبکه‌های PRNN نیز به‌گونه‌ای است که همگرایی به نقاط تعادل آنها متناظر با یافتن جواب بهینه مسئله بهینه‌سازی اولیه است. همچنین باید یادآور شد عملگر تصویر، نقش تابع فعال‌سازی را بر عهده داشته و متغیر حالت شبکه معرف متغیر تصمیم‌گیری برای برآورده‌کردن قیود است.

لم 1: فرض کنید معرف عملگر تصویر در (31) باشد. در این صورت برای متغیر دلخواه ، رابطه زیر بین جواب بهینه و متغیر تصمیم‌گیری بهینه برقرار است [42]

(36)

لم 2: اگر یک مجموعه محدب بسته باشد، نامساوی زیر برای دو متغیر دلخواه برقرار است [42]

(37)

قضیه 1: مدل دینامیکی PRNN در (35) همگرای مجانبی به نقطه تعادل خود است اگر شرط زیر بین نرخ همگرایی شبکه عصبی و مؤلفه وزنی CQP برقرار شود

اثبات: با توجه به اینکه پایدار مجانبی PRNN به معنی همگرایی دینامیک آن به نقطه تعادل خود است، تابع لیاپانوف زیر را در نظر بگیرید

(38)

نرخ تغییرات تابع فوق برابر است با

(39)

با جایگذاری (35) در (38) داریم

(40)

با ساده‌سازی رابطه فوق می‌توان نوشت

(41)

ابتدا با تعریف متغیرهای و ، (37) به‌صورت زیر بازنویسی می‌شود

(42)

به کمک (36) می‌توان نتیجه گرفت

(43)

رابطه فوق را به‌صورت زیر در نظر بگیرید

(44)

رابطه (44) به‌صورت زیر بسط می‌یابد

(45)

بر اساس (34) می‌توان رابطه زیر را نتیجه گرفت

(46)

به کمک (46)، (45) را می‌توان به‌صورت زیر خلاصه کرد

(47)

با کمی تغییرات در (47) می‌توان نوشت

(48)

چنانچه رابطه زیر برقرار شود

(49)

تساوی زیر را می‌توان نتیجه گرفت

(50)

و به این معناست که ؛ بنابراین PRNN با برقراری شرط (49) همگرای مجانبی به نقطه تعادل خود است. رابطه (49) نشان می‌دهد که با انتخاب مقادیر نسبتاً کوچک برای نرخ همگرایی PRNN می‌توان همگرایی مجانبی آن را تضمین کرد. به‌علاوه باید یادآور شد که متناظر با همگرایی متغیر حالت شبکه عصبی به نقطه تعادل خود، خروجی معادله جبری آن یعنی نرخ تغییرات سیگنال کنترلی نیز به مقدار بهینه خود متمایل می‌شود. در ادامه، شرایط پایداری حلقه بسته الگوریتم کنترلی پیشنهادی به کمک رویکرد مقدار تکین برای یک سیستم دینامیکی زمان- گسسته مورد بررسی قرار می‌گیرد.

قضیه 2: دینامیک عفونت HIV در قالب یک سیستم حلقه بسته با مدل دینامیکی فرم بسته (8) و معادلات دینامیکی و جبری PRNN در (35) پایدار داخلی است اگر و فقط اگر شرط زیر بین پارامترهای طراحی برقرار شود

اثبات: با درنظرگرفتن ، دینامیک حلقه بسته عفونت HIV با تلفیق مدل‌های دینامیکی خطی‌سازی به فرم بسته (8) و معادله جبری PRNN در (35) به‌صورت زیر به‌دست می‌آید

(51)

که است. با استفاده از در (20) می‌توان نوشت

(52)

با توجه به (14) می‌توان نوشت

(53)

که بردار نقطه تعادل سالم است؛ بنابراین دینامیک داخلی حلقه بسته پایدار مجانبی است اگر قدر مطلق مقادیر ویژه ماتریس حلقه بسته زیر کمتر از یک شوند

(54)

که معرف بزرگ‌ترین مقدار ویژه یک ماتریس و معرف ماتریس واحد است.

نکته 3: علاوه بر دینامیک داخلی (53)، سه ترم دیگر نیز وجود دارند که باید بررسی شوند. از آنجا که همگرایی مجانبی PRNN ثابت شده است، ترم وابسته به متغیر حالت PRNN به‌طور مجانبی پایدار است. ترم وابسته به بردار نقطه تعادل سالم در شرایط حالت دائم مورد بررسی قرار می‌گیرد و نهایتاً از ترم وابسته عملگر کلیدزنی برای بهبود قوام حلقه بسته استفاده می‌شود.

برای یک ماتریس دلخواه ، رابطه زیر بین بزرگ‌ترین مقدار ویژه آن ، کوچک‌ترین مقدار تکین آن و بزرگ‌ترین مقدار تکین آن برقرار است [43]

(55)

بنابراین (54) به‌صورت زیر بازنویسی می‌شود

(56)

به کمک رابطه زیر

(57)

می‌توان نوشت

(58)

با تعریف ماتریس ، (56) به‌صورت زیر ساده می‌شود

(59)

رابطه زیر برای یک ماتریس دلخواه برقرار است [44]

شکل 2: بلوک دیاگرام کنترل مد لغزشی مستخرج از داده مبتنی بر شبکه عصبی بازگشتی تصویر.

(60)

بنابراین خواهیم داشت

(61)

با توجه به رابطه زیر برای دو ماتریس دلخواه و

(62)

رابطه (61) به‌صورت زیر قابل بیان است

(63)

به کمک رابطه زیر برای دو ماتریس دلخواه و

(64)

رابطه (61) به‌صورت زیر بازنویسی می‌شود

(65)

بر اساس ارتباط بین (61) و (65) می‌توان نتیجه‌گیری کرد که

(66)

با جایگذاری در (66) و درنظرگرفتن و خواهیم داشت

(67)

که در آن یک متغیر اسکالر مثبت است. رابطه فوق نشان می‌دهد که پارامترهای طراحی برای تضمین پایداری داخلی، وابسته به مقدار لحظه‌ای بردار مشتقات شبه‌جزئی وابسته هستند. به‌علاوه چنانچه به اندازه کافی کوچک انتخاب شود، می‌توان نتیجه گرفت شرط پایداری حلقه بسته آن است که انتخاب شود. به عبارت دیگر، مؤلفه وزنی شاخص عملکرد نقش چندانی در تضمین پایداری داخلی عفونت HIV بر اساس مدل‌های دینامیکی خطی‌سازی فرم بسته ندارد. همان طور که از معادله حلقه بسته (53) می‌توان دریافت، ترم کلیدزنی با هدف مواجهه با اثرات عدم قطعیت در نظر گرفته شده و بر این اساس، اگر فرض شود که عدم قطعیت مدل با بردار توصیف گردد، در این صورت می‌توان رابطه زیر را برای جبران‌سازی اثرات عدم قطعیت در نظر گرفت

(68)

با فرض معلوم‌بودن کران بالای مؤلفه‌های عدم قطعیت مدل داریم

(69)

که در آن و کران بالای عدم قطعیت است. با فرض همگرایی مجانبی متغیر حالت شبکه عصبی، معادله حلقه بسته (53) در شرایط حالت دائم به‌صورت زیر بیان می‌شود

(70)

رابطه فوق نشان می‌دهد که الگوریتم پیشنهادی بدون هیچ شرایط خاصی روی پارامترهای طراحی، قادر به حذف خطای حالت و همگرایی متغیرهای حالت به نقطه تعادل سالم می‌شود.

در الگوریتم پیشنهادی، تعیین پارامترهای کنترلی با تحقق شرط پایداری داخلی سیستم حلقه بسته یعنی (54) انجام می‌شود و بدان معناست که نیازی به اثبات پایداری حلقه بسته به شیوه دیگر (مثلاً تعریف تابع لیاپانوف جدید) نیست. همگرایی مجانبی شبکه عصبی نیز به‌عنوان یکی از اجزای اصلی سیستم کنترلی اثبات گردید.

بلوک دیاگرام الگوریتم کنترلی پیشنهادی در شکل 2 آمده که در آن، بلوک مدل‌های دینامیکی خطی‌سازی فرم بسته، نقش تعیین بردار مشتقات شبه‌جزئی را بر عهده دارند. به کمک سطح لغزش، تخمین لحظه‌ای مشتقات شبه‌جزئی و تنظیم صحیح پارامترهای طراحی، قانون کنترل بهینه مقید بر اساس معادلات دینامیکی و جبری PRNN تعیین می‌شود.

4- نتایج شبیه‌سازی

در این بخش، عملکرد الگوریتم پیشنهادی در هدایت متغیرهای حالت دینامیک HIV به سمت نقطه تعادل سالم از دیدگاه‌هایی چون رفتار گذرا و حالت دائم، دامنه تغییرات سیگنال کنترلی و مواجهه با اثرات عدم قطعیت مورد ارزیابی قرار می‌گیرد. همان طور که از تحلیل رفتار حلقه باز سیستم می‌توان دریافت در شرایط ورودی صفر، متغیرهای حالت تمایل
به همگرایی به نقطه تعادل عفونت دارند و در نتیجه فرض می‌گردد
که مقادیر حالت دائم دینامیک HIV در شرایط ورودی صفر به‌عنوان شرایط اولیه در برنامه کنترلی حلقه بسته هستند. در ابتدا عملکرد نامی مورد بررسی قرار می‌گیرد و پارامترهای طراحی برای جبران‌سازی عفونت HIV در شرایط نامی به‌صورت زیر انتخاب شده‌اند

همان طور که از شکل 3 می‌توان دریافت، پاسخ‌های حلقه بسته به‌طور مجانبی به سمت نقطه تعادل سالم هدایت شده‌اند. غلظت سلول‌های سالم بعد از گذشت حدود 25 روز به بیشینه مقدار خود همگرا شده است؛ در حالی که دو متغیر دیگر یعنی غلظت سلول‌های معیوب و ذرات ویروس

شکل 3: پاسخ حلقه بسته عفونت HIV در شرایط نامی.

شکل 4: میزان تزریق بهینه دارو در شرایط نامی.

شکل 5: کران بالای نرخ همگرایی PRNN.

آزاد کمتر از 10 روز به کمینه مقدار خود همگرا شده‌اند. در واقع، زمان نشست غلظت سلول‌های سالم به‌مراتب بیشتر از دو متغیر دیگر می‌باشد و بیانگر این است که دینامیک HIV ماهیتاً دارای دو دینامیک کند و سریع است. از طرفی، فراجهش یا فروجهش نامطلوبی در پاسخ‌های مورد نظر دیده نمی‌شود و دقت عملکرد الگوریتم کنترلی در شرایط حالت دائم مطلوب است.

با توجه به شکل 4، سیگنال کنترلی یعنی میزان تزریق مؤثر دارو
با گذشت زمان از مقدار اولیه صفر به مقدار حالت دائم حدود 45/0

شکل 6: تغییر مشتقات شبه‌جزئی در برنامه کنترلی پیشنهادی.

شکل 7: تخمین متغیرهای حالت دینامیک HIV به کمک مدل‌های دینامیکی خطی‌سازی محلی.

میل نموده است. این نشان می‌دهد که الگوریتم کنترلی قادر به تعیین مقدار بهینه کنترلی با وجود محدودیت از پیش تعیین‌شده است. از طرفی متغیر حالت شبکه عصبی PRNN در این شکل به‌طور مجانبی به مقدار صفر همگرا شده که دلالت بر پایداری بهینه‌ساز عددی توسعه‌یافته در
این مقاله دارد. با توجه به قضیه 1، شرط پایداری PRNN تحقق رابطه است. شکل 5 معرف کران بالای نرخ همگرایی PRNN است که نشان می‌دهد این پارامتر باید مقادیری کمتر از 2 را اختیار کند. یکی از مهم‌ترین پارامترهای الگوریتم کنترلی پیشنهادی، مشتقات شبه‌جزئی به‌عنوان متغیرهای وابسته به زمان هستند. الگوریتم کنترلی تنها به کمک این پارامترهای تطبیقی و بدون نیاز به معادلات ریاضی عفونت HIV قادر به تحقق اهداف عملکردی است.

تغییرات مشتقات شبه جزئی در شکل 6 با شرایط اولیه مشاهده می‌شود که وابسته به تغییرات متغیرهای حالت دینامیک HIV به مقادیر حالت دائم مختلف همگرا شده‌اند.

نحوه تغییرات این پارامترهای طراحی باید به‌گونه‌ای باشد که مدل‌های دینامیکی خطی‌سازی‌شده محلی بتوانند رفتار دینامیک سیستم را به‌درستی دنبال نمایند. برای بررسی این مسئله، تخمین متغیرهای حالت دینامیک HIV را بر اساس (8) به‌صورت زیر در نظر بگیرید

(71)

شکل 7 نشان می‌دهد که مدل‌های دینامیکی خطی‌سازی محلی با دقت

شکل 8: کران بالای ضرایب وزنی شروط دسترسی.

شکل 9: تابع هزینه معرف مسئله برنامه‌ریزی مرتبه دو مقید (23).

عملکرد خوبی قادر به ردیابی رفتار متغیرهای حالت دینامیک HIV هستند. این مسئله از اهمیت بالایی در طراحی قوانین کنترل مستخرج از داده برخوردار است؛ زیرا عملکرد سیستم کنترلی کاملاً وابسته به دقت عملکرد حلقه تخمین مشتقات شبه‌جزئی و توصیف صحیح دینامیک HIV بر اساس مدل‌های دینامیکی خطی‌سازی محلی است.

مسئله مهم دیگری که در این بخش باید به آن اشاره شود، تضمین پایداری حلقه بسته با توجه به شرط (67) است. پارامترهای تأثیرگذار در تضمین پایداری، ضرایب وزنی سطوح لغزش در شرط لغزشی نمایی زمان گسسته هستند و کران بالای این پارامترها وابسته به مقدار لحظه‌ای مشتقات شبه‌جزئی است. شکل 8 نشان می‌دهد که تغییرات کران بالای ، مقادیر بسیار بزرگی اختیار کرده و لذا محدودیتی برای این پارامترهای طراحی وجود ندارد. دلیل اصلی این دامنه تغییرات بزرگ آن است که مقادیر لحظه‌ای مشتقات شبه‌جزئی به هم نزدیک بوده و این باعث می‌شود که کوچک‌ترین مقدار تکین ماتریس خیلی نزدیک به صفر گردد؛ لذا کران بالای ضرایب وزنی شروط دسترسی خیلی بزرگ می‌شوند. این نشان می‌دهد چنانچه مقدار اولیه مشتقات جزئی برابر یا نزدیک به هم انتخاب شوند، پایداری حلقه بسته به سهولت تضمین می‌شود. به‌علاوه، شکل 9 همگرایی تابع هزینه ارائه‌شده در (23) به مبدأ را نشان می‌دهد و این بیانگر کیفیت عملکرد بالای الگوریتم پیشنهادی در کمینه‌سازی مسئله برنامه‌ریزی مرتبه دو مقید است.

شکل 10: پاسخ غلظت سلول‌های سالم در الگوریتم پیشنهادی و روش ASMC [45] در حضور عدم قطعیت.

شکل 11: پاسخ غلظت سلول‌های معیوب در الگوریتم پیشنهادی و روش ASMC [45] در حضور عدم قطعیت.

در ادامه این بخش، مسئله قوام حلقه بسته با درنظرگرفتن عدم قطعیت پارامتری در متغیر مورد ارزیابی قرار می‌گیرد. بر این اساس، فرض می‌شود که این متغیر از روز پنجاهم به بعد به مقدار 000035/0 کاهش می‌یابد. به‌علاوه، نتایج شبیه‌سازی برای اعتبارسنجی بهتر الگوریتم پیشنهادی با کنترل مد لغزشی تطبیقی (ASMC) ارائه‌شده در [45] مقایسه می‌گردد. همان طور که در شکل 10 مشاهده می‌شود با بروز عدم قطعیت، غلظت سلول‌های سالم با فروجهشی گذرا همراه می‌گردد و بعد از حدود 20 روز دوباره به بیشینه مقدار خود همگرا می‌شود. این نشان می‌دهد که الگوریتم پیشنهادی به‌خوبی قادر به حفظ عملکرد کنترلی در حضور عدم قطعیت است و می‌تواند در مدت زمان نسبتاً مطلوبی، اثرات عدم قطعیت را جبران کند. از طرفی رفتار این متغیر برای ASMC با افت عملکرد شدیدی در هنگام بروز عدم قطعیت همراه است. پاسخ گذرای
هر دو الگوریتم کنترلی تا حد زیادی با یکدیگر مشابه می‌باشد. با وجود تغییرات شدید متغیر مذکور، سرعت جبران‌سازی روش ASMC تا حدی بیشتر از الگوریتم پیشنهادی است.

نتایج مشابهی در مورد غلظت سلول‌های معیوب در شکل 11 و مقدار ویروس‌های آزاد در شکل 12 برای الگوریتم پیشنهادی در قیاس با روش ASMC مشاهده می‌شود. می‌توان دریافت که در هر دو مورد، الگوریتم پیشنهادی از سرعت پاسخ گذراي بهتري برخوردار است.

شکل 12: پاسخ ذرات ویروس‌های آزاد در الگوریتم پیشنهادی و روش ASMC [45] در حضور عدم قطعیت.

جدول 2: مقایسه کمی روش پیشنهادی و الگوریتم ASMC [45].

ویژگی	روش پیشنهادی	الگوریتم ASMC [45]
زمان نشست	10 روز	30 روز
فراجهش بعد از بروز عدم قطعیت	%13	%36
زمان جبران‌سازی عدم قطعیت	25 روز برای متغیر نخست	15 روز برای متغیر نخست
	15 روز برای متغیر دوم	15 روز برای متغیر دوم
	12 روز برای متغیر سوم	15 روز برای متغیر سوم
چترینگ در خروجی ناشی از عدم قطعیت	ندارد	دارد
اشباع سیگنال کنترلی	ندارد	دارد
چترینگ در سیگنال کنترلی	ندارد	دارد

دامنه تغییرات متغیرهای مذکور در روش ASMC خیلی شدیدتر از الگوریتم پیشنهادی است. سرعت جبران‌سازی الگوریتم پیشنهادی برای دفع اثرات عدم قطعیت حدود 10 روز است که تقریباً مشابه با روش ASMC می‌باشد. دامنه تغییرات سیگنال کنترلی در شکل 13 بیانگر این مطلب است که الگوریتم پیشنهادی به دلیل تعیین قوانین کنترلی با کمینه‌سازی یک شاخص عملکرد بهینه مقید، حتی در حضور عدم قطعیت نیز مقادیر بین صفر و یک را اختیار کرده است. به‌علاوه، سیگنال مذکور از یکنواختی مطلوبی برخوردار بوده و از نواحی بحرانی اجتناب کرده است.

در حالی که سیگنال کنترلی در روش ASMC با بروز عدم قطعیت به مقادیر نزدیک یک نزدیک شده و با تغییرات شدیدی همراه است. بنابراین رویکرد پیشنهادی به‌مراتب کیفیت عملکرد بالاتری در تضمین قوام حلقه بسته دارد و علاوه بر عدم وابستگی به معادلات ریاضی دینامیک HIV، قادر به تعیین مقدار بهینه قانون کنترلی با وجود محدودیت از پیش تعیین‌شده است. مقایسه کمی بین الگوریتم کنترلی پیشنهادی و روش کنترلی پیشنهادشده در [45] در جدول 2 آمده است.

در این بخش و به‌طور خلاصه، عملکرد الگوریتم پیشنهادی با ارائه نتایج شبیه‌سازی مرتبط با اجزای مختلف سیستم حلقه بسته، ارزیابی شد. همگرایی به نقطه تعادل سالم هم در شرایط نامی و هم در حضور عدم قطعیت انجام گردید. به‌علاوه، سیگنال کنترلی در شرایط مختلف بدون چترینگ بوده و دچار اشباع نمی‌شود. الگوریتم تخمین مشتقات شبه‌جزئی با دقت مطلوبی قادر به تخمین مؤلفه‌های مشتق شبه‌جزئی است.

شکل 13: سیگنال کنترلی در الگوریتم پیشنهادی و روش ASMC [45] در حضور عدم قطعیت.

روش پیشنهادی قادر به دفع اثر اغتشاش در بازه زمانی مناسب بوده و اثرات چترینگ در خروجی مدل وجود ندارد. نتایج شبیه‌سازی از دیدگاه زمان نشست، چترینگ خروجی‌های مدل، فراجهش، زمان جبران‌سازی اثر عدم قطعیت، اشباع و چترینگ سیگنال کنترلی دلالت بر کیفیت بالای الگوریتم پیشنهادی در مقایسه با رویکرد ارائه‌شده در [45] دارد.

5- نتیجه‌گیری

در این مقاله، الگوریتم کنترل مستخرج از داده با ترکیب کنترل مد لغزشی بهینه مقید و شبکه عصبی بازگشتی تصویر برای جبران‌سازی عفونت HIV توسعه یافت. به کمک مدل‌های دینامیکی خطی‌سازی محلی که وابسته به تخمین لحظه‌ای مشتقات شبه‌جزئی است، نیازی به آگاهی از معادلات ریاضی دینامیک HIV نیست و تنها به کمک داده‌های ورودی و خروجی می‌توان اهداف کنترلی را تحقق بخشید. به‌منظور تعیین میزان تزریق دارو در محدوده صفر و یک، مسئله برنامه‌ریزی مرتبه دو مقید بر اساس مدل‌های دینامیکی خطی‌سازی محلی تشکیل شد؛ به‌طوری که سیگنال کنترلی بهینه با کمینه‌سازی آن به‌دست می‌آید. از طرفی، شاخص عملکرد بر اساس برآورده‌شدن شروط دسترسی نمایی زمان گسسته تعریف شد تا بتوان قوام حلقه بسته را بهبود بخشید. شبکه عصبی بازگشتی تصویر، نقش بهینه‌ساز عددی را برای تعیین قانون کنترل بهینه مقید بر عهده داشت. نتایج شبیه‌سازی نشان دادند که الگوریتم پیشنهادی در شرایط نامی قادر به هدایت متغیرهای حالت HIV به نقطه تعادل سالم با سرعت گذرا و دقت حالت دائم مطلوب است. الگوریتم پیشنهادی از سرعت همگرایی بالا، ساختار ساده و کیفیت بالایی در تحقق اهداف عملکردی برخوردار است. روش پیشنهادی در قیاس با الگوریتم کنترل مد لغزشی تطبیقی، عملکرد حلقه بسته خیلی بهتری را در حضور عدم قطعیت پارامتری دارد. به‌علاوه، دامنه سیگنال کنترلی در روش پیشنهادی با یکنواختی مطلوبی همراه بوده، همواره در محدوده صفر و یک می‌باشد و از نواحی بحرانی اجتناب کرده است.

مراجع

[1] R. V. Culshaw, S. Ruan, and R. J. Spiteri, "Optimal HIV treatment by maximising immune response," J. of Mathematical Biology,
vol. 48, no. 5, pp. 545-562, 2004.

[2] D. Y. Lu, H. Y. Wu, N. S. Yarla, B. Xu, J. Ding, and T. R. Lu, "HAART in HIV/AIDS treatments: future trends," Infectious Disorders-Drug Targets, vol. 18, no. 1, pp. 15-22, 2018.

[3] A. Sharafian, A. Sharifi, and W. Zhang, "Fractional sliding mode based on RBF neural network observer: application to HIV infection mathematical model," Computers & Mathematics with Applications, vol. 79, no. 11, pp. 3179-3188, 1 Jun. 2020.

[4] Z. Zhang, J. Zhang, F. Cheng, and F. Liu, "A novel stability criteria of a class nonlinear fractional-order HIV-1 system with multiple delay," International J. of Control, Automation and Systems, vol. 17, no. 9, pp. 2274-2283, Sept. 2019.

[5] R. S. Butt, I. Ahmad, R. Iftikhar, and M. Arsalan, "Integral backstepping and synergetic control for tracking of infected cells during early antiretroviral therapy," IEEE Access, vol. 7, pp. 69447-69455, 2019.

[6] H. Jahanshahi, "Smooth control of HIV/AIDS infection using a robust adaptive scheme with decoupled sliding mode supervision," The European Physical J. Special Topics, vol. 227, no. 7, pp. 707-718, 2018.

[7] A. J. Anelone and S. K. Spurgeon, "Prediction of the containment of HIV infection by antiretroviral therapy-a variable structure control approach," IET Systems Biology, vol. 11, no. 1, pp. 44-53, Feb. 2017.

[8] P. S. Rivadeneira and C. H. Moog, "Impulsive control of single-input nonlinear systems with application to HIV dynamics," Applied Mathematics and Computation, vol. 218, no. 17, pp. 8462-8474, 1 May 2012.

[9] Y. Pei, N. Shen, J. Zhao, Y. Yu, and Y. Chen, "Analysis and simulation of a delayed HIV model with reaction-diffusion and sliding control," Mathematics and Computers in Simulation, vol. 212, pp. 382-405, Oct. 2023.

[10] D. Shi, S. Ma, and Q. Zhang, "Sliding mode dynamics and optimal control for HIV model," Mathematical Biosciences and Engineering, vol. 20, no. 4, pp. 7273-7297, 13 Feb. 2023.

[11] A. Izadbakhsh, A. A. Kalat, and S. Khorashadizadeh, "Observer-based adaptive control for HIV infection therapy using the Baskakov operator," Biomedical Signal Processing and Control, vol. 65, Article ID: 102343, Mar. 2021.

[12] N. H. Jo, "Robust drug treatment for HIV-1 infection model with completely unknown parameters," International J. of Control, Automation and Systems, vol. 17, no. 12, pp. 3113-3121, Dec. 2019.

[13] Y. Ding, Z. Wang, and H. Ye, "Optimal control of a fractional-order HIV-immune system with memory," IEEE Trans. on Control Systems Technology, vol. 20, no. 3, pp. 763-769, May 2011.

[14] H. D. Kwon, J. Lee, and S. D. Yang, "Optimal control of an age-structured model of HIV infection," Applied Mathematics and Computation, vol. 219, no. 5, pp. 2766-2779, Nov. 2012.

[15] H. Wang, et al., "A Caputo-Fabrizio fractional-order model of HIV/AIDS with a treatment compartment: sensitivity analysis and optimal control strategies," Entropy, vol. 23, no. 5, Article ID: e23050610, 2021.

[16] E. A. Hernandez-Vargas, P. Colaneri, and R. H. Middleton, "Optimal therapy scheduling for a simplified HIV infection model," Automatica, vol. 49, no. 9, pp. 2874-2880, Sept. 2013.

[17] A. E. Abharian, S. Z. Sarabi, and M. Yomi, "Optimal sigmoid nonlinear stochastic control of HIV-1 infection based on bacteria foraging optimization method," Biomedical Signal Processing and Control, vol. 10, pp. 184-191, Mar. 2014.

[18] P. Di Giamberardino and D. Iacoviello, "LQ control design for the containment of the HIV/AIDS diffusion," Control Engineering Practice, vol. 77, pp. 162-173, Aug. 2018.

[19] N. A. Reisi, S. H. Lakmesari, M. J. Mahmoodabadi, and S. Hadipour, "Optimum fuzzy control of human immunodeficiency virus type1 using an imperialist competitive algorithm," Informatics in Medicine Unlocked, vol. 16, Article ID: 100241, 2019.

[20] M. H. A. Biswas, M. M. Haque, and U. K. Mallick, "Optimal control strategy for the immunotherapeutic treatment of HIV infection with state constraint," Optimal Control Applications and Methods, vol. 40, no. 4, pp. 807-818, Jul./Aug. 2019.

[21] S. B. Chen, et al., "Antiretroviral therapy of HIV infection using a novel optimal type-2 fuzzy control strategy," Alexandria Engineering J., vol. 60, no. 1, pp. 1545-1555, Feb. 2021.

[22] E. Shamsara, Z. Afsharnezhad, and S. Effati, "Optimal drug control in a four‐dimensional HIV infection model," Optimal Control Applications and Methods, vol. 41, no. 2, pp. 469-486, Mar./
Apr. 2020.

[23] T. Jang, H. D. Kwon, and J. Lee, "Free terminal time optimal control problem of an HIV model based on a conjugate gradient method," Bulletin of Mathematical Biology, vol. 73, no. 10, pp. 2408-2429, Oct. 2011.

[24] P. Di Giamberardino and D. Iacoviello, "HIV infection control: a constructive algorithm for a state-based switching control," International J. of Control, Automation and Systems, vol. 16, no. 3, pp. 1469-1473, Jun. 2018.

[25] F. Sun and K. Turkoglu, "Estimation of CD4+T cell count parameters in HIV/AIDS patients based on real-time nonlinear receding horizon control," International J. of Control, Automation and Systems, vol. 16, no. 4, pp. 1805-1813, Aug. 2018.

[26] G. Pannocchia, M. Laurino, and A. Landi, "A model predictive control strategy toward optimal structured treatment interruptions in anti-HIV therapy," IEEE Trans. on Biomedical Engineering, vol. 57, no. 5, pp. 1040-1050, May 2010.

[27] D. Kinderlehrer and G. Stampacchia, An Introduction to Variational Inequalities and Their Applications, Society for Industrial and Applied Mathematics, 2000.

[28] Q. Liu and J. Wang, "A one-layer recurrent neural network with a discontinuous activation function for linear programming," Neural Computation, vol. 20, no. 5, pp. 1366-1383, May 2008.

[29] Y. Xia and J. Wang, "A bi-projection neural network for solving constrained quadratic optimization problems," IEEE Trans. on Neural Networks and Learning Systems, vol. 27, no. 2, pp. 214-224, Feb. 2015.

[30] A. Golbabai and S. Ezazipour, "A projection-based recurrent neural network and its application in solving convex quadratic bilevel optimization problems," Neural Computing and Applications, vol. 32, no. 8, pp. 3887-3900, Apr. 2020.

[31] Y. Xia, J. Wang, and W. Guo, "Two projection neural networks with reduced model complexity for nonlinear programming," IEEE Trans. on Neural Networks and Learning Systems, vol. 31, no. 6, pp. 2020-2029, Jun. 2019.

[32] Y. Yang and X. Xu, "The projection neural network for solving convex nonlinear programming," in Proc. Int. Conf. on Intelligent Computing, Springer, pp. 174-181, Qingdao, China, 21-24
Aug. 2007.

[33] Q. Liu and J. Wang, "A projection neural network for constrained quadratic minimax optimization," IEEE Trans. on Neural Networks and Learning Systems, vol. 26, no. 11, pp. 2891-2900, Nov. 2015.

[34] Y. Zhang, S. Chen, S. Li, and Z. Zhang, "Adaptive projection neural network for kinematic control of redundant manipulators with unknown physical parameters," IEEE Trans. on Industrial Electronics, vol. 65, no. 6, pp. 4909-4920, Jun. 2017.

[35] M. Yang, Y. Zhang, and H. Hu, "Posture coordination control
of two-manipulator system using projection neural network," Neurocomputing, vol. 427, pp. 179-190, Feb. 2021.

[36] Z. Li, H. Xiao, C. Yang, and Y. Zhao, "Model predictive control
of nonholonomic chained systems using general projection neural networks optimization," IEEE Trans. on Systems, Man, and Cybernetics: Systems, vol. 45, no. 10, pp. 1313-1321, Oct. 2015.

[37] N. H. Jo and Y. Roh, "A two-loop robust controller for HIV infection models in the presence of parameter uncertainties," Biomedical Signal Processing and Control, vol. 18, pp. 245-253, Apr. 2015.

[38] H. Shim, N. H. Jo, H. Chang, and J. H. Seo, "A system theoretic study on a treatment of AIDS patient by achieving long-term non-progressor," Automatica, vol. 45, no. 3, pp. 611-622, Mar. 2009.

[39] Z. Hou and S. Xiong, "On model-free adaptive control and its stability analysis," IEEE Trans. on Automatic Control, vol. 64,
no. 11, pp. 4555-4569, Nov. 2019.

[40] H. Du, X. Yu, M. Z. Chen, and S. Li, "Chattering-free discrete-time sliding mode control," Automatica, vol. 68, pp. 87-91, Jun. 2016.

[41] Y. Xia and J. Wang, "A general methodology for designing globally convergent optimization neural networks," IEEE Trans. on Neural Networks, vol. 9, no. 6, pp. 1331-1343, Nov. 1998.

[42] S. Liu and J. Wang, "A simplified dual neural network for quadratic programming with its KWTA application," IEEE Trans. on Neural Networks, vol. 17, no. 6, pp. 1500-1510, Nov. 2006.

[43] S. Skogestad and I. Postlethwaite, Multivariable Feedback Control: Analysis and Design, New York: Wiley, vol. 2, 2007.

[44] C. D. Meyer, Matrix Analysis and Applied Linear Algebra, vol. 71, SIAM, 2000.

[45] M. J. Mahmoodabadi and S. H. Lakmesari, "Adaptive sliding mode control of HIV-1 infection model," Informatics in Medicine Unlocked, vol. 25, Article ID: 100703, 2021.

اشکان ضرغامی تحصيلات خود را در مقاطع كارشناسي مهندسی برق-قدرت و كارشناسي ارشد مهندسی برق– کنترل به‌‌ترتيب در سال‌هاي 1392 و 1395 از دانشگاه آزاد اسلامی واحد ساوه به پايان رسانده است و هم اكنون دانشجوی دکتری مهندسی برق– کنترل دانشگاه آزاد اسلامی واحد تهران مرکزی می باشد. زمينه‎هاي تحقيقاتي مورد علاقه ايشان عبارتند از: کنترل سیستمهای غیرخطی، شبکه‌های هوشمند و مدل‌سازی سیستم‌ها.

مهدی سیاهی در سال 1380 مدرك كارشناسي مهندسي برق– الکترونیک را از دانشگاه یزد و در سال 1382 مدرك كارشناسي ارشد مهندسي برق– کنترل را از دانشگاه صنعتی شاهرود دريافت نمود. پس از آن به دوره دكتراي مهندسي برق– کنترل در دانشگاه صنعتی شاهرود وارد گرديد و در سال 1387 موفق به اخذ درجه دكترا در مهندسي برق– کنترل از دانشگاه مذكور گرديد. دكتر سیاهی از سال 1383 تا کنون در دانشگاه آزاد اسلامی مشغول به فعالیت بوده و در حال حاضر عضو هيأت علمي دانشكده مهندسی مکانیک، برق و کامپیوتر واحد علوم و تحقیقات تهران مي‎باشد. زمينه‎هاي علمي مورد علاقه نام‌برده شامل موضوعاتي مانند سیستم های کنترل تحمل پذیر عیب، تشخیص و شناسایی خطا، مدل‌سازی سیستم‌های بیولوژیکی، رباتيك و ... مي‎باشد.

فریدون نوشیروان راحت آباد به ترتیب در سال‌های 1381 و 1383 مدرك كارشناسي و کارشناسی ارشد مهندسي برق گرایش مهندسی پزشکی را از دانشگاه آزاد اسلامی واحد علوم و تحقیقات دريافت نمود. پس از آن به دوره دكتراي مهندسي پزشکی– بیوالکتریک در دانشگاه آزاد اسلامی واحد علوم و تحقیقات وارد گرديد و در سال 1391 موفق به اخذ درجه دكترا در مهندسي پزشکی– بیوالکتریک از دانشگاه مذكور گرديد. دكتر نوشیروان از سال 1385 تا کنون در دانشگاه آزاد اسلامی مشغول به فعالیت بوده و در حال حاضر عضو هيأت علمي دانشكده مهندسی پزشکی واحد علوم و تحقیقات تهران مي‎باشد. زمينه‎هاي علمي مورد علاقه نام‌برده شامل موضوعاتي مانند کنترل سیستم‌های عصبی عضلانی، آشوب در سیستم‌های بیولوژییکی و ... مي‎باشد.

[1] این مقاله در تاریخ 2 دی ماه 1401 دریافت و در تاریخ 22 مرداد ماه 1402 بازنگری شد.

اشکان ضرغامی، دانشكده مهندسي برق، دانشگاه آزاد اسلامی، واحد تهران مرکز، تهران، ايران، (email: ashkan.zarghami@outlook.com).

مهدی سیاهی (نویسنده مسئول)، دانشکده مهندسي برق و کامپیوتر،
دانشگاه آزاد اسلامی، واحد علوم و تحقیقات، تهران، ايران،
(email: mehdi.siahi@srbiau.ac.ir).

فریدون نوشیروان راحت‌آباد، دانشکده مهندسی پزشکی، دانشگاه آزاد اسلامی، واحد علوم و تحقیقات، تهران، ، ايران، (email: nowshiravan@gmail.com).

[2] . Human Immunodeficiency Virus

[3] . Acquired Immune Deficiency Syndrome

[4] . Highly Active Antiretroviral Therapy

[5] . Reverse Transcriptase Inhibitor

[6] . Protease Inhibitor

[7] . Baskakov

[8] . Linear Quadratic

[9] . Constrained Quadratic Programming

[10] . Projection Recurrent Neural Network

[11] . Lipschitz

[12] . Karush-Kuhn-Tucker

Share To

Article Url

Data-Driven Sliding Mode Control Based on Projection Recurrent Neural Network for HIV Infection: A Singular Value Approach

Rimag

Links

Related Centers

Technical Support

Official pages