A new approach to IoT-based disease diagnosis using genetic algorithms and various classifiers
Subject Areas : Specialseyed ebrahim dashti 1 , maryam nikpor 2 , mehdi nikpor 3 , mahbobe johari 4
1 - Assistant Professor, Faculty of Electrical and Computer Engineering, Jahrom Branch, Islamic Azad University, Jahrom, Fars, Iran
2 - PhD student, Faculty of Electrical and Computer Engineering, Islamic Azad University, Fars, Iran
3 - Instructor, Bandar Abbas University of Medical Sciences, Hormozgan, Iran
4 - Master's degree, Fasa Islamic Azad University, Fars, Iran
Keywords: Smart health, machine learning, Internet of Things (IoT), Ensemble learning, diabetes,
Abstract :
Medical information technology and health services are related to the national welfare and livelihood of the people. The integration of cloud computing and the Internet of Things will be a major breakthrough in modern medical applications. This study focuses on the chronic disease of diabetes, which is one of the leading causes of death worldwide. This research has applied medical information technology in the field of IoT, especially in the field of medical monitoring and management applications. A model architecture for remote monitoring and management of the health information cloud platform is proposed and analyzed, and then an algorithm based on genetic algorithm and hybrid classification for the diagnosis of diabetes is proposed for medical monitoring. The results show that the proposed method has a higher performance than the basic methods and has reached an accuracy of 94%.
[1] Ahmad, M.O., Siddiqui, S.T. (2022). The Internet of Things for Healthcare: Benefits, Applications, Challenges, Use Cases and Future Directions. In: Tiwari, S., Trivedi, M.C., Kolhe, M.L., Mishra, K., Singh, B.K. (eds) Advances in Data and Information Sciences. Lecture Notes in Networks and Systems, vol 318. .
[2] Hameed, G., Singh, Y., Haq, S., Rana, B. (2022). Blockchain-Based Model for Secure IoT Communication in Smart Healthcare. In: Singh, P.K., Kolekar, M.H., Tanwar, S., Wierzchoń, S.T., Bhatnagar, R.K. (eds) Emerging Technologies for Computing, Communication and Smart Cities. Lecture Notes in Electrical Engineering, vol 875..
[3] Li, W., Chai, Y., Khan, F. et al. A Comprehensive Survey on Machine Learning-Based Big Data Analytics for IoT-Enabled Smart Healthcare System. Mobile Netw Appl 26, 234–252 (2021)..
[4] Zheng, T., Xie, W., Xu, L., He, X., Zhang, Y., You, M., ... & Chen, Y. (2017). A machine learning-based framework to identify type 2 diabetes through electronic health records. International journal of medical informatics, 97, 120-127.
[5] Somasundaram, S. K., & Alli, P. (2017). A Machine Learning Ensemble Classifier for Early Prediction of Diabetic Retinopathy. Journal of Medical Systems, 41(12), 201.
[6] Nilashi, M., bin Ibrahim, O., Ahmadi, H., & Shahmoradi, L. (2017). An Analytical Method for Diseases Prediction Using Machine Learning Techniques. Computers & Chemical Engineering.
[7] Nilashi, M., Bin Ibrahim, O., Mardani, A., Ahani, A., & Jusoh, A. (2016). A soft computing approach for diabetes disease classification. Health Informatics Journal, 1460458216675500.
[8] Pouriyeh, S., Vahid, S., Sannino, G., De Pietro, G., Arabnia, H., & Gutierrez, J. (2017, July). A comprehensive investigation and comparison of Machine Learning Techniques in
the domain of heart disease. In Computers and Communications (ISCC), 2017 IEEE Symposium on (pp. 204-207). IEEE.
[9] Zheng, T., Xie, W., Xu, L., He, X., Zhang, Y., You, M., ... & Chen, Y. (2017). A machine learning-based framework to identify type 2 diabetes through electronic health records. International journal of medical informatics, 97, 120-127.
[10] Yaqoob I (2021) Blockchain for healthcare data management: opportunities, challenges, and future recommendations. Neural Comput Appl 0123456789.
[11] Shaikh, F. K., Zeadally, S., & Exposito, E. (2017). Enabling technologies for green internet of things. IEEE Systems Journal, 11(2), 983-994.
[12] Sicari, S., Rizzardi, A., Grieco, L. A., Piro, G., & Coen-Porisini, A. (2017). A Policy Enforcement Framework for Internet of Things Applications in the Smart Health. Smart Health.
[13] Velliangiri S, Karthikeyan Karunya P (2020) Blockchain technology: challenges and security issues in consensus algorithm. In: International conference on computer communication and informatics, ICCCI.
[14] Hossain, M. S., & Muhammad, G. (2016). Cloud-assisted industrial internet of things (iiot)–enabled framework for health monitoring. Computer Networks, 101, 192-202.
[15] Temko, A. (2017). Accurate wearable heart rate monitoring during physical exercises using PPG. IEEE Transactions on Biomedical Engineering.
[16] Philip NY, Rodrigues JJPC, Wang H, Fong SJ, Chen J (2021) Internet of Things for in-home health monitoring systems: current advances, challenges and future directions. IEEE J Sel Areas Commun 39(2):300–310.
|
* سیدابراهیم دشتی ** مریم نیکپور *** مهدی نیکپور **** محبویه جوهری
* استادیار، دانشکده مهندسی برق و کامپیوتر، واحد جهرم، دانشگاه آزاد اسلامی، جهرم، فارس، ایران sayed.dashty@gmail.com
** دانشجوی دکتری، دانشکده مهندسی برق و کامپیوتر، دانشگاه آزاد اسلامی، فارس، ایران nikpoor.maryam@yahoo.com
*** مربی، دانشگاه علوم پزشکی بندرعباس، هرمزگان، ایران nikpoor.maryam@gmail.com
**** کارشناسی ارشد، دانشگاه آزاد اسلامی فسا، فارس، ایران mahbobeh.johari@gmail.com
تاریخ دریافت: 06/06/1401 تاریخ پذیرش: 27/08/1402
صص: 182- 169
چکیده
فناوری اطلاعات پزشکی و خدمات بهداشتی و درمانی با رفاه ملی و معیشت مردم ارتباط دارد. ادغام پردازش ابری و اینترنت اشیا یک پیشرفت بزرگ در کاربرد پزشکی مدرن خواهد بود. در این تحقیق تمرکز بر روی بیماری مزمن دیابت میباشد که یکی از عوامل اصلی مرگ و میر در سراسر جهان محسوب میشود. این تحقیق تکنولوژی اطلاعات پزشکی را در زمینه اینترنت اشیا، به ویژه در زمینه کاربرد نظارت و مدیریت پزشکی بکار گرفته است. این مطالعه یک روش مبتکرانه مبتنی بر اینترنت اشیا را برای تشخیص دیابت معرفی میکند. یک معماری برای نظارت از راه دور و مدیریت پلت فرم ابر اطلاعات بهداشتی پیشنهاد و تحلیل میشود ، اطلاعات بیماران از طریق ابزارهای اینترنت اشیاء پوشیدنی و تعبیه شده بر حسب نیاز استفاده و جمع آوری میشود و در نهایت از طریق اینترنت شخص ارسال میشود. در این مقاله الگوریتم مبتنی بر الگوریتم ژنتیک و طبقه بندی ترکیبی برای تشخیص دیابت در راستای کمک به نظارت پزشکی ارائه شده است. از الگوریتمهای ژنتیک برای انتخاب ویژگیهای مرتبط بر اساس همبستگی آنها با وضعیت دیابت و وابستگیهای بین ویژگیها استفاده میکند. متعاقباً، یک مدل یادگیری مجموعهای انباشته، با ادغام طبقهبندیکنندههای SVM، KNN، ANN، درختان و GNB برای دقت بیشتر استفاده میشود. نتایج نشاندهنده عملکرد برتر رویکرد ما است و پتانسیل آن را برای بهبود مدیریت دیابت و نتایج مراقبتهای بهداشتی برجسته میکند. روش پیشنهادی از سه روش ارزیابی شده است و نتایج حاصل نشان میدهد روش پیشنهادی از عملکرد بالاتری به میزان 9 تا 57 درصد نسبت بـه روشهای پایه برخوردار بوده و به دقت ٩٣ درصد رسیده است.
واژههای کلیدی: سلامت هوشمند، یادگیری ماشین، اینترنت اشیا، یادگیری گروهی، بیماری دیابت.
نوع مقاله: علمی
1- مقدمه
سیاستهای درگیر با حوزه سلامت، زیرساختهای مجهز به اینترنت اشیا را برای پردازش سوابق پزشکی الکترونیکی که نیازمند محاسبات قابل توجه و منابع ارتباطی ایمن است، اتخاذ کرده اند. در این زیرساخت،
نویسنده عهدهدار مکاتبات: سیدابراهیم دشتی Sayed.dashty@gmail.com |
علاوه براین، شیوع دیابت نوع ٢ در نوجوانان و جوانان بهطـور چشمگیری افزایش مییابد. در افراد مبتلابه دیابت نوع ٢، سـابقه ابتلا به دیابت نوع ٢، عوامل اصلی خطر ابـتلا بـه چـاقی، سـابقه خانوادگی و شیوه زندگی بررسی میشود.
ادامه مقاله به شرح زیر است: بخش دوم کارهای مـرتبط را که در این حوزه انجامشده بررسـیشـده در بخـش سـوم بـه بررسی سازمانبندی اینترنت اشیا در حوزه سـلامت هوشـمند و در بخش چهار روش پیشـنهادی و درنهایـت در بخـش آخـر بـه نتیجهگیری و کارهای آتی میپردازیم.
2- کارهای مرتبط
در این بخش، مراقبتهـای بهداشـتی در سادهترین شـکل یعنــی تشــخیص و پیشــگیری از بیمــاری یــا درمــان هرگونــه آسیبهای پزشکی است که یـک نقـش مهمـی در ارائـه زنـدگی برای جامعه بر عهده دارد که یکـی از نگرانـیهـا چگـونگی ارائـه خدمات بهتر با هزینه کمتـر هسـت کـه تکنیـکهـای یـادگیری ماشین در دستیابی به این هدف کمک میکند.که پیشرفتهـای قابــلتوجــه در بیوتکنولــوژی و علــوم پزشــکی موجــب تولیــد قابلتـوجهی از دادهها شـده اسـت، ماننـد دادههای ژنتیکـی و اطلاعات بالینی که از پروندههای الکترونیکی سلامت الکترونیکـی (EHRs) تولیدشده است. برای این منظور، اسـتفاده از روشهـای یادگیری ماشین و دادهها در علوم زیستی در حال حاضر، بیشـتر از قبــل، حیــاتی و ضــروری در تــلاش بــرای تبــدیل هوشمندانه تمام اطلاعات موجود بـه دانـش ارزشـمند اسـت کـه محققان در مرجع ]٦[ از تکنیکهای یادگیری ماشین بـهمنظـور ارائه یک روش هوشـمند ترکیبـی بـا اسـتفاده از تجزیـهوتحلیـل مؤلفــههــای اصــلی و مــدل مخلــوط Gaussian، طبقــهبنــدی و رگرسیون درختان Cart بهمنظور پیشبینی بیمـاریهـای مـزمن استفاده کردهاند همچنین در مرجع ]٧[ یـک سیسـتم هوشـمند ترکیبی جدید برای طبقـهبنـدی بیمـاری دیابـت بـا اسـتفاده از تکنیکهای یادگیری ماشین ارائهشده که از الگوریتمهای خوشه-بندی برای خوشهبندی مجموعه دادههای بیمـاران و از ماشـین بردار پشتیبانی برای طبقهبندی انواع بیمـاری و از رویکـرد PCA برای کاهش ابعاد استفادهشده کـه نتـایج نشـان داده ایـن روش متشکل از خوشهبندی، PCA، SVM دقت طبقهبنـدی خـوبی بـه دست آورده است. علاوه براین در مرجع ]٨[ محققان به بررسـی و مقایسه دقت طبقهبندی دادههای مختلف بـا اسـتفاده از تکنیـکهای یـادگیری ماشـین بـرای پـیشبینـی بیمـاری مـزمن قلـب پرداختهاند که در این بررسـی از الگـوریتمهـایی از قبیـل SVM, RF,DT, KNN,NB و درخت تصمیم استفادهشده همچنین از الگوریتمهـای تقـویتی نظیـر Bagging, Boosting, Satcking نیز استفاده شده است که نتایج نشان داده که اسـتفاده از روش Bagging با روش SVM بـهدقـت بـالای ٨١,٨٤ درصـد رسیده است. همچنین در مرجـع ]٩[ محققـان بـه توسـعه یـک چارچوب نیمهخودکار مبتنی بر یادگیری ماشین برای شناسـایی دیابت نوع ٢ از طریق پرونده الکترونیک سلامت ارائه کرده اند که در این چارچوب به ارزیابی و مقایسه کـارایی تکنیـکهـا جهـت شناسایی مـدلهـای فراوانـی از مـدلهـای یـادگیری ماشـین از قبیـــل:SVM, RF,DT, KNN,NB و رگرســـیون منطقـــی استفادهشده کـه نتـایج تجربـی نشـان مـیدهـد کـه چـارچوب پیشنهادی میتواند افراد مبتلابه دیابت نوع ٢ را بـا میـانگین ٩٨ درصد تشخیص دهد. درنهایت در مرجـع ]١٠[ محققان، مجموعـه انــواع مختلــف تکنیــکهــا و الگــوریتمهــای یــادگیری ماشــین و ابزارهــایی کــه بــرای تحلیــل بیمــاری و فرآینــد تصــمیمگیــری مورد استفاده قرار میگیرد را مورد بررسی قرار داده اند که بهمنظور تجزیهوتحلیل الگـوریتمهـای یـادگیری ماشـین بـرای تشـخیص بیماریهای مختلفی از قبیل بیماری قلبی، دیابت، کبد و بیماری هپاتیت مورداستفاده قرارگرفته است. درنتیجه یادگیری ماشـین و دادهکاوی نقش مهمی برای کشف دانش در پایگـاه داده دارد کـه یک فرایند تکراری از تمیـز کـردن دادهها؛ ادغـام دادهها، انتخـاب داده و تشخیص الگو و شـناخت دانـش داده دارد کـه در حـوزه پزشکی نیز حضور قابلتـوجهی دارد کـه بـرای تشـخیص انـواع بیماریهای مزمن مانند: دیابت، سرطان ریه، بیماری قلبی، نارسـایی کلیه، سنگ کلیه و اختلالات کبدی استفاده میشود.
٣- سازمانبندی اینترنت اشیا در سلامت هوشمند
اینترنت اشیا بهعنوان یک زیرسـاخت جهـانی بـرای جامعـه اطلاعاتی موردتوجه قرارگرفته و خدمات پیشـرفتهای بـهوسـیله اتصــالات (فیزیکــی و مجــازی) بــر اســاس اطلاعــات موجــود و درحالتوسعه، اطلاعــات و ارتباطــات در اختیــار قــرار داده و ازآنجـاییکـه بسـیاری از فـنآوریهـا، خـدمات و اســتانداردهای مختلف را در برمیگیرد، که در ده سال آینـده بـهعنـوان سـنگ گوشهای از بـازار فنـاوری اطلاعـات در نظـر گرفتـه مـیشـود. از دیدگاه منطقی، یک سیستم IoT را میتوان بهعنوان مجموعـهای از دستگاههای هوشمند که بر پایه همکاری تعامـل دارنـد، بـرای نشان دادن یک هدف مشترك نشان داد که اینترنت اشیا جهـان مادی را با جهان اطلاعات ادغام کرده و سرویسهـای معمـولی و برنامههای کاربردی را برای بهبود زندگی انسانها فراهم میکنـد بیتردید، ارتباطات موجودات (اشیاء یا چیزها) در زمینه اینترنـت اشیا (IoT)، نقش فعالی در فعالیتها، دستگاهها و پروسـههـای انسانی بازی میکند ]١٣,١٢,١١[.
بنابراین اینترنت اشیا برای وسـایل و حـسگرهـای پزشـکی متصل شده نقش مهمی در صنعت مراقبت بهداشتی نسل بعـدی برای مراقبت از بیماران باکیفیت دارد. با توجه به افـزایش تعـداد سالمندان و افـراد معلـول، یـک نیـاز فـوری بـه زیرسـاختهـای مراقبتهای بهداشـتی در زمـان واقعـی بـرای تحلیـل دادههای مراقبــتهــای بهداشــتی بیمــاران وجــود دارد تــا از مرگومیر قابــلپیشــگیری جلــوگیری شــود ]١٤[ زیــرا ارائــهدهنــدگان مراقبتهای بهداشتی بهطور مداوم رفتار و سـلامت سـالمندان را نظارت میکنند کـه سیسـتم مـورد انتظـار بایـد وظـایفی ماننـد شناسایی و پیشگیری از تصـادفات و انتقـال پارامترهـای بـدن از قبیل: ضربان قلب، دمای بدن، فشارخون، سطح قند خـون و...بـه محـل کـار (بیمارسـتان) را انجـام دهـد کـه در حـوزه سـلامت هوشمند استفاده از دستگاههای پوشیدنی بهتـدریج قابلیـتهـای خود را در دهههای گذشته افزایش داده است. ]١٥[ که از مزایای مراقبــتهــای بهداشــتی مبتنــی بــر IoT در مراقبــت از بیمــاران میتوان به:
• امکان مشاهده وضعیت بیمـار سـلامتی بیمـار (بـهصـورت جزئی و دقیق) در هرلحظه
• نظارت بر وضعیت بیماران در بیمارستان و خانه سالمندان
• جلــوگیری از هزینــههــای درمــانی غیرضــروری و ارائــه حمایتهای پزشکی مناسب در زمان مناسب
• ارتقا کیفیت زندگی برای افرادی که نیـاز بـه پشـتیبانی یـا نظارت دائم دارند.
در نتیجه تکنولوژی اینترنت اشـیا در صـنعت مراقبـتهـای شخصی دارای مزایای بالقوهای بوده، ولی با چالشهـای فراوانـی روبهرو است ]١٦[ پیشرفتهای بهداشتی اینترنت اشیاء و یا سلامت هوشمند، بدون چالش نیست کـه یکـی از چــالشهــای اصــلی IOT در ســلامت هوشــمند تشــخیص و پیشبینی دقیق نتایج بیماری مزمن میباشد. که با کمک آن میتوان به پیشرفت این بیماری و جلوگیری از اثرات منفی آن رسید. برای این منظور دادهها از ابزارهاو وسایل اینترنت اشیاء مثل ساعت و سنسورهای هوشمند که به بدن بیماران متصل میباشد استفاده میشود و اطلاعات آنها پایش میشود.
4- مدل ساختار نظارت بر سلامت و مراقبت پزشکی
با توسعه سریع فن آوری اطلاعات، حجم داده نیز با سرعت شگفت انگیزی افزایش مییابد. به تازگی، پردازش ابری و اینترنت اشیا داغترین موضوع در صنعت فناوری اطلاعات هستند. پردازش ابری مزایایی در مقیاس پذیری عالی و قیمت پایین دارد، در حالی که تکنیک اصلی اینترنت اشیا مانند حسگر و RFID قبلا در مقیاس وسیع مورد استفاده قرار گرفته است. بسیاری از شرکتهای فناوری معروف مانند مایکروسافت، آمازون، آی بی ام و گوگل قبلا ابر خود را به صورت موفقیت آمیز ساخته اند و خدمات ابری را در مدیریت اطلاعات، ذخیرهسازی دادهها، جستجوی اطلاعات و ... ارائه میدهند. با این حال، آشنایی مردم نسبت به ابر رایانه و اینترنت اشیا در برنامه پزشکی مدرن کافی نیست. اینترنت اشیا تولید فناوری اطلاعات است. اینترنت اشیا رشته اطلاعات در فرصتهای توسعه و تغییر است. کمیته اتحادیه اروپا بر این باور بود که برنامه توسعه اینترنت از طریق حل مسائل مدرن جامعه در آینده حل و فصل خواهد شد و سهم بسیار بزرگی را به همراه خواهد داشت. راهبردهای مدرن با استفاده از تکنولوژی اطلاعات مدرن تحت رفتار ساختار مدیریت مدرن قرار میگیرد. در این راستا سه درخواست اساسی شامل سرویس بهتر ؛ هزینه کمتر و سرعت سریعتر میباشد. فناوری اطلاعات پزشکی کاربرد گسترده ای در برنامههای مدرن دارد.
فناوری اطلاعات پزشکی و خدمات بهداشتی و درمانی با رفاه ملی و معیشت مردم ارتباط دارد. ادغام پردازش ابری و اینترنت اشیا یک پیشرفت بزرگ در کاربرد پزشکی مدرن خواهد بود. از آنجا که محاسبات ابری دارای مزایایی در مقیاس وسیع است، قابلیت اطمینان بالا، مجازیسازی، راندمان بالا و امکان پذیر ساختن ابر عمومی در بیمارستانها و بیماران میتوانند به اشتراکگذاری منابع، صرفه جویی در هزینه و ایجاد نظارت پزشکی و مدیریت سیستم با راندمان بالا کمک کنند. اینترنت اشیا، به عنوان یک پشتیبان مهم در انجام نظارت و مدیریت ایمن، با کارایی وکیفیت بالاست، تکنیکهای اصلی آن مانند حسگرهای RFID و حسگرهای الکترومغناطیسی صوتی عکس میتواند موفقیتهای زیادی در انتقال اطلاعات پزشکی، نظارت پزشکی هوشمند و مکان دقیق داشته باشد. اینترنت اشیا راحتی زیادی به ویژه در نظارت و مدیریت ردیابی بیمار را به بیمارستان اختصاص میدهد. با توسعه سریع اینترنت و ادغام پردازش ابری و اینترنت اشیا، پلت فرم مراقبت و نظارت پزشکی فرصت جدیدی را برای بیمارستان و حتی تمام جامعه فراهم میکند.
این مقاله تکنولوژی اطلاعات پزشکی را در زمینه پردازش ابری و اینترنت اشیا، به ویژه در زمینه کاربرد نظارت و مدیریت پزشکی را بکار گرفته است. یک معماری مدل برای نظارت از راه دور و مدیریت پلت فرم ابر اطلاعات بهداشتی پیشنهاد و تحلیل میشود و سپس یک الگوریتم مبتنی بر الگوریتم ژنتیک کارآمد برای نظارت پزشکی و مدیریت کاربرد پردازش ابری ارائه شده است که این مقاله از طریق ایجاد یک زمانبندی کارآمد و با الگوریتم ژنتیک این مطالعه را بهبود میبخشد.
پلت فرم ابر کنترل از راه دور در اطلاعات بهداشتی شامل حسگرهای بدن، شبکه حسگر، ماژول ارتباطی، درگاه1 مربوط به خانه، تجزیه و تحلیل اطلاعات پزشکی و پردازش پلت فرم، وسایل پزشکی و غیره است. شکل 1 یک معماری کلی پلت فرم نظارت از راه دور اطلاعات مراقبتهای بهداشتی را نشان میدهد که شامل سه ماژول اصلی یعنی حسگرهای شبکه حسگر بیسیم، مرکز محاسبات ابری و کاربران است و همچنین میتواند به عنوان یک نمونه اولیه از اینترنت اشیا در نظر گرفته شود.
شکل 1. معماری کلی پلت فرم نظارت از راه دور اطلاعات مراقبتهای بهداشتی
این سیستم دارای اجزایی به شرح زیر است:
• مرکز محاسباتی در شبکه حسگر بیسیم، ماژول محاسبات ابری، موتور استنتاج و غیره
• مرکز برنامهریزی منابع بین کاربر و پایگاه داده.
• مرکز ارتباطی میان محاسبات ابری، شبکه حسگر بیسیم و ماژولهای کاربر.
در این محیط حسگرهای بدن قادر به ثبت و حذف شبکه ناحیه پزشکی بدن میباشند. حسگر پزشکی بدن را میتوان به حسگر تعبیه شده بر روی بدن و حسگر پوشیدنی تقسیم کرد. این حسگر باید مصرف انرژی کم، کوچک و تهاجم کمی به بدن انسان داشته باشد. مزیت حسگر پوشیدنی راحتی استفاده از آن است؛ اما از زمانی که حالت سنجش محدود شده است، کاربرد آن محدود شده است. حسگر تعبیه شده بر روی بدن میتواند محدوده آن را گسترش دهد، اما با این حال باید از طریق عمل در بدن کاشت شود و بنابراین دستکاری آن دشوار است. علاوه بر این حسگرهای کنترلی سلامت بدن بر روی انسان تمرکز میکنند، بنابراین باید احتمال جابجایی و تحرک آنها را در نظر گرفت. حسگرهای معمول در سیستم کنترلی سلامت بدن عبارت از فشارخون، درجه حرارت بدن، موقعیت و غیره میباشد. ماژول ارتباطی، اطلاعات پزشکی بدن را به gateway خانه یا تلفن همراه انتقال میدهد. این اطلاعات پزشکی به مرکز ذخیرهسازی دادهها و پردازش داده ارسال میشود. سپس پس از پردازش سیستم خبره، راهنماییهای بهداشتی به بیمار یا بیمارستان ارسال میشود.
اطلاعات پزشکی جمعآوریشده توسط شبکه حسگر متنوع است. دادههای پرونده سلامت شخصی بسیار زیاد است و به سرعت در حال افزایش است؛ بنابراین مقدار زیادی از اطلاعات نیاز به طبقهبندی خودکار، تجزیه و تحلیل و پردازش دارند. اطلاعات برای همه ارائهدهندگان خدمات در دسترس است. به عنوان مثال، مرکز خدمات ایمنی ارائه خدمات امنیتی؛ مرکز کنترل اضطراب بیماری در پیشگیری از وضعیت بیماری گروهی را کنترل و مدیریت میکند. مرکز خدمات اضطراری با توجه به اطلاعات استخراج شده کمکهای اولیه ارائه میدهد؛ بیمارستان تشخیص از راه دور تحت اطلاعات پزشکی را فراهم میآورد؛ مرکز توانبخشی راهنماییهای توانبخشی از راه دور با توجه به انواع اطلاعات بازیابی فراهم میکند. مرکز خدمات بهداشتی، از طریق استخراج اطلاعات بهداشتی خود، به کاربر راهنمایی میکند. به این ترتیب باید ابزار به اشتراکگذاری منابع شبکه مورد نیاز باشد. علاوه بر این، یک روش مؤثر برای استخراج اطلاعات ضروری است. شبکه حسگر بدن باید قابلیت انتقال قابل اعتماد را دارا باشد. مطالعات امروزی نشان میدهد که حسگر تعبیه شده در بدن تمایل به استفاده از 400 مگاهرتز دارد و حسگر پوشیدنی مایل به استفاده از فرکانس 4/2 گیگاهرتز است. بنابراین هر کدام دارای قابلیتها و محدودیتهای خاص خود میباشند، با توجه به محیط و موارد دیگر میتوان از نوع مناسب استفاده نمود.
5- روش پیشنهادی برای تشخیص بیماری مبتنی بر نظارت پزشکی با اینترنت اشیا
معرفی تشخیص بیماری بر اساس شبکه اینترنت اشیا (IoT) نشان دهنده یک پیشرفت پیشگامانه در زمینه مراقبتهای بهداشتی و سلامت عمومی است. اینترنت اشیا با شبکه به هم پیوسته دستگاهها و حسگرها، نقشی اساسی در ایجاد انقلابی در نظارت، پیشگیری و مدیریت بیماری ایفا میکند. در این سیستم نوآورانه، حسگرها و دستگاههای IoT به صورت استراتژیک در مکانهای مختلف، مانند امکانات مراقبتهای بهداشتی، فضاهای عمومی و حتی داخل خانهها مستقر میشوند. این حسگرها برای جمعآوری طیف متنوعی از دادهها، از جمله علائم حیاتی، عوامل محیطی و اطلاعات سلامتی تولید شده توسط کاربر، مجهز هستند. سپس این دادهها به صورت بلادرنگ به یک پلتفرم مرکزی منتقل میشوند، جایی که میتوان آنها را با الگوریتمهای پیشرفته تجزیه و تحلیل و پردازش کرد.
یکی از مزایای کلیدی استفاده از اینترنت اشیا در تشخیص بیماری، توانایی آن در ارائه اطلاعات به موقع و دقیق است. با پایش مداوم علائم حیاتی و پارامترهای محیطی، دستگاههای اینترنت اشیا میتوانند علائم هشدار دهنده اولیه بیماریهای عفونی، شرایط مزمن یا حتی عوامل محیطی را که ممکن است مشکلات سلامتی را تشدید کنند، شناسایی کنند. این رویکرد پیشگیرانه، متخصصان مراقبتهای بهداشتی را قادر میسازد تا به سرعت مداخله کنند، از گسترش بیماریها جلوگیری کرده و شدت بیماری را کاهش دهند. اینترنت اشیا همچنین نظارت از راه دور بیمار را تسهیل میکند، که به ویژه در مدیریت بیماریهای مزمن ارزشمند است. بیماران میتوانند از دستگاههای پوشیدنی متصل به شبکه اینترنت اشیا برای ردیابی وضعیت سلامتی و پایبندی خود به برنامههای درمانی استفاده کنند. ارائه دهندگان مراقبتهای بهداشتی میتوانند به این دادهها در زمان واقعی دسترسی داشته باشند و آنها را قادر میسازد تا تصمیمات آگاهانه بگیرند و مراقبت شخصی را بدون نیاز به بازدیدهای مکرر حضوری ارائه دهند. علاوه بر این، اینترنت اشیا میتواند در ردیابی شیوع بیماریهای عفونی در مقیاس بزرگ بسیار مفید باشد. با تجزیه و تحلیل دادههای حسگرهای مختلف، مقامات بهداشتی میتوانند نقاط داغ بیماری را شناسایی کنند، روندها را پایش کنند و منابع را به طور مؤثر تخصیص دهند. این رویکرد مبتنی بر دادهها میتواند به کاهش تأثیر شیوع و همهگیری کمک کند و پاسخی چابکتر و کارآمدتر را ممکن میسازد. اینترنت اشیا ابتکارات بهداشت عمومی را با ترویج اقدامات پیشگیرانه افزایش میدهد. دستگاههای هوشمند میتوانند اطلاعات و هشدارهای بهداشتی را در زمان واقعی منتشر کنند، به مردم در مورد خطرات بیماریها آموزش دهند و رفتارهای سالم را تشویق کنند. به عنوان مثال، دماسنجهای هوشمند میتوانند دمای بالا را در افراد تشخیص دهند و به آنها اطلاع دهند که به دنبال مراقبتهای پزشکی باشند یا خود را ایزوله کنند و به مهار زودهنگام بیماریها کمک کنند.
یکی از روشهای کلیدی برای جمعآوری اطلاعات مربوط به بیماری دیابت از بیماران، استفاده از سنسورهای نظارت مداوم اطلاعات حیاتی بیمار است. این حسگرهای مینیاتوری در زیر پوست بیمار، معمولاً روی شکم، کاشته میشوند و به طور مداوم سطح اطلاعات حیاتی بیمار را اندازه گیری میکنند. این دادهها جمع آوری شده و به صورت بی سیم به گیرنده یا گوشی هوشمند منتقل میشوند، جایی که میتوان آنها را بیشتر تجزیه و تحلیل و تجسم کرد. حسگرهای اطلاعات حیاتی بیمار دادههای بیدرنگ را ارائه میدهند و بیماران و ارائهدهندگان مراقبتهای بهداشتی را قادر میسازند تا بر روند گلوکز را نظارت کنند و درباره دوز انسولین، انتخابهای غذایی و رژیمهای ورزشی تصمیمگیری آگاهانه بگیرند. علاوه بر این، ماهیت مداوم دادههای اطلاعات حیاتی بیمار به تشخیص زودهنگام خظرات مرتبط با دیابت کمک میکند و امکان مداخلات به موقع را برای جلوگیری از نوسانات خطرناک در سطح قند خون فراهم میکند. این روشها برای جمعآوری اطلاعات مرتبط با دیابت، از فناوریهای اینترنت اشیا استفاده میکنند تا دیدی جامع از مدیریت دیابت به بیماران و ارائهدهندگان مراقبتهای بهداشتی ارائه کنند. این راهحلها با نظارت مستمر سطوح گلوکز و تجویز انسولین، افراد مبتلا به دیابت را قادر میسازد تا تصمیمات آگاهانه بگیرند و به تیمهای مراقبتهای بهداشتی اجازه میدهد تا مداخلات مراقبتی شخصیتر و به موقعتری را ارائه دهند.
اســتفاده از فنــاوری یــادگیری ماشــین در ســالهای اخیــر محبوبیت زیادی پیداکرده است بطوریکه یادگیری ماشین علمـی است که کامپیوتر بدون اینکـه یکپارچـه برنامـهریـزی شـوند بـا استفاده از دادههای آموزشی که از قبل بـه سیسـتم Train مـی-شوند یاد میگیرند که در این مقاله از رویکرد یـادگیری گروهـی که یک الگوریتم تقویتی بهمنظور بهبود دقت پیشبینـی بیمـاری دیابت ارائهشده است که قبل از استفاده از این روش، ما از رویکرد انتخاب ویژگی بهمنظـور یـافتن ویژگی هـایی کـه دررونـد تشخیص سریع دیابت واریانس بیشتری دارند استفاده میکنیم تا نتایج دقت پـیشبینـی را بـا اسـتفاده از نتـایج انتخـاب ویژگـی به دست بیاوریم. انتخـاب ویژگـی، فرآینـد یـافتن متغیرهای مرتبط برای یک مدل پیشبینی است. این تکنیـکهـا میتواننـد بـرای شناسـایی و حـذف ویژگـیهـای غیرضـروری و بیمعنی که باعث کاهش صحت مدل پیشبینـی شـوند. انتخـاب ویژگی و انتخاب نمونـه دو مرحلـه مهـم پـیشپـردازش دادهها درداده کــاوی اســت، کــه در آن ســابق باهــدف حــذف برخـی از ویژگــیهــای نامناســب و یــا ازکارافتــاده از یــک مجموعــه داده اختصاص دادهشده است و دومی در حذف دادههای معیوب است. الگوریتمهای ژنتیکی برای این وظایف در مطالعات مرتبط بهطـور گستردهای مورداستفاده قرارگرفتهاند. بااینحال، ایـن دو وظیفـه قبل از پردازش اطلاعات بهطورکلی در ادبیـات جداگانـه در نظـر گرفتهشده است. بنابراین هدف ایـن مطالعـه، انتخـاب و انتخـاب نمونه بر اساس الگوریتمهای ژنتیکی بـا اسـتفاده از اولویـتهـای مختلــف بــرای بررسـی عملکــرد طبقــهبنــدی بــر روی مجموعــه دادههای مختلف است.
که در این مقاله ما از الگوریتم ژنتیـک (GA) بـرای انتخـاب ویژگــیهــای بهینــه اســتفاده مــیکنــیم. ایــن روش فضــای زیرمجموعههای احتمالی را برای به دسـت آوردن مجموعـهای از ویژگیهایی کـه حـداکثر دقـت پـیشبینـیشـده را بـه حـداقل میرساند و ویژگیهای نامناسب را به حداقل میرسـاند، بررسـی میکند. مـا یـک همبسـتگی چندگانـه را در یـک تـابع تناسـب استفادهشده توسط GA بـرای ارزیابی تناسـب هـر زیرمجموعـه ویژگی در رابطه با دامنه آن معرفی میکنیم.
5-1- انتخاب ویژگی توسط الگوریتم ژنتیک
بهصورت ویژه، یکراهحل بالقوه برای یک مسئله بهینهسازی، بهعنوان یک دنباله ژن که بهعنوان کروموزوم هم شناخته میشود، در الگوریتم ژنتیک رمزگذاری شده است. جمعیتی از راهحلهای احتمالی از کروموزومها، بهسوی راهحلهای بهتر، با داشتن تعداد کمتری از ویژگیها تکامل پیداکرده و در نهایت به راهحل بهینه دست پیدا میکند. معمولاً چنین راهحلهایی، در یک رشته دو دویی 0 و 1 رمزگذاری میشوند. در زنجیره دودویی 0 نشان میدهد که ویژگیهای مرتبط انتخاب نشده و از مجموعه ویژگی حذف شدهاند، در حالی که 1 بر این دلالت دارد که ویژگی موردنظر، انتخابشده است. کروموزومهای اولیه به صورت تصادفی به عنوان والدین انتخاب میگردند که میتوانند یک نسل2 جدید را تولید کنند که این امر از طریق اعمال عملگرهای ژنتیک، یعنی انتخاب، جهش و تقاطع در فرآیند تکامل حاصل میگردد. عملکرد هر کروموزوم توسط یک تابع برازش3 و شایستگی مورد بررسی قرار گرفته که نزدیکی هر کروموزوم به راهحل را اندازهگیری میکند. این تابع شایستگی، تفکیکپذیری4 نمونهها با دستههای مختلف را مدنظر قرار داده و معیار تکراری بودن5 در بین ویژگیها را در برمیگیرد. در این حال، میتوان راهحلهایی را پیدا کرد که دربردارنده تعداد کوچکتری از ویژگیها باشند. پس از این مرحله ارزیابی، یک گروه از والدین6 (منشاء ها) از جمعیت حاضر با استفاده از انتخاب چرخ رولت7 و روش تقاطع تک نقطهای8، انتخاب میشوند. تعدادی از بهترین اعضا مستقیماً به عنوان بخشی از جمعیت جدید بر مبنای یک راهبرد نخبه گرایانه9، کپی میشوند. پس از این، عملیات تقاطع و جهش برای شکل دادن به یک نسل جدید، مورد استفاده قرار میگیرند. در هر نسلی، تعداد کروموزومها در جمعیت با حذف کروموزومهایی که دارنده کمترین مقادیر شایستگی هستند، بدون اصلاح باقی میماند. این فرآیند تا زمانی تکرار میشود که یک کیفیت از پیش تعیینشده از شایستگی یا تعداد حداکثر تکرارها به دست آید. بهترین کروموزوم در جمعیت نهایی، راهحل بهینه برای مسئله انتخاب ویژگی میباشد.
حال مراحل این الگوریتم را با جزئیات بیشتری مورد بررسی قرار میدهیم :
در مرحلهی اول یک جمعیت تصادفی از 100 کروموزوم متفاوت داریم که این کروموزومها شامل مقادیر صفر و یک هستند. هر کروموزوم به صورت یک بردار 56بعدی (56×1) میباشد که در اینجا ستونهای صفر بیانگر عدم انتخاب ویژگی و ستونهای یک بیانگر انتخاب ویژگی هستند. عدد 56 بیانگر تعداد ویژگیهای مجموعه داده مورد استفاده است. حال در مرحلهی دوم بایستی ستونهای صفر حذف شوند و فقط ستونهای یک باقی بمانند و عمل طبقه بندی بر رو ویژگیهای موجود انجام گردد.
5-2- تابع ارزیابی الگوریتم ژنتیک
یک راهحل بالقوه برای یک مسئله بهینهسازی، بهعنوان یک دنباله از اعداد باینری که بهعنوان کلونی هم شناخته میشود در الگوریتم ژنتیک رمزگذاری شده است. جمعیتی از راهحلهای احتمالی از کروموزومها و کشورهای تحت سلطه آنها، به سوی راهحلهای بهتر، با داشتن تعداد کمتری از ویژگیها تکامل پیدا کرده و درنهایت به راهحل بهینه دست پیدا میکند. معمولاً چنین راهحلهایی، در یک رشته دو دویی 0 و 1 رمزگذاری میشوند. در زنجیره دودویی 0 نشان میدهد که ویژگیهای مرتبط انتخاب نشده و از مجموعه ویژگی حذف شدهاند، در حالی که 1 بر این دلالت دارد که ویژگی موردنظر، انتخابشده است. راهحلهای اولیه به صورت تصادفی بهعنوان جمعیت کروموزومها انتخاب میگردند که میتوانند یک نسل10 جدید را تولید کنند که این امر از طریق ترکیب وتقاطع کروموزومها و سپس اعمال فرآیند جهش و به روز رسانی آنها حاصل میگردد. عملکرد هر کروموزوم توسط یک تابع برازش11 و شایستگی موردبررسی قرارگرفته که نزدیکی هر راهحل به راهحل را اندازهگیری میکند. در بسیاری از رویکردهای انتخاب ویژگی قبلی تنها از یک تابع هدف بر اساس بررسی توزیع دادهها پشتیبانی میگردد که این امر منجر به حذف بسیاری از راهحلهای کارآمدی میگردد که ممکن است بر اساس اهداف کارایی دیگری دارای قدرت باشند. در واقع ارزیابی این زیرمجموعهها با یک روش انجام میشود که منجر به پس زدن زیرمجموعههایی با خواص خوب با توجه به معیار دیگری میشود. در این زمینه، راهحل با افزونگی بسیار کم یا همبستگی بسیار بالا که دو هدف کارایی بسیار مهم میباشند، میتواند توسط فرآیند انتخاب رد شود. برای افزایش تنوع زیرمجموعههای انتخاب شده ، در این مقاله فضای جستجوی بسیار بزرگ مسئله با یک روش چند منظوره مورد بررسی قرار میگیرد. ارزیابی کیفیت اهداف کارایی بیان شده براساس اطلاعات متقابل12 صورت میپذیرد تا بهطور جداگانه میزان همبستگی دادهها و افزونگی زیر مجموعه ویژگیهای انتخابی را اندازهگیری کند. این دو معیار هر دو کیفیت اختصاصی ویژگیهای انتخاب شده و کیفیت زیر مجموعه را اندازهگیری میکند.
· فرمولهسازی مسئله
در این بخش ما فرموله سازی معیارهای انتخاب ویژگی به عنوان تابع هدف الگوریتم ژنتیک و نحوه محاسبه آنها را ارائه میدهیم. اطلاعات متقابل یک شاخص خوب برای مطالعه وابستگی بین یک ویژگی و طبقهبندی و افزونگی بین ویژگیهای تصادفی است.X وY را به عنوان دو متغیر تصادفی با قوانین احتمال گسسته در نظر بگیرید. اطلاعات متقابل دو متغیر X وY با I(X,Y) نشان داده شده و از طریق P(X) و P(Y) و P(X,Y) به صورت زیر تعریف میشود:
(1)
که در آن ΩX و ΩY به ترتیب فضاهای نمونه X و Y به ترتیب هستند. هنگامی که دو متغیر Xو Y به یکدیگر وابسته هستند. I(X,Y) زیاد است و در نقطه مقابل هنگامی که X و Y بهطور کامل از هم مستقل هستند، I(X,Y) برابر با صفر است. بعد از محاسبه اطلاعات متقابل، ما دو هدف کارایی مختلف را برای انتخاب بهترین زیرمجموعه از بین راهحلهای تولیدی توسط الگوریتم ژنتیک را دنبال میکنیم. اولین هدف کیفیت مجموعه ویژگیهای انتخابی در راستای پیشبینی هدف دادهها که تحت عنوان کلاس بیان میگردد، را ارزیابی میکند و دومین هدف به بررسی افزونگی و تکراری بودن مجموعه ویژگیها میپردازد. این دو هدف در ادامه بیان شدهاند.
· همبستگی ویژگیها با کلاس
برای هر زیرمجموعه از ویژگیها، ما مفهوم ارتباط را که از طریق وابستگی بیان میگردد را تعریف میکنیم که در واقع از طریق محاسبه میانگین اطلاعات متقابل بین هر یک از ویژگیهای موجود در مجموعه ویژگیهای انتخابی با مجموعه هدف دادهها یعنی کلاس دادهها که از طریق متغیر C نشان داده میشود، به دست میآید. نحوه محاسبه این رابطه در زیر نشان داده شده است:
(2)
که در آن I(xi, c) بیانکننده مقدار اطلاعات متقابل بین ویژگی iام در زیرمجموعه ویژگی انتخابی کاندید و کلاس دادهها میباشد و بیانکننده این واقعیت است که این ویژگی با چه کیفیتی کلاس دادهها را بیان میکند.
· کاهش افزونگی بین ویژگیهای انتخابی
در یک راهحل انتخابی ممکن است، دو یا بیش از دو ویژگی در هدف اول یعنی ارتباط و همبستگی با کلاس بسیار خوب باشند، اما این ویژگیها به نحوی دارای افزونگی بوده و بتوان با داشتن یکی از آنها به مقادیر دیگر ویژگیها دست یافت. در این شرایط میبایست ویژگیهای انتخابی در راستای کاهش افزونگی و حذف ویژگیهای تکراری بررسی گردند. در اینجا از اطلاعات متقابل برای ارزیابی افزونگی بین ویژگیها استفاده میگردد. در اینجا دو متغیر i و j از یک مجموعه ویژگیهای کاندید توسط الگوریتم ژنتیک بهصورت نشان داده شده و از طریق رابطه زیر محاسبه میگردد:
(3)
بعد از محاسبه دو هدف مورد استفاده و تحقیق در این مقاله یعنی همبستگی دادهها با کلاس و همچنین افزونگی ویژگی، تابع هدف و نهایی این تحقیق برای ایجاد توازن مناسب در بین این دو هدف بیان میگردد. مدل ما دیدگاهی منحصر به فرد و نوآورانه را برای استفاده از الگوریتمهای ژنتیک در تشخیص بیماری دیابت معرفی میکند. در حالی که الگوریتمهای ژنتیک واقعاً در مطالعات قبلی مورد استفاده قرار گرفتهاند، نوآوری ما در استفاده از یک رویکرد مبتنی بر فیلتر برای محاسبه تابع هدف در طول انتخاب ویژگی نهفته است. به طور سنتی، الگوریتمهای ژنتیک در انتخاب ویژگی عمدتاً بر به حداقل رساندن همبستگی بین ویژگیهای انتخاب شده برای کاهش افزونگی تمرکز میکنند. در مقابل، رویکرد ما فراتر از این پارادایم مرسوم است. هدف ما نه تنها به حداقل رساندن همبستگی بین ویژگیهای انتخابشده است، بلکه افزایش همبستگی بین این ویژگیهای انتخابشده و متغیر هدف، که وضعیت دیابت در مورد ما است، در اولویت قرار دارد. این تابع دوهدفه نشان دهنده یک رویکرد جدید و ظریف تر برای انتخاب ویژگی است، رویکردی که به طور خاص برای نیازهای تشخیص دیابت طراحی شده است. هدف ما افزایش معیار اول یعنی همبستگی ویژگیها با کلاس و کاهش هدف دوم یعنی افزونگی مابین ویژگیهاست. در اینجا از یک تابع هدف بهصورت رابطه زیر استفاده میگردد:
(4)
در این تابع هدف همبستگی دادهها در صورت کسر و هدف دوم یعنی افزونگی در مخرج کسر قرار میگیرد. با بزرگ شدن صورت و کوچک شدن مخرج حاصل کسر بزرگ شده و کیفیت بالاتری را نشان میدهد؛ بنابراین یک تعادل و توازن ما بین این دو هدف کارایی برقرار میگردد.
6- طبقه بندی با یادگیری گروهی
یادگیری گروهی یکی از روشهای یادگیری ماشین بوده که از الگوریتمهای فرا یادگیری برای دستیابی به نتـایج پـیشبینـی کننده بهتر استفاده میکنند تا بتـوان از هـر الگـوریتم یـادگیری دقت بهتری بـه دسـت آورد. بسـیاری از الگـوریتمهـای محبـوب یادگیری ماشـین درواقـع Ensemble هسـتند. در ایـن مقالـه، از الگوریتمهـای Stack Ensemble کـه متشـکل از الگـوریتمهـای مختلفی که در ادامه شرح داده خواهد شد استفاده میشـود کـه درواقع این روش یک کلاس از الگـوریتمهـای اسـت کـه شـامل آموزش ”یادگیرندههای قوی” برای پیدا کردن ترکیبی مطلوب از فراگیران پایه استفاده میکند که جزئیات این الگوریتمها در زیـر شرح دادهشده است :
Algorithm Stacking
Input: training data D = {Xi, yi}m i=1
Ouput: ensemble classifier H
Step 1: learn base-level classifiers
for t=:١ to T do
learn ht based on D
end for
Step2: construct new data set of predictions
for i= to m do
Dh = {Xi, yi}, where Xi } = {h1 (Xi),…,hT (Xi)}
end for
Step3: learn a meta -classifier
learn H based on Dh
return H
شکل ٢. الگوریتم Stacking
یادگیری گروهی فراینـدی اسـت کـه از طریـق آن چنـدین مدل، مانند طبقهبندیها و یـا متخصصـان، بـهطـور اسـتراتژیک تولید میشوند و برای حل یک مسئله اطلاعات محاسباتی خـاص ترکیــب مــیشــوند. یــادگیری گروهــیعمــدتاً بــرای بهبــود (طبقهبندی، پیشبینی، تقریب عملکـرد، و غیـره) عملکـرد یـک مدل استفاده میشود به همین دلیل است که روشهای گروهـی در بسیاری از مسابقات معتبر آموزشـی، ماننـد مسـابقه Netflix، KDD٢٠٠٩ و Kaggle قرار میگیرد.
7-ارزیابی نتایج
ما بهمنظور ارزیابی روشهای مورداسـتفاده و تعیـین اینکـه چگونه میتوان از بین مدلهای موجود، مدلی را در نظر گرفت که نسبت به بقیه روشها، دارای بیشـترین دقـت پـیشبینـی داشـته باشد که به مقایسه روشهای دستهبندی و یافتن روش مناسب و کــارا در ایــن مقالــه از تجزیــهوتحلیــل هزینــه ســود(ماتریس درهمریختگی)، منحنی ROC و سایر مسـائل مربـوط بـه انتخـاب مدل از قبیل دقت و غیره استفاده کردهایم.
اندازهگیری عملکرد برای تعیین اثربخشی الگـوریتم طبقـه-بندی مورداستفاده قرار میگیرد بـه ایـن صـورت کـه در مسـائل دستهبندی با دودسته، مـیتـوان هزینـه دسـتهبنـدی را بـا یـک ماتریس هزینه نشان داد بهاینترتیـب کـه بـرای دو نـوع خطـای مثبت اشتباه (FP) و منفی اشتباه (FN) و دو نوع دستهبندی بـه سمت مثبت درسـت (TN) و منفـی درسـت (TN) کـه هزینـه و سـودهــای متفـاوتی قائــل مـیشــود کـه در جــدول ١ نمــایش دادهشده است.
جدول 1. ماتریس درهمریختگی
Classified As: |
| Confusion Matrix | ||
Positive | Negative |
| ||
FP | TN |
| Negative | Actual Class |
TP | FN |
| Positive |
|
7-1- روشهای ارزیابی
روشهای ارزیابی | معیارهای ارزیابی |
دقت طبقهبندی ساده ترین اندازهگیری عملکرد دقت است که به معنای درصد دستههای درست پیشبینیشده است و از فرمول زیر محاسبه میشود. | TP+𝑇𝑁 |
TP+FP+TN+FN | |
حساسیت:نرخ مثبت واقعی:اگر نتیجه برای شخص مثبت باشد در چند درصد موارد مدل نیز مثبت خواهد بود که از فرمول زیر محاسبه میشود. |
|
خاصیت:نرخ منفی واقعی: اگر نتیجه برای شخص منفی باشد در چند درصد موارد مدل نیز نتیجه منفی خواهد بود که از فرمول زیر محاسبه میشود. |
|
خصوصیات گیرنده (ROC): که برای ارزیابی مدلها، یک نموداری میکشد که هرکدام از این مدل ها، که سطح زیر نمودار بیشتری داشته باشد. آن مدل، مدل بهتری است که از معیارهای زیر برای مقایسه مدلهای دستهبندی بهطور گرافیکی استفاده میشود. |
|
اگر مدل نتیجه مثبت بدهد احتمال اینکه شخص به دیابت دچار شود چقدر استPPV: |
|
.اگر مدل نتیجه مثبت بدهد احتمال اینکه شخص به دیابت دچار شود چقدر استNPV: |
|
7-2- شبیهسازی
در این بخش به شبیهسازی مقاله خود پرداخته و ارزیابی میکنیم. محیط شبیهسازی ما در ماژول Jupyter مبتنی بر برنامهنویسی پایتون ورژن 3.6 انجام شده است. هم چنین عملکرد دستهبندهای مختلف را میتوان با بهکارگیری آن در مورد یک مثال مقایسه کرد که به منظور شبیهسازی دستهبندها از مجموعه داده بیماران پیمای دیابتی از سایت UCI بهره گرفته شده که این مجموعه داده دارای ۹ متغیر و ۷۶۸ رکورد است که این متغیرها و اسامی اختصاری در جدول ۲ آمده است.
جدول 2. متغیرهای مسئله و اسامی اختصاری
Number of times Pregant | P.NO |
Plasma Glucose Concentration | PG |
Diastolic Blood Pressure | DBP |
Triceps Skin Fold Thickness | TSFT |
Two Hour Serum Insulin | SI |
Body Moss Index | BMI |
Diabetes Pedigree Function | DPF |
Age | AGE |
Class Varible | C |
در نتیجه اشکال زیر، نتایج شبیهسازی را برای تک تک الگوریتمهای مختلف استفاده شده نشان میدهد. همان طور که اشاره شد ما از الگوریتم ژنتیک به منظور استخراج ویژگیهای تأثیرگذار در تشخیص سریع دیابت استفاده کرده ایم که نتایج شبیهسازی نشان میدهد از بین متغیرهای مجموعه داده فیچرهای ۱- تعداد دفعات بارداری، ۲-غلظت گلوکز دوساعته، ۳-میزان فشارخون، ۴-سطح انسولین و ۵-سن به عنوان فیچرهای مؤثر با دقت ۸۶ درصد انتخاب شدند که نتایج طبقهبندی را بر اساس همین ویژگیهای به دست آمده انجام دادیم که جدول زیر پارامترهای انتخابی برای الگوریتم ژنتیک را نشان میدهد.
جدول ۳. پارامترهای انتخابی برای الگوریتم ژنتیک
نرخ آمیزش | نرخ جهش | Gen | تعداد جمعیت |
0.2 | 0.1 | 56 | 40 |
در ادامه بهمراتب شرح داده خواهد شد که در ابتدا از روش ارزیابی HoldOut برای ارزیابی الگوریتمهای پایه استفاده کردیم که نتایج شبیهسازی در شکل زیر نشان داده شده است.
شکل 3: نتایج به دست آمده از روش HoldOut
شکل 4. نتایج به دست آمده از روش K-Fold
شکل 5. نتایج به دست آمده از دقت پیشبینی
شکل 6. نتایج به دست آمده از روش رأیگیری اکثریت
شکل 7. نتایج به دست آمده از روش پیشنهادی
در نهایت معیارهای عملکرد (ماتریس درهم ریختگی ) به ازای روشهای مختلف روی بیماران دیابتی در جدول 7-معیارهای عملکرد الگوریتم پیشنهادی را نشان میدهد.
جدول 4. معیارهای عملکرد به ازای روشهای مختلف
TREE | RFC | ANN | GNB | SVM | KNN |
|
89 | 85 | 0.70 | 0.70 | 0.73 | 0.73 | Accuracy |
89 | 85 | 0.76 | 0.83 | 0.70 | 0.65 | Sensitivity |
89 | 85 | 0.55 | 0.56 | 0.75 | 0.55 | Specificity |
89 | 85 | 0.81 | 0.78 | 0.87 | 0.65 | PPV |
89 | 85 | 1.5 | 0.64 | 0.55 | 0.65 | NPV |
89 | 0.99 | 0.76 | 0.83 | 0.70 | 0.76 | TPR |
0.42 | 0.25 | 0.44 | 0.43 | 0.29 | 0.44 | FPR |
در این پژوهش ما مسائل باز سلامت هوشمند را با راهکارهای مختلفی تجزیه و تحلیل کرده و در و چند مورد مشاهده شد که سلامت هوشمند میتواند به بهبود مراقبتهای بهداشتی در نظارت مداوم بر سالمندان کمک کرده و مسیر رسیدن به سلامت هوشمند را هموار سازد. در این مقاله ابزارهای مختلف اینترنت اشیاء برای جمع آوری اطلاعات بیماران مورد بررسی قرار گرفت که بر اساس ویژگی و نوع محیط ابزارهای تعبیه شده و پوشیدنی پیشنهاد شدند سپس این اطلاعات از طریق گیت وی آن مکان یا تلفن همراه شخص جهت تحلیل منتقل میشوند. در نهایت رویکرد پیشنهادی ما، پس از ارزیابی و مقایسه با الگوریتمهای پایه نشان داده است که نسبت به روشهای فوق، پیشرفته بوده و دقت به دست آمده با این مدل 93% بوده است. بنابراین با توجه به نتایج این شبیهسازی میتوان تصمیم گرفت که رویکرد پیشنهادی ما با توجه به ارزیابی نتایج، عملکرد بهتری نسبت به سایر روشها دارد و با توجه به اینکه الگوریتمهای پایه به تنهایی در تشخیص و پیشبینی بیماریها مؤثر نبوده، در این مقاله از الگوریتمهای Stack Ensemble با تلفیقی از تکنیکهای انتخاب ویژگی هیبرید به منظور بهبود دقت پیشبینی استفاده و در آخر با الگوریتمهای پایه مقایسه شده که الگوریتم پیشنهادی ما خطای کمتری نسبت بهروشهای پایه داشته و به دقت ۹۳ درصد رسیده است.
رویکرد پیشنهادی به تجزیه و تحلیل دادههای مرتبط با دیابت و تشخیص بیماری، جامع و نوآورانه است. استفاده از الگوریتمهای ژنتیک برای انتخاب ویژگی یک تکنیک قدرتمند است، زیرا انتخاب مرتبط ترین ویژگیها را با در نظر گرفتن همبستگی آنها با کلاس هدف (وضعیت دیابت) و یکدیگر بهینه میکند. این تضمین میکند که ویژگیهای انتخاب شده برای طبقه بندی آموزنده ترین هستند و به طور بالقوه دقت مدل را بهبود میبخشد و بیش از حد برازش را کاهش میدهد. استفاده از یک مدل یادگیری مجموعهای انباشته که طبقهبندیکنندههای مختلفی مانند ماشینهای بردار پشتیبان (SVM)، k-نزدیکترین همسایهها (KNN)، شبکههای عصبی مصنوعی (ANN)، درختهای تصمیمگیری، و گاوسی بیزی (GNB) را ترکیب میکند، یک استراتژی قوی است. هر طبقهبندی نقاط قوت و ضعف خود را دارد و با ترکیب آنها در یک مجموعه، مدلی انعطافپذیرتر و دقیقتر ایجاد میکنید. گروههای انباشته اغلب با استفاده از دانش متنوع هر طبقهبندیکننده، از مدلهای فردی بهتر عمل میکنند. این واقعیت که نتایج برتری روش پیشنهادی را نشان میدهد یک دستاورد قابل توجه است. این نشان میدهد که رویکرد پیشنهادی نه تنها انتخاب ویژگیها را افزایش میدهد، بلکه نقاط قوت طبقهبندیکنندههای متعدد را نیز بهطور بهینه ترکیب میکند، که منجر به یک سیستم تشخیص دقیقتر و قویتر بیماری دیابت میشود. این میتواند پیامدهای قابل توجهی برای بهبود نتایج مراقبتهای بهداشتی و مدیریت بیمار در زمینههای مرتبط با دیابت داشته باشد. با این حال، انجام اعتبارسنجی و آزمایش دقیق برای اطمینان از تعمیم و قابلیت اطمینان روش خود در مجموعه دادههای مختلف و سناریوهای دنیای واقعی مهم است. برای
منابع
1. Ahmad, M.O., Siddiqui, S.T. (2022). The Internet of Things for Healthcare: Benefits, Applications, Challenges, Use Cases and Future Directions. In: Tiwari, S., Trivedi, M.C., Kolhe, M.L., Mishra, K., Singh, B.K. (eds) Advances in Data and Information Sciences. Lecture Notes in Networks and Systems, vol 318. .
2. Hameed, G., Singh, Y., Haq, S., Rana, B. (2022). Blockchain-Based Model for Secure IoT Communication in Smart Healthcare. In: Singh, P.K., Kolekar, M.H., Tanwar, S., Wierzchoń, S.T., Bhatnagar, R.K. (eds) Emerging Technologies for Computing, Communication and Smart Cities. Lecture Notes in Electrical Engineering, vol 875..
3. Li, W., Chai, Y., Khan, F. et al. A Comprehensive Survey on Machine Learning-Based Big Data Analytics for IoT-Enabled Smart Healthcare System. Mobile Netw Appl 26, 234–252 (2021)..
4. Zheng, T., Xie, W., Xu, L., He, X., Zhang, Y., You, M., ... & Chen, Y. (2017). A machine learning-based framework to identify type 2 diabetes through electronic health records. International journal of medical informatics, 97, 120-127.
5. Somasundaram, S. K., & Alli, P. (2017). A Machine Learning Ensemble Classifier for Early Prediction of Diabetic Retinopathy. Journal of Medical Systems, 41(12), 201.
6. Nilashi, M., bin Ibrahim, O., Ahmadi, H., & Shahmoradi, L. (2017). An Analytical Method for Diseases Prediction Using Machine Learning Techniques. Computers & Chemical Engineering.
کارهای آتی از روش پیشنهادی در تشخیص بیماریهای مختلف مزمن استفاده میگردد. با توجه اهمیت تشخیص بیماری قصد داریم در کار آتی سیستم تشخیص بیماریهای مزمن به صورت زمان واقعی و سیستمهای توصیه گر و سامانههای پیام کوتاه را در کنار روش پیشنهادی پیادهسازی کنیم.
7. Nilashi, M., Bin Ibrahim, O., Mardani, A., Ahani, A., & Jusoh, A. (2016). A soft computing approach for diabetes disease classification. Health Informatics Journal, 1460458216675500.
8. Pouriyeh, S., Vahid, S., Sannino, G., De Pietro, G., Arabnia, H., & Gutierrez, J. (2017, July). A comprehensive investigation and comparison of Machine Learning Techniques in
the domain of heart disease. In Computers and Communications (ISCC), 2017 IEEE Symposium on (pp. 204-207). IEEE.
9. Zheng, T., Xie, W., Xu, L., He, X., Zhang, Y., You, M., ... & Chen, Y. (2017). A machine learning-based framework to identify type 2 diabetes through electronic health records. International journal of medical informatics, 97, 120-127.
10. Yaqoob I (2021) Blockchain for healthcare data management: opportunities, challenges, and future recommendations. Neural Comput Appl 0123456789.
11. Shaikh, F. K., Zeadally, S., & Exposito, E. (2017). Enabling technologies for green internet of things. IEEE Systems Journal, 11(2), 983-994.
12. Sicari, S., Rizzardi, A., Grieco, L. A., Piro, G., & Coen-Porisini, A. (2017). A Policy Enforcement Framework for Internet of Things Applications in the Smart Health. Smart Health.
13. Velliangiri S, Karthikeyan Karunya P (2020) Blockchain technology: challenges and security issues in consensus algorithm. In: International conference on computer communication and informatics, ICCCI.
14. Hossain, M. S., & Muhammad, G. (2016). Cloud-assisted industrial internet of things (iiot)–enabled framework for health monitoring. Computer Networks, 101, 192-202.
15. Temko, A. (2017). Accurate wearable heart rate monitoring during physical exercises using PPG. IEEE Transactions on Biomedical Engineering.
16.Philip NY, Rodrigues JJPC, Wang H, Fong SJ, Chen J (2021) Internet of Things for in-home health monitoring systems: current advances, challenges and future directions. IEEE J Sel Areas Commun 39(2):300–310.
[1] gateway
[2] . Offspring
[3] . Fitness Function
[4] . Separability
[5] . Redundant Measurement
[6] . Parent
[7] . Roulette-Wheel
[8] . Single-point Crossover Method
[9] . Elitist Strategy
[10] . Offspring
[11] . Fitness Function
[12] . Nutual Information (MI)