کد مقاله : 202010038676 بازدید : 12994 صفحه: 1 - 13

نوع مقاله: پژوهشی

روشی نوین برای کاهش تغيير روشنايي در تصاویر غيراخلاقي بر پایه شبکه عصبی عمیق فازی

محورهای موضوعی : عمومى

1 - پژوهشگاه ارتباطات و فناوري اطلاعات(مركز تحقيقات مخابرات ايران) تهران ، ایران
2 - پژوهشگاه ارتباطات و فناوري اطلاعات(مركز تحقيقات مخابرات ايران) تهران ، ایران

تاریخ دریافت : 1399/02/02 تاریخ پذیرش : 1399/06/29 تاریخ انتشار : 1399/07/12

کلید واژه: تغييرات روشنايي, طبقه‌بندي رنگ پوست, تغيير چهره, تصاوير اخلاقی و غیراخلاقی, Gaussian-KNN, الگوریتم ماشین بردار پشتیبان,

چکیده مقاله :

در فضای اینترنت شناسایی عکس‌های غیراخلاقی امری ضروری در جهت حفاظت فیزیکی و ذهنی کودکان محسوب می شود؛ یکی از چالش های اصلی در تشخیص تصاوير غیر اخلاقی تغییرات روشنایی و رنگ پوست بدن است. به همین منظور در این مقاله روشی برای حل تغییرات روشنايي و بهبود تشخیص تصاویر غیراخلاقی ارایه شده‌است. در اين مقاله از شبکه عصبی عمیق فازی برای بهبود روشنایی تصاویر غیراخلاقی استفاده شده است. در روش پیشنهادی از مدل یادگیری عمیق xception جهت تقسیم تصویر براساس شدت روشنايي به بخش‌های مختلف بهره گرفته شده است. تقسیم کردن تصویر به قسمت‌های مختلف باعث بهبود تغییرات روشنايي با حفظ جزئیات تصویر و نهایتا شناسایی بهتر تصاویر غیراخلاقی شده است. به علاوه برای طبقه‌بندی رنگ پوست از ترکیب الگوریتم مبتنی بر Gaussian-KNN بهره گرفته شده است که روشی غیرپارامتری برای طبقه‌بندی‌ها و رگرسیون‌ها است؛ و در انتها از الگوریتم ماشین بردار پشتیبان براي طبقه‌بندی تصاویر استفاده شده است. به منظور پیاده سازی و ارزیابی روش پیشنهادی یک مجموعه شامل 33000 تصویر گردآوری شد، نتایج بدست آمده نشان می‌دهد که طرح پیشنهادی با دقت 7/99 درصد تصاویر غیراخلاقی را تشخیص می دهد.

چکیده انگلیسی:

In the era of the Internet, recognition of adult images is important to children's physical and mental protection. It is a challenge to recognize adult images with changes in the illumination and skin color. In this paper, we proposed a new method for solving illumination normalization with skin color classification in the diagnosis of the adult image. In this paper, the deep fuzzy neural network method is utilized to improve the illumination normalization of adult images, which has improved the recognization of adult images is utilized. Using Xception to dividing the images and reduce the illumination variations in each part separately, which makes it possible to reduce the illumination variation in the whole image without losing details. In addition, the advanced color combination algorithm based on Gaussian-KNN algorithm is used for skin color classification, a non-parametric method is used for classifications and regressions. Finally, the SVM algorithm is utilized for image classification. In this paper, 33,000 different types of images are collected from the Internet. The results show that the proposed method of 1/3 has improved the accuracy of the recognization.

منابع و مأخذ:

1. Wang, H., and Fan, A.: ‘Pornographic information of Internet views detection method based on the connected areas’, in Editor (Ed.)^(Eds.): ‘Book Pornographic information of Internet views detection method based on the connected areas’ (International Society for Optics and Photonics, 2017, edn.), pp. 1032228
2.Wang, Y., Jin, X., and Tan, X.: ‘Pornographic image recognition by strongly-supervised deep multiple instance learning’, in Editor (Ed.)^(Eds.): ‘Book Pornographic image recognition by strongly-supervised deep multiple instance learning’ (IEEE, 2016, edn.), pp. 4418-4422
3.Adnan, A., and Nawaz, M.: ‘RGB and hue color in pornography detection’: ‘Information Technology: New Generations’ (Springer, 2016), pp. 1041-1050
4.Nian, F., Li, T., Wang, Y., Xu, M., and Wu, J.: ‘Pornographic image detection utilizing deep convolutional neural networks’, Neurocomputing, 2016, 210, pp. 283-293
5.Karamizadeh, S., Abdullah, S.M., Zamani, M., Shayan, J., and Nooralishahi, P.: ‘Face recognition via taxonomy of illumination normalization’: ‘Multimedia Forensics and Security’ (Springer, 2017), pp. 139-160
6.Brancati, N., De Pietro, G., Frucci, M., and Gallo, L.: ‘Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’, in Editor (Ed.)^(Eds.): ‘Book Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’, in Editor (Ed.)^(Eds.): ‘Book Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’ (Springer, 2016, edn.), pp. 27-35
7.Karamizadeha, S., Mabdullahb, S., Randjbaranc, E., and Rajabid, M.J.: ‘A review on techniques of illumination in face recognition’, Technology, 2015, 3, (02), pp. 79-83
8.Surinta, O., and Khamket, T.: ‘Recognizing pornographic images using deep convolutional neural networks’, in Editor (Ed.)^(Eds.): ‘Book Recognizing pornographic images using deep convolutional neural networks’ (IEEE, 2019, edn.), pp. 150-154
9.Noh, Y., Koo, D., Kang, Y.-M., Park, D., and Lee, D.: ‘Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’, in Editor (Ed.)^(Eds.): ‘Book Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’ (IEEE, 2017, edn.), pp. 877-880
10.Md Noor, S.S., Ren, J., Marshall, S., and Michael, K.: ‘Hyperspectral image enhancement and mixture deep-learning classification of corneal epithelium injuries’, Sensors, 2017, 17, (11), pp. 2644
11.Gross, R., Baker, S., Matthews, I., and Kanade, T.: ‘Face recognition across pose and illumination’: ‘Handbook of face recognition’ (Springer, 2005), pp. 193-216
12. .Chen, Z., Liu, C., Chang, F., Han, X., and Wang, K.: ‘Illumination processing in face recognition’, International Journal of Pattern Recognition and Artificial Intelligence, 2014, 28, (05), pp. 1456011
13.Basilio, J.A.M., Torres, G.A., Pérez, G.S., Medina, L.K.T., and Meana, H.M.P.: ‘Explicit image detection using YCbCr space color model as skin detection’, Clustering for Skin Detection Under Different Lighting Conditions’, in Editor (Ed.)^(Eds.): ‘Book Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’ (Springer, 2016, edn.), pp. 27-35
7.Karamizadeha, S., Mabdullahb, S., Randjbaranc, E., and Rajabid, M.J.: ‘A review on techniques of illumination in face recognition’, Technology, 2015, 3, (02), pp. 79-83
8.Surinta, O., and Khamket, T.: ‘Recognizing pornographic images using deep convolutional neural networks’, in Editor (Ed.)^(Eds.): ‘Book Recognizing pornographic images using deep convolutional neural networks’ (IEEE, 2019, edn.), pp. 150-154
9.Noh, Y., Koo, D., Kang, Y.-M., Park, D., and Lee, D.: ‘Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’, in Editor (Ed.)^(Eds.): ‘Book Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’ (IEEE, 2017, edn.), pp. 877-880
10.Md Noor, S.S., Ren, J., Marshall, S., and Michael, K.: ‘Hyperspectral image enhancement and mixture deep-learning classification of corneal epithelium injuries’, Sensors, 2017, 17, (11), pp. 2644
11.Gross, R., Baker, S., Matthews, I., and Kanade, T.: ‘Face recognition across pose and illumination’: ‘Handbook of face recognition’ (Springer, 2005), pp. 193-216
12.Chen, Z., Liu, C., Chang, F., Han, X., and Wang, K.: ‘Illumination processing in face recognition’, International Journal of Pattern Recognition and Artificial Intelligence, 2014, 28, (05), pp. 1456011
13.Basilio, J.A.M., Torres, G.A., Pérez, G.S., Medina, L.K.T., and Meana, H.M.P.: ‘Explicit image detection using YCbCr space color model as skin detection’, Applications of Mathematics and Computer Engineering, 2011, pp. 123-128
14.Karamizadeh, S., and Arabsorkhi, A.: ‘Methods of pornography detection’, in Editor (Ed.)^(Eds.): ‘Book Methods of pornography detection’ (2018, edn.), pp. 33-38
15.Sufyanu, Z., Mohamad, F.S., Yusuf, A.A., and Mamat, M.B.: ‘Enhanced Face Recognition Using Discrete Cosine Transform’, Engineering Letters, 2016, 24, (1)
16.Liu, Z., Zhao, H., Pu, J., and Wang, H.: ‘Face recognition under varying illumination’, Neural Computing and Applications, 2013, 23, (1), pp. 133-139
17.Anagha, K., and Ram, A.R.: ‘Pose Tolerant Face Recognition: A Review’, in Editor (Ed.)^(Eds.): ‘Book Pose Tolerant Face Recognition: A Review’ (IEEE, 2020, edn.), pp. 0147-0152
18.Jin, X., Wang, Y., and Tan, X.: ‘Pornographic Image Recognition via Weighted Multiple Instance Learning’, IEEE transactions on cybernetics, 2018, 49, (12), pp. 4412-4420
19.Lopes, A.P., de Avila, S.E., Peixoto, A.N., Oliveira, R.S., and Araújo, A.d.A.: ‘A bag-of-features approach based on hue-sift descriptor for nude detection’, in Editor (Ed.)^(Eds.): ‘Book A bag-of-features approach based on hue-sift descriptor for nude detection’ (IEEE, 2009, edn.), pp. 1552-1556
20.Moustafa, M.: ‘Applying deep learning to classify pornographic images and videos’, arXiv preprint arXiv:1511.08899, 2015
21.Ding, X., Li, B., Li, Y., Guo, W., Liu, Y., Xiong, W., and Hu, W.: ‘Web Objectionable Video Recognition Based on Deep Multi Instance Learning with Representative Prototypes Selection’, IEEE Transactions on Circuits and Systems for Video Technology, 2020

متن کامل:

فصلنامه علمي- پژوهشي

فناوري اطلاعات و ارتباطات ایران

سال یازدهم، شماره‌هاي 41 و 42، پاییز و زمستان1398

صص: 1- 13

$E:\E Drive\logo\iicta Logo0.JPG$

روشی نوین برای کاهش تغيير روشنايي در تصاویر غيراخلاقي بر پایه شبکه عصبی عمیق فازی

*ساسان کرمی‌زاده **ابوذر عرب‌سرخی

*پژوهشگاه ارتباطات و فناوري اطلاعات(مركز تحقيقات مخابرات ايران) تهران ، ایران

**پژوهشگاه ارتباطات و فناوري اطلاعات (مركز تحقيقات مخابرات ايران) تهران ، ایران

تاریخ دریافت: 02/02/1399 تاریخ پذیرش: 29/06/1399

چکيده

در فضای اینترنت شناسایی عکس‌های غیراخلاقی امری ضروری در جهت حفاظت فیزیکی و ذهنی کودکان محسوب میشود؛ یکی از چالشهای اصلی در تشخیص تصاوير غیر اخلاقی تغییرات روشنایی و رنگ پوست بدن است. به همین منظور در این مقاله روشی برای حل تغییرات روشنايي و بهبود تشخیص تصاویر غیراخلاقی ارایه شده‌است. در اين مقاله از شبکه عصبی عمیق فازی برای بهبود روشنایی تصاویر غیراخلاقی استفاده شده است. در روش پیشنهادی از مدل یادگیری عمیق xception جهت تقسیم تصویر براساس شدت روشنايي به بخش‌های مختلف بهره گرفته شده است. تقسیم کردن تصویر به قسمت‌های مختلف باعث بهبود تغییرات روشنايي با حفظ جزئیات تصویر و نهایتا شناسایی بهتر تصاویر غیراخلاقی شدهاست. به علاوه برای طبقه‌بندی رنگ پوست از ترکیب الگوریتم مبتنی بر Gaussian-KNN بهره گرفته شده است که روشی غیرپارامتری برای طبقه‌بندی‌ها و رگرسیون‌ها است؛ و در انتها از الگوریتم ماشین بردار پشتیبان براي طبقه‌بندی تصاویر استفاده شده است. به منظور پیادهسازی و ارزیابی روش پیشنهادی یک مجموعه شامل 33000 تصویر گردآوری شد، نتایج بدست آمده نشان می‌دهد که طرح پیشنهادی با دقت 7/99 درصد تصاویر غیراخلاقی را تشخیص میدهد.

کلید واژه: تغييرات روشنايي، طبقه‌بندي رنگ پوست، تغيير چهره، تصاوير اخلاقی و غیراخلاقی، Gaussian-KNN، الگوریتم ماشین بردار پشتیبان

یکی از چالشهای اصلی تشخیص تصاوير غیر اخلاقی مبتنی بر پردازش تصویر، تغییرات روشنایی و رنگ پوست بدن است. میزان روشنایی در تصاویر مختلف متفاوت است و تغییرات روشنایی یکی از مسائل حیاتی در تشخیص تصوير محسوب میشود. به عبارت دیگر شناسایی تصاوير در تغییرهای نور یک مسئله چالشانگیز است[3].

نویسنده عهدهدار مکاتبات: ابوذر عربسرخی Abouzar_arab@itrc.ac.ir

1- مقدمه

امروزه حجم و تنوع اطلاعات در سطح اینترنت به شدت در حال ‌افزایش است. گروه ‌سنی کاربران این فضا نیز بسیار متنوع می‌باشد. دسترسی کودکان و گروه‌‌های سنی نوجوان به اطلاعات غیراخلاقی -اصطلاحاً تصاویر بزرگسالان- بسیار چالش انگیز است [1]. تاکنون پژوهشهای مختلفی برای شناسایی تصاویر غيراخلاقي مبتنی بر روشهای پردازش تصویر و یادگیری ماشین ارائه شده است[2].

الگوریتم‌های تشخیص تصاویر بزرگسالان باید مقادیر قابل قبولی از تغییرهای نور بین تصاویر گالری و جستجو را در نظر بگیرند[4, 5]. تفاوت در میزان نور تصاویر به‌رغم شباهت‌های موجود در آنها به احتمال زیاد منجر به طبقه‌بندی اشتباه تصویرهای بزرگسالان خواهد شد[6]. به منظور به حداقل رساندن تغییرهای نور در مجموعه داده‌های تصویر بزرگسالان از طرح عادی‌سازی روشنایی استفاده می‌شود. با این‌کار به دلیل وجود شباهت‌ها در ویژگی‌های تصویر با نورهای مختلف، احتمال طبقه‌بندی اشتباه کاهش می‌یابد[7]. علاوه‌براین، افراد با نژاد متفاوت می‌توانند برخلاف رنگ پوست‌های مختلف ‌ویژگی‌های مشابهی داشته باشند. در نتیجه مقادیر عددی پیکسل‌ها نه تنها با تغییرات نور، بلکه به دلیل اختلاف رنگ‌ها نیز تغییر می‌کند. به دلیل این اختلاف مقادیر (رنگ/ شدت متغیر بین پیکسل)، برخی از محققان وابستگی به تغییرهای نور را اولویت‌بندی‌ می‌کنند[1]. هدف از این طبقه‌بندی بر روی بسیاری از اطلاعات بیومتریک نظیر پوست بدن، دست و پا، تعیین نوع پیکسل رنگ پوست است. طبقه‌بندی رنگ پوست باید به اندازه‌ای جامع باشد که رنگ‌های مختلف پوست همانند سفید، زرد و سیاه را پوشش دهد[4]. فضاهای مختلف رنگی در تقسیم بندی پوست استفاده شده است. در برخی موارد، طبقه‌بندی رنگ پوست تنها با استفاده از رنگ‌آمیزی پیکسل انجام می‌شود، زیرا انتظار می‌رود در صورت از بین‌رفتن روشنایی پیکسل قابلیت شناسایی تغییرهاي نور بیشتر شود[8].

در این مقاله از روش ترکیبی فازی و شبکه عصبی کانولوشنی جهت بهبود شدت نور استفاده شده است. برای کاهش شدت تصویر غیراخلاقی از روش شبکه عصبی فازی برای تقسیم‌بندی عکس استفاده کرده‌ایم و بعد از تقسیم‌بندی عکس برای بهبود شدت نور از روش‌های هیستوگرام و کنتراست بر روی هر قسمت از عکس استفاده شده است.

2- کارهای مرتبط

تاکنون مطالعات ارزشمندی در حوزه تشخیص برهنگی و تصاویر غیراخلاقی مبتنی بر روشهای پردازش تصاویر انجام شده است. کارهای اولیه عمدتاً بر یافتن افراد برهنه در تصاویر براساس مدل ساختار انسانی تمرکز داشتند[9-11]. در این تحقیق از ماشین‌های بردار پشتیبان جهت طبقه‌بندی استفاده شده‌است. اين الگوریتم معرف یک طبقه‌بندی دودویی است که در طبقه‌بندی چند کلاس استفاده می‌شود. این روش دارای محاسباتی پیچیده است؛ در نتیجه اجرای آن به کندی انجام می‌شود[12]. رویکردهای مبتنی بر قسمت بدن، چندین ویژگی معنایی مرتبط با پورنوگرافی همانند "سینه"، "شکم" و "پایین" را تعریف می‌کند، و برای این ویژگی‌ها ردیاب‌های مربوط به بخش بدن را آموزش می دهد[13, 14]. با توجه به تصویر، از آشکارسازهای قسمت‌های بدن برای پویش تصویر استفاده و نتایج بدست آمده جستجو می‌شود، آن‌گاه بوسیله یک بردار ویژگی معنایی طبقه‌بندی صورت می‌گیرد. با این حال، این آشکارسازهای قسمت بدن به دلیل پشتیبانی از وصله‌های کوچک و تغییرهای ظاهری زیاد در آموزش، دچار مشکل تشخیص میشوند. در این مقاله از ویژگی‌های تبدیل موجک مجتمع دوگانه برای بهبود استخراج ویژگی تصاویر استفاده شده‌است. در این تحقیق پیش از استفاده تبدیل کسینوس گسسته از انتشار بي نظير استفاده شده که یک تابع خطی است. این روش ‌برای کاهش پارازیت در راستای حفظ مرز، بین اشکال استفاده می‌شود. باید به این موضوع توجه داشت که‌ کاربرد توابع خطی در موقعیت‌های پیچیده مناسب نیست[15,16]. یکی از عیب‌های این تحقیق، نرمال‌سازي‌ نوردهی بر روی کل تصویر است که در مقایسه با روش‌های عادیسازی دارای دقت کمتری‌است. در این تحقیق از نقشه خود سازماندهي جهت کاهش اثر تغییرات نور در تشخیص تصویر استفاده شده است [10, 17].

3- روش پیشنهادی برای کاهش تغییرات روشنایی

روش پیشنهادی در این مقاله شامل دو بخش اصلی
پیشپردازش و پردازش است.

پیش پردازش شامل دو مرحله است. فرایند پیش پردازش مربوط به تغییر اندازه و عادیسازی نور است. تصویر ورودی با نگه داشتن نسبت طول و عرض به اندازه 256 پیکسل اندازه گیری می‌شود، تا زمان محاسبات فرایند بعدی کاهش یابد. به منظور کاهش شدت نور در تصاویر، از یکسان‌سازی هیستوگرام استفاده شده است. پیکسل‌های پوست که دارای تغییرات نور زیادی هستند، نمی‌توانند در طبقه‌بندی به عنوان پوست عادی قرار گیرند. به عبارت دیگر، از هیستوگرام برای رسیدگی به تغییرات روشنایی تصاویر ورودی استفاده می‌شود. در بخش پیش‌پردازش برای متعادل‌سازی کنتراست‌‎ از روش انحراف هیستوگرام استفاده شده است. پس از متعادل‌كردن خودکار کنتراست، نیاز به کاهش پارازیت موجود در تصویر ورودی -همانند لکه‌های سیاه وسفید- است. برای این مرحله از فیلتر وینر استفاده شده است.

بعد از انجام پیش پردازش، تصویر به بخش پردازش ارسال می‌شود، که گام نخست در این بخش، نرمال‌سازی نور است. نرمال سازی نور از طریق شبکه عصبی عمیق فازی مبتنی بر تکنیک تقسیم‌بندی انجام میشود. هدف از تقسیم‌بندی تصویر حذف بهتر تغییرات نور و حفظ ویژگی‌های اصلی تصویر است. به عبارتي ديگر، اين فعاليت نورهای زائد را حذف می‌کند. مرحله بعدی در طرح پیشنهادی، طبقه‌بندي رنگ پوست است که برای تشخیص تصویر‌های متعدد در یک فریم تصویر استفاده می‌شود. به منظور استخراج ویژگی‌های عکس، از تکنیک استخراج ویژگی معادله تجزیه مقادیر منفرد¹ بهره گرفته ‌شده‌است. در نهايت ویژگی‌های استخراج شده برای طبقه‌بندی به الگوریتم ماشین بردار پشتیبان اعمال میشوند.

شکل 1 بلوک دیاگرام روش پیشنهادی را به تصویر کشیده است. در ادامه جزئیات هریک از بخشهای روش پیشنهادی شرح داده می‌شود.

شکل 1 : بلوک دیاگرام روش ‌پیشنهادی

1-3-تنظیم گر خودکار شدت نور

در این مرحله از طرح پیشنهادی، تلاش می‌شود که با استفاده از کوتاه کردن و کشش هیستوگرام کانال‌های رنگی تنظیم شوند، که شامل توزیع مجدد شدت در مقیاس مقادیر موجود است؛ به علاوه ممکن است کشش هیستوگرام در کل باند انجام شود به طوری که مقدار کمترین شدت صفر و بیشترین مقدار حداکثر مقدار باشد. در نتیجه، پیکسل‌های روشن به نورهایی روشن‌تر و پيكسل‌هاي تاريك به نورهاي تاریک نزدیک‌تر می‌شوند که توزیع بهتری را تشکیل می‌دهد. معادلات هیستوگرام به یک فرایند غیرخطی اشاره دارد. تقسیم کانال‌ها و تنظیم هر کانال به‌طور جداگانه کاری نادرست است. علاوه بر اين،‌ متعادل‌كردن شدت رنگ تصویر به عنوان جزئي از مولفه‌هاي رنگ مطرح نيست. بنابراین برای یک تصویر رنگی سادهRGB ، مقادیر هیستوگرام را نمی‌توان به طور مستقیم در کانال‌ها اعمال نمود. لازم است متعادل‌سازی شدت نور به نحوی انجام شود که بدون برهم زدن توازن رنگ تصویر بتوان این‌کار را عملياتي نمود. بنابراین، اولین قدم این است که فضای رنگی تصویر را از RGB به یک فضای رنگی YC_b C_r تبديل كنيم که مقادير شدت را از اجزای رنگ جدا مي‌نمايد[13]. فضای رنگی YC_b C_r به طور گستردهای در پردازش تصویر استفاده میشود. در این قالب، اطلاعات توسط یک مؤلفه واحد ارائه می‌‎شود. اطلاعات Y و رنگ به عنوان دو جزء تفاوت رنگ، Cb و Cr ذخیره می‌شوند. جزء Cb تفاوت بین جزء آبی و یک مقدار مرجع است، و جزء Cr تفاوت بین جزء قرمز و یک مقدار مرجع است.

2-3-کاهش پارازیت

کاهش پارازیت² یکی از مهمترین قسمت‌های پیش پردازش است. در این بخش، ضمن حفظ پارامترهای مهم، پارازیت حذف میشود. در اين مقاله از سه نوع فیلتر وينر³، متوسط⁴ و ميانگين⁵ جهت کاهش پارازیت استفاده شده ‌است.

بعد از انجام تست و گرفتن نتایج مشخص شده که فیلتر وینر بهترین عملکرد را دارد. به‌این‌صورت که فرض اولیه آن برای همه تصاویر، وجود لکه‌های کوچک پارازیت است. این الگوریتم برای از بین بردن پارازیت‌های ظریف بسیار کارآمد است. فیلتر وینر با استفاده از روش وینر سازگار با پیکسل و براساس آمار تخمين زده شده از اطراف هر پیکسل و با استفاده از تابع توزیع نرمال عمل مي‌کند. معادله (1)میانگین و واریانس اطراف هر پیکسل را برآورد می‌نماید.

(1)

در این رابطه،

H (u, v): تابع کاهشی

H*(u,v): تابع پیچیدگی تابع کاهشی

Pn(u,v): قدرت تراکم طیفی از پارازيت

Ps(u,v): قدرت عددی طیفی تصویر ناسازگار.

اصطلاح Pn / Ps میتواند به عنوان نسبت سیگنال به پارازيت تفسیر شود. فیلترهای وينر توسط موارد زیر مشخص می‌شوند:

فرض: سیگنال‌های پارازيت معرف فرآیند خطی ثابت با ویژگیهای طیفی شناخته‌شده هستند.

الزامات: فیلتر باید بطور فیزیکی قابل درك باشد.

معیارهای عملکرد: حداقل میانگین خطای مربع.

وینر به عنوان فیلتری برای برآورد یک فرآیند تصادفی مورد نظر یا هدف مطرح است و با فیلتر نمودن غیرخطی یک روند پارازیت اجرايي میشود. فیلتر وینر میانگین خطای مربع ما بین فرآیند تصادفی برآورد شده و روند مورد نظر را به حداقل میرساند.

3-3-نرمال‌سازی نور

گام بعدی اين فرآيند، نرمال‌سازی نور⁶ است. تنوع تابش می‌تواند باعث کاهش عملکرد سیستم‌های تشخیص تصویر شوند. بنابراین برای حل این مسئله، نرمالسازی نور تصویر را براساس روش تقسیمبندی شبکه عصبی فازی انجام مي‌دهيم. تكنيك‌هاي عادیسازی نورپردازی، برخی تغییرها را در تصویر ایجاد می‌کنند. اين متغييرها سبب ایجاد یک فرم استاندارد بدون هیچ‌گونه تغییر در نور و حذف ضریب‌های تبدیل کسینوس گسسته در منطق لگاریتم می‌شوند. این‌کار معادل جبران تغییرات نور است. در این مقاله، روشهای نرمال‌سازي زیر مورد بررسی قرار می‌گیرند: 1) تبدیل کسینوس گسسته، 2) چندین مقیاس رتینکس⁷ 3) نرمال سازی مبتنی بر موجك،4) مقياس تك رتینکس⁸ و 5) تفاوت گاوسی .⁹ نرمالسازی نور تصویر بر اساس تکنیک تقسیمبندی شبکه فازی را می‌توان به چهار مرحله تقسیم نمود، در شکل 2 نمای از مراحل نرمالسازی نور ارائه شده است.

شکل 2: مراحل نرمال سازی‌نور

3-3-1 -بخش‌بندی شبکه‌های عصبی عمیق فازی با هدف بخش‌بندی تصویر

شبکه عصبي فازی عميق در قالب شکل 3 به تصوير كشيده شده‌است. همان‌طور که در شکل مشاهده می‌شود، این شبکه از پنج بخش تشکیل شده‌است. بخش اول تصویر ورودی است. در بخش دوم تابع عضویت فازی پردازش می‌شود. بخش سوم لایه فازي عصبی است که به وسيله شبکه عصبی عمیق xception ساخته شده است.

شکل 3- مراحل تقسیم شبکه عصبی عمیق فازی

قسمت اول- لایه تابع عضویت فازی :هر نورون در لایه ورودی با توابع عضو چندگانه در ارتباط است که برچسب‌هایی را برای هر متغیر ورودی اختصاص میدهد. در این‌جا، متغیر ورودی یک بعد از بردار ورودی است. محاسبه درجه عضویت یک نورون ورودی به یک مجموعه فازی خاص توسط تابع عضویت معادله 2 انجام مي‌شود. در این لایه، نورون فازی نشان دهنده ورودی به عنوان درجه فازی‌است که درمعادله 2 نشان داده شده است.

(2)

در این معادله (2) تابع عضویت گوسي با میانگین μ و واریانس مورد استفاده قرار میگیرد.

(3)

که در معادله (3)، Ωi مجموعهای از نورن‌ها را در لایه را تعريف مي‌نمايد که به i متصل می‌شوند. در این مورد، لایه ورودی است. خروجی‌های این بخش درجه‌های فازی هستند.

قسمت دوم- شبكه عصبی فازی: در این قسمت از مفهوم یادگیری عصبی استفاده می‌شود تا ورودی را به‌عنوان برخی از نمایندگی‌های سطح بالا تغییر دهد. در اين قسمت لایه‌ها به طور کامل متصل میشوند، به این معنی که هر پیکسل در لایه (l) به تمام پیکسل‌های لایه (l − 1)th با پارامترهای θ (l) = {w (l) , b (l) }, متصل مي‌شوند.اين مثال در معادله (4) ارائه شده‌است.

(4) قسمت سوم - لایه کانولوشنال : تصویر از طریق یک ستون از لایههای کانولوشن و پس از نمایش عصبی فازی عبور داده می‌شود. در این لایه از فیلتر 8 × 8 استفاده می‌شود. گام کانولوشن، 1 پیکسل انتخاب شده‌است. این لایه همانند فیلتر به تصویر اعمال می‌شود. این فیلتر ویژگی‌هایی را از سطح پایین به سطح بالا می‌برد. توابع فعال‌سازی مختلف در لایه‌های متفاوت برای استخراج ویژگی‌های متنوعی استفاده می‌شوند. درلایه کانولوشن محاسبه ‌ضرب‌ نقطه‌ای ‌بین‌ وزن‌های ‌نورون ‌و ‌یک ‌ناحیه ‌کوچک ‌از‌ حجم‌ ورودی استفاده می‌شود. در طول هر گام، يك فیلتر در عرض و ارتفاع عکس ورودی، نقطه‌ها بین ورودی‌های فیلتر و نقشه فعال 2 بعدی ايجاد شده و از آن فیلتر را محاسبه می‌کند. در نتیجه، شبکه فیلتر را یاد می‌گیرد که وقتی یک نوع خاص از ویژگی‌ها را در یک موقعیت مکانی از ورودی مشاهده می‌کنند، فعال می‌شود.

قسمت پنجم- لايه پیش‌بینی V : در اين مرحله تابع سافت مكس¹⁰ اعمال مي‌شود كه برای طبقهبندی داده‌ها به کلاس‌های مختلف كاربرد دارد. اين تابع به عنوان ورودی و برچسب مربوط به آن به معنی تبدیل تغذیه شبکه کاملا متقارن فازی¹¹ از لایه ورودی به آخرین لایه‌کار اعمال مي‌نمايد. در ادامه، تابع سافت‌مكس میتواند به‌عنوان لایه خروجی با ورودی محاسبه شده و توسط معادله (5) انجام شود.

(5)

در این رابطه و نشان دهنده ضریب رگرسیون و معرف کلاس است، که برچسب‌های پیش‌بینی شده شبکه عصبی با کلاس k است. آن‌گاه، از بین رفتن میانگین مربع شبکه عصبی با اتصال کامل می‌تواند بر روی بيش از m نمونه‌های آموزش تعریف شود كه اين موضوع در قالب فرمول (6) نمايش داده شده‌است.

(6)

3-3-2 - هیستوگرام کاهش و کشش

مرحله دوم شامل کاهش و کشش هیستوگرام است. برش و کشش هیستوگرام یک تکنیک تکرار هیستوگرام محسوب مي‌شود. این روش شامل توزیع شدت در مقیاس مقادیر موجود است. این مقدار برای کشش هیستوگرام روی تمام تصوير است، به‌طوری‌که مقدار کمترین شدت صفر باشد و حداکثر مقدار آن بالاترین باشد. در نتیجه، پیکسل‌های نور حتی سبک‌تر و تاریک‌تر به سیاه نزدیک‌تر می‌شوند که توزیع بهتري را شکل می‌دهند. عمل كوتاه كردن، قبل از کشش انجام مي‌شود تا قطر خاصی از انتهای پایین و بالاي هیستوگرام را قطع کند. اين كار اثر جعلی را از چندین پیکسل روشن یا تاریک بیش از بقیه حذف مي‌نمايد. به طور مستقیم کاهش و کشش هیستوگرام در هر بخش تقسیم شده موجب ايجاد یک مشکل خاص مي‌شود. در این مورد، برخی از قطعه‌های محلی ممکن است به دهانه‌های مختلف تقسیم شوند و شدت این دهانه‌ها برای کشیدن کل تصوير گسترش یافته‌ باشد. در نتیجه، این قطعات الگوهای منفرد فضایی را با شدت در جهت معکوس در مقایسه با تصویر اصلی نمایش می‌دهند که در شکل4 به تصویر کشیده شده است.

HTS

شکل 4: تعییرات تصویر بعد از هیستوگرام کاهش و کشش

3-3-3-هیستوگرام سازگار محدود کنتراست

گام دوم کنتراست محدود انحصار هیستوگرام سازگار¹²است. تکنیک‌های تقویت کنتراست در پردازش تصویر به طور گسترده‌ای مورد استفاده قرار می‌گیرد. انحصار هیستوگرام سازگار محدود کنتراست معرف يک نسخه بهبود یافته از انعطافپذیری هیستوگرام سازگاراست. این رویکرد، مناطق کوچک تصویر را با استفاده از خصیصه‌های هیستوگرام برای هر پيكسل به صورت جداگانه پردازش می‌کند. کنتراست، به ویژه در مناطق شدت همگن، می‌تواند برای جلوگیری از تقویت پارازیت محدود شود. که در شکل 5 به تصویر کشیده شده است.

CLAHE

شکل 5: بعد از هیستوگرام سازگار محدود کنتراست

4-3-3- نرمال‌سازي

روش نرمال‌سازي تبدیل کسینوس گسسته جهت حذف اثرهای تنوع روشنایی بهکاربرده شده‌است. در این مقاله، تلاش بر اين بود تا یک روش نرمالسازی نور را برای حذف تغییرات نور در حالی که خصیصه‌های اصلی تصویر بدون تغییر بماند را بررسی نماييم. ایده کلیدی رویکرد پیشنهادی این است که تغییرات نور را می‌توان با کاهش ضرایب تبدیل کسینوس تقریباً‌ فرکانس پایین در دامنه لگاريتم تبدیل کسینوس گسسته کاهش داد. تکنیک نرمال‌سازی مبتنی بر تبدیل کسینوس گسسته یک مقدار ثابت از ضرایب تبدیل کسینوس گسسته را مطابق با فرکانسهای پایین تعیین می‌کند، که با تغییر دادن غیرمستقیم روشنایی دنبال می‌شود. علاوه بر اين، ضرایب تبدیل کسینوس گسسته با استفاده از الگوی زيگزاگ انتخاب میشوند.

تبدیل کسینوس گسسته به عنوان روشی قدرتمند در كاربردهاي تشخیص تصوير و برنامهنویسی تصویر شناخته می‌شود. الگوريتم نرمال‌سازی نور تصویر براساس تکنیک تقسیم شبکه عصبی فازی عمل مي‌نمايد. تکنیک‌های نرمال‌سازی نورپردازی برخی تغییرهاي در تصویر را برای ایجاد یک فرم استاندارد بدون هیچ‌گونه تغییرهای نورانی و حذف ضریب تبدیل کسینوس گسسته با فرکانس پایین در منطق لگاریتم انجام می‌دهند. پیاده‌سازي تبدیل کسینوس گسسته نیاز به دو حلقه تو در تو دارد. دستورهاي رايانشيM × N بدان معنی است که افزایش M و N به‌طور قابل توجهی متناسب با زمان پردازش است. با توجه به این محدودیت‌ها، محققان تصویر ورودی را جهت غلبه بر این محدودیت‌ها تغییر مي‌دهند. با این وجود، با استفاده از تبدیل کسینوس گسسته در قسمت‌های مختلف تصویر، زمان محاسبه کمتری را لازم دارد. تعداد زیادی از ضرایب تبدیل کسینوس گسسته قرار داده شده در یک بردار، باید در مرحله پیاده‌سازی مرحله كمي‌سازي به صفر برسد. توالی زيگزاگ به‌عنوان بهترین روش در اين فضا عمل مي‌كند. تمام این اجزاء میتوانند پس از ضرایب تبدیل کسینوس گسسته در شکل بردار از طریق توالی زيگزاگ به صفر برسند.

4- طبقه‌بندی پوست

طبقه‌بندی پوست که یک ترکیب پیشرفته الگوریتم مبتنی بر Gaussian-KNN است، یک روش غیرپارامتری برای طبقه‌بندی‌ها و رگرسیون‌ها است. الگوریتم K-NN شامل برآورد شباهت ما بین نمونه ورودی و Kنزدیکترین نمونه موجود در فضای برجسته است. هر ویژگی یک برچسب کلاس دارد؛ بنابراین، الگوریتم به شمارش تعداد مواردی مي‌پردازد که متعلق به هر کلاس‌است. نتیجه طبقهبندی کلاس متاثر از حداکثر تعداد موارد اختصاص داده شدهاست. الگوریتم وزني K-NN از یک روش مشابه كه در فرمول (7) نشان داده شده است براي تخمين ارزش هر رای برای بهبود عملکرد طبقهبندی به روش زیر استفاده میکند.

(7)

در این رابطه موارد زیر را می‌توان مد نظر قرار داد:

-کلاس (x): کلاس حقيقي نمونه x را باز میگرداند و یک کلاس پیشبینی را نشان میدهد.

-K: تعداد نزدیکترین همسایگان استفاده شده در K-NN را نشان مي‌دهد.

-NNi(x): نزدیکترین همسایه iام با توجه به یک نمونه بدون برچسب x از i = 1،2، ...، k را نشان مي‌دهد.

-F(x,y): یک تابع وزني براي رأی دهي است که میزان تاثیر نزدیکترین همسایه y را به x تعيين می‌نمايد.

-δ(class(x), class(y)): به این معنی است که k-NN وزن یکسانی را برای هرکدام از نزدیکترین همسایگان برای رای‌گيري اکثریت تعیین میکند. بنابراین f(x,y) مقدار هر كدام از ويژگي‌ها را تخمين مي‌زند و تابع,j) δ (i، تابع دلتا Kronecker است كه به‌صورت زير در معادله‌های 8 و 9 تعریف مي‌شود،

(8) بنابراین

(9)

توابع كرنل گاوسي به دو دلیل انتخاب شده‌است. اولین دلیل این است که، تابع گاوسی صاف است و از این رو تابع چگالی برآورد شده نیز به آرامي تغيير میكند. دومین دليل، در فرم خاصی از توابع گاوسی که در آن تابع به طور شعاعی متقارن است، تابع می‌تواند به‌طور کامل توسط پارامتر واریانس مشخص شود كه در معادله (10) تابع گاوسی را نشان داده شده است.

(10)

که در آن x نمونه ورودی است و y یک نمونه از ویژگی است؛ آن‌ها را بردارهای RGB می‌سازند، و مقدار میانگین ‌است .طبقه‌بندی نزدیکتری همسایگی K پیشنهادی نسبت به طبقه اقليت بسيار حساس است. ایده اصلی شناسایی نمونه‌های کلاس اقلیت در داده‌های آموزشی و سپس تعمیم آن‌ها به عملکرد گاوسی به‌عنوان مفهومی برای طبقه اقلیت عمل مي‌نمايد. این رویکرد مبتنی بر توسعه مرز تصمیم‌گیری برای طبقه اقلیت بنا نهاده شده است. معادله (11) Guassian-based weight K-NN را نشان میدهد:

KNN= class(x)

Gaussian

Gaussian based KNN= K-NN + Gaussian

Class(x) ' = KNN+Gaussian

(11)

یک آستانه برای شناسایی دادههای پوست در سیستم رنگ YC_bC_r استفاده میشود[13]. آستانه ای در آن بیشتر افراد با رنگ پوست مختلف در تصویر می‌توانند با استفاده از تکنیکهای هیستوگرام تقسیم شوند. بنابراین نیاز است که تصویر را به این سیستم تغییر داده و ان‌گاه تمام پیکسلهایی را که از یک محدوده داده از پیش تعیین شده خارج شدهاند را حذف نمود. زمانی‌که میانگین پیکسل‌های استخراج شده از بردارR,G,B محاسبه می‌شو؛ که در معادله‌های12،13،14 بیان شده است.

Y=(0.299×R)+(0.587×G)+(0.114×B) (12) C_b=(B-Y)×0.564+135.0 (13)
C_r=(R-Y)×0.713+128.0 (14)

تصویر تبدیل شده YC_b C_r به مرحله بعدی منتقل می‌شود، یعنی استخراج پیکسل‌های پوستی، پیکسل‌های پوست با استفاده از معادله (15) زیر استخراج می‌شوند.

[85<Cb<135

135>Cr<180] (15)

هر منطقه از تغییرات نور تصاویر رنگی بر اساس تغییرات برآورد شده توسط یک الگوریتم ثبات رنگ مبتنی بر لبه محلی¹³ اصلاح می‌شود. سپس تصاویر تصحیح شده به یک فضای رنگی YC_bC_rتبدیل می شوند، و قسمت رنگ پوست و قسمت‌های رنگی غیر پوست از هم جدا شده اند.

علاوه بر این، مورفولوژی¹⁴ نیز در این فرایند گنجانده شده است تا طبقه‌بندی پوست مثبت کاذب را حذف کند. ثابت شده است که این مدل عملکرد بهتری در شناخت تصاویر غیر اخلاقی ارائه می‌دهد [17]. در این تبدیل، تطبیق هیستوگرام در سطح شدت Y انجام می‌شود و در نهایت می‌توان تصویر YC_b C_r حاصل را به RGB برگرداند بردار رنگ به طبقه‌بندیK-NN منتقل خواهدشد. با توجه به ‌اینکهK-NN نیاز به آموزش ندارد، وزن K-NN به‌عنوان طبقه‌بندی بسیار مناسب برای مجموعه دادههای جزئی مورد توجه قرار مي‌گيرد. طبقه‌بندیکننده K-NN فاصله اقلیدسی بردار رنگ و تمام نمونه‌هاي مجموعه داده را 50 = kمحاسبه می‌کند. در ادامه فاصله‌ها را به‌صورت صعودی مرتب می‌کند، علاوه بر این K نزدیکترین فاصله را انتخاب می‌نماید. سیستم امتیازدهی مبتنی بر گاوسي، مقدار گاوسی را براساس فاصله نمونه از بردار محاسبه می‌کند. در واقع، این طرح همه امتیازها برای هر برچسب کلاس را به طور جداگانه محاسبه می‌نمايد. برچسب کلاسي كه با بالاترین نمره انتخاب می‌شود تحت عنوان برچسب نمونه شناخته مي‌شود. نتیجه این مرحله تصویر طبقه‌بندی‌شده است که يكي از گروه‌هاي پوستی سفيد، سياه یا زرد را نشان مي‌دهد.

5- استخراج ویژگی‌ها

مرحله سوم پردازش تصویر به استخراج ویژگی اشاره دارد. در اين مرحله از تجزیه مقادیر منفرد برای استخراج ویژگی‌هایی استفاده مي‌شود که مبناي تشخیص طیف وسیعی از تصاویر هستند. اين الگوريتم در تشخیص تصاویر غیراخلاقی مؤثرتر است، زیرا ویژگی ارزش واحد نسبت به تغییرات رنگ خاکستري در طی فرآیند شناخت حساس نيست و می‌تواند بر برخی از عوامل دیگر همانند تغییر نور غلبه كند. دو دیدگاه عمده پيرامون ویژگی‌های اين الگوريتم وجود دارد. اولين ديدگاه اين‌ است كه از تجزیه مقادیر منفرد می‌تواند به‌عنوان یک روش تبدیل متغیرهای هم بسته به مجموعه‌ داده‌هاي اصلي استفاده نمود، و روابط مختلف را در میان اقلام داده‌های اصلی موثرتر نشان داد. دومين ديدگاه اين است كه از اين روش براي شناسایی و ترتیب ابعاد داده‌ها که در آن نقاط داده‌ها بیشترین تغییر را نشان می‌دهند استفاده شود. استفاده از اين سازوكار برای تعیین بهترین تقریب نقاط داده‌های اصلی با استفاده از ابعاد کم‌تر امکان‌پذیر است. از این‌رو تجزیه مقادیر منفرد به‌عنوان روشی برای کاهش داده‌ها مطرح‌است.

معادله تجزیه مقادیر منفرد برای یک (m × n) ماتریس مفرد است، در جایی که U یک ماتریس قائم (m × m) است، V یک (n × n) است.

ماتریس قائم و S یک ماتریس مورب (m × n) است، که حاوی مقادیر منفرد A است که به ترتیب مرتبه کاهش می‌یابد. یک بردار در یک ماتریس متعامد می تواند به عنوان ترکیبی خطی از بردارهای دیگر بیان شود. بردارهای موجود در این فضا نیز به طور متقابل مستقل هستند و اکنون می توان یک راه حل برای x محاسبه کرد.

عناصر مورب ماتریس S به ترتیب نزولی ذکر شده و مقادیر منفرد A نامیده می‌شوند.

6- تشخیص تصویر

در این قسمت از الگوریتم ماشین برادر پشتیبان برای طبقه‌بندی عکس‌ها استفاده شده است. کلاس‌بندی ماشین بردار پشتیبان به وسیله فرمول (16) بدست می‌آید.

(16)

که در آن K تابع کرنل و xiمعرف بردار پشتیبان، Ls معرف تعداد بردارهاي پشتیبان و diمعرف شماره کلاس xiمربوطه است و در نهایت ai ها اعداد ثابتی هستند که در مرحله آموزشی به دست می‌آیند. با توجه به تعریف، بردارهاي پشتیبان المان‌هایی از داده‌هاي آموزشی هستند که دقیقاً بر روي و یا داخل مرزهاي تصمیم‌گیري طبقهبندي قرار می‌گیرند. به عبارتی دیگر این بردارها شامل نمونه‌هایی هستند که دسته‌بندي آن‌ها از بقیه نمونه‌ها مشکل‌تر است. ویژگی اصلی این روش توانایی بالا در استفاده از نمونههای تعلیمی کمتر و رسیدن به دقت بالاتر است.

به عبارتی دیگر این بردارها شامل نمونه‌هایی هستند که دسته‌بندي آن‌ها از بقیه نمونه‌ها مشکل‌تر است. باید به این نکته توجه شود که در یک مسئله ماشین بردار پشتیبان تنها کسر کوچکی از داده‌هاي آموزشی به عنوان بردارهاي پشتیبان تعیین میگردند. توابع کرنل نقش مرکزي و اصلی را در نگاشت کردن منحنی بردار ورودي به فضاي ویژگی با ابعاد بالاتر، براي به دست آوردن تفکیک‌پذیري بیشتر بازي می‌کنند، در این مقاله از کرنل چند جمله‌ای استفاده شده است.

7- نتایج بدست آمده

به منظور پیاده سازی و ارزیابی روش پیشنهادی یک پایگاه داده از طریق جستجو در اینترنت مشتمل بر 33000 تصاویر اخلاقی و غیر اخلاقی ایجاد شد. دقت یک هدف مناسب در هر سناریوی یادگیری ماشیني محسوب مي‌شود؛ زماني که داده‌های یک کلاس در مقادیر بسیار بیشتری از داده‌های کلاس دیگر وجود دارند. معادله‌های (16) و (17) و (18) برای شاخصهای عملکرد استفاده شد. در این مقاله 70 درصد از مجموعه داده‌ها را برای آموزش داده‌ها و 30 درصد از داده‌ها را برای تست استفاده شده است. به علاوه داشتن یک مجموعه داده جامع، دستیابی به سطح بالاتری از آموزش را فراهم میکند یکی از عوامل موفقیت است.

FCN-AlexNet که از قبل روی مجموعه دادههای SYNTHIA آموزش داده شده است که حاوی بیش از 200،000 تصویر است. پس از آن، یادگیری انتقالی در تقسیمبندی متراکم از نور با استفاده از تقسیم داده ها و طرح اولیه وزن MSRA انجام شده است.

با توجه به تغييرات روشنايي در تصاوير غيراخلاقي كه داراي پوست تيره بوده اند خطاي كاذب بيشتر بوده است.

(16)

(17)

(18)

7-1- مقايسه مدل هاي يادگيري عميق

در این قسمت عملکرد مدل‌های یادگیری عمیق به کار گرفته شده، مورد ارزیابی قرار گرفتهاست. عملکرد این مدل ها بر حسب پارامترهای ارزیابی ارائه شده است.

جدول شماره 3: مقایسه مدل‌های یادگیری عمیق

precision	recall	دقت	سرعت	سایز	مدل‌
0.93	0.91	0.94	ms30	138 mi	VGG-16
0.94	0.94	0.990	ms15	25 mi	Resnet50v2
0.96	0.96	0.997	ms24	22 mi	xception

همانطور که در جدول شماره 3 نشان داده شده است مدل xception بهترین دقت را نسبت به دو مدل دیگر ارائه نمودهاست، ولی از نظر سرعت مدل resent50v2 بهترین نتیجه نسبت به دو مدل xception و VGG-16به دست آورده است و چون شاخص دقت مهمتر بود مدل xecption انتخاب شد.

7-2 منحنی خطای تشخیص

در منحنی خطای تشخیص‌خطا¹⁵ در حالت ایده آل، احتمال بروز هر دو نوع خطا صفر خواهد بود. در عمل، این دو قابل معامله هستند: احتمال پذیرش کاذب می‌تواند با هزینه افزایش رد کاذب کاهش یابد.

منحنی‌های خطای تشخیص نشان می‌دهد چگونه ممکن است نقطه عملیاتی برای تغییر مبادلات بین FA و FR تغییر کند، این منحنی در شکل 6 نشان داده شده است.

بهترین حالت این است که هر دو خطای FA و FR در هر نقطه عملیاتی کم باشند. به عبارت دیگر ، منحنی خطای تشخیص باید نزدیک یا در محورهای FA / FR باشد.

شکل 6: منحنی خطای تشخیص خطا

منحنی‌ خطای تشخیص برای سه مدل مختلف یادگیری عمیق نشان داده شده است. طبقه بندی بهتر دارای منحنی پایین تر است که به محورها نزدیک تر است كه توسط خط مورب نشان داده شده است. که در این سه مدل، مدل xception بهترین نتیجه را ارائه نمودهاست.

7-3 معماری VGG-16

شبکه VGG- 16 شامل 16 لایه کانولوشنی یا 16 لایه پارامتری است. شبکه VGG -16، شامل دو لایه کانولوشنی با 64 فیلتر 3×3 هست که پشت سر هم قرار گرفته‌اند. سپس، یک لایه ماکس‌پولینگ 2×2 با پرش به اندازه 2 قرار گرفته است. این لایه ماکس‌پولینگ علاوه بر نمونه‌برداری، وظیفه کاهش بعد ویژگی‌ها به نصف را هم دارد. در ادامه، دو لایه کانولوشنی دیگر با 128 فیلتر 3×3 و یک لایه ماکس‌پولینگ 2×2 و پرش 2 قرار گرفته‌اند. به‌طور مشابه، سه لایه کانولوشنی با 256 فیلتر 3×3 و یک لایه ماکس‌پولینگ 2×2 با پرش 2 قرار گرفته‌اند 3 لایه کانولوشنی با 512 فیلتر 3×3 و یک لایه ماکس‌پولینگ ادامه این شبکه هست که البته دو بار تکرار می‌شود. درنهایت، ویژگی‌ها تبدیل به یک بردار ویژگی می‌شوند تا در اختیار لایه‌های نورونی تمام ‌اتصال قرار گیرند. دو لایه نورونی به ابعاد 4096 پشت سر هم قرار گرفته‌اند. درنهایت، یک لایه نورونی به ابعاد 1000 که متناظر با تعداد کلاس‌های کاربرد ما هست، در نظر گرفته شده است لایه خروجی شامل 1000 نورون است. در تمامی لایه‌های کانولوشنی و لایه‌های نورونی از تابع فعال‌ساز بنام RELU استفاده شده است.

4-7- مقایسه روش انجام شده

در این بخش عملکرد روش پیشنهادی با روش سنتی شناسایی تصاویر غیراخلاقی و روشهای نوین مبتنی بر تکنیکهای یادگیری عمیق مقایسه شده است. مقايسه نتایج بین سه روش تشخیص عکس‌های غیراخلاقی با روش پیشنهادی پيرامون محاسبه دقت در قالب جدول 4 ارائه شده است.

جدول4: مقايسه بين روش‌هاي موجود با روش پيشنهادي

نتایج مجموع	نتیجه اخلاقی	نتیجه غیراخلاقی		روش‌ها
85/64	41/61		30/68	Region-of-Interest Method[18]
83/75	87/71		79/79	Bag-of-Feature method[19]
94/90	22/89		67/92	Deep Fused CNN[20]
35/98	51/98		18/98	Pornographic Image Recognition Via Weighted Multiple Instance Learning[21]
70/99	85/99		60/99	روش ارایه شده

روش سنتی یک روش بازیابی شده است که با استفاده از تشخیص پوست، رنگ، شکل و ویژگی های پوست را بر روی ROI استخراج می کند[18]. ویژگی BoF رویکرد مبتنی بر توصیف Hue-SIFT و نسخه بهبود یافته آن براساس مدل توجه بصری است[21]. در هر دو روش عملکرد خوبی برای مجموعه داده های کوچک است[19]. روش عمیق مبتنی بر CNN برای تشخیص تصویر غیراخلاقی وجود دارد [20]. برای انجام یک مقایسه جامع با مقدمات عمیق مبتنی بر CNN، الگوریتم‌های توصیف شده در [20]، و سه تغییر مبتنی بر CNN را با داده های آموزش پیادهسازی کردیم.

روش ارایه شده در این مقاله بر روی انواع تصاویر با کیفیت های مختلف کار می‌کند، به طور خاص، روش ارایه شده نسبت به سایر روش‌ها در تصاویر غیراخلاقی که بصورت غیرحرفه ای گرفته شده‌اند، مزایای بارزی را نشان می‌دهد. این بخش از تصاویر غیراخلاقی عمدتاً از تصاویر غیرحرفهای در زندگی روزمره ناشی می‌شود که تغییرات زیادی در زمینه، مقیاس، روشنایی و افراد در معرض نمایش قرار می‌گیرند.

8- نتیجه‌‌گیری

طرح پیشنهادی در این مقاله شامل دو بخش پيش پردازش و پـردازش اسـت. بخـش پیـشپردازش شـامـل تنـظیمگر

8- منابع

1.Wang, H., and Fan, A.: ‘Pornographic information of Internet views detection method based on the connected areas’, in Editor (Ed.)^(Eds.): ‘Book Pornographic information of Internet views detection method based on the connected areas’ (International Society for Optics and Photonics, 2017, edn.), pp. 1032228

2.Wang, Y., Jin, X., and Tan, X.: ‘Pornographic image recognition by strongly-supervised deep multiple instance learning’, in Editor (Ed.)^(Eds.): ‘Book Pornographic image recognition by strongly-supervised deep multiple instance learning’ (IEEE, 2016, edn.), pp. 4418-4422

3.Adnan, A., and Nawaz, M.: ‘RGB and hue color in pornography detection’: ‘Information Technology: New Generations’ (Springer, 2016), pp. 1041-1050

[4] Nian, F., Li, T., Wang, Y., Xu, M., and Wu, J.: ‘Pornographic image detection utilizing deep convolutional neural networks’, Neurocomputing, 2016, 210, pp. 283-293

[5] Karamizadeh, S., Abdullah, S.M., Zamani, M., Shayan, J., and Nooralishahi, P.: ‘Face recognition via taxonomy of illumination normalization’: ‘Multimedia Forensics and Security’ (Springer, 2017), pp. 139-160

[6] Brancati, N., De Pietro, G., Frucci, M., and Gallo, L.: ‘Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’, in Editor (Ed.)^(Eds.): ‘Book Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’ (Springer, 2016, edn.), pp. 27-35

[7] Karamizadeha, S., Mabdullahb, S., Randjbaranc, E., and Rajabid, M.J.: ‘A review on techniques of illumination in face recognition’, Technology, 2015, 3, (02), pp. 79-83

[8] Surinta, O., and Khamket, T.: ‘Recognizing pornographic images using deep convolutional neural networks’, in Editor (Ed.)^(Eds.): ‘Book Recognizing pornographic images using deep convolutional neural networks’ (IEEE, 2019, edn.), pp. 150-154

[9] Noh, Y., Koo, D., Kang, Y.-M., Park, D., and Lee, D.: ‘Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’, in Editor (Ed.)^(Eds.): ‘Book Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’ (IEEE, 2017, edn.), pp. 877-880

[10] Md Noor, S.S., Ren, J., Marshall, S., and Michael, K.: ‘Hyperspectral image enhancement and mixture deep-learning classification of corneal epithelium injuries’, Sensors, 2017, 17, (11), pp. 2644

[11] Gross, R., Baker, S., Matthews, I., and Kanade, T.: ‘Face recognition across pose and illumination’: ‘Handbook of face recognition’ (Springer, 2005), pp. 193-216

[12] Chen, Z., Liu, C., Chang, F., Han, X., and Wang, K.: ‘Illumination processing in face recognition’, International Journal of Pattern Recognition and Artificial Intelligence, 2014, 28, (05), pp. 1456011

[13] Basilio, J.A.M., Torres, G.A., Pérez, G.S., Medina, L.K.T., and Meana, H.M.P.: ‘Explicit image detection using YCbCr space color model as skin detection’, Applications of Mathematics and Computer Engineering, 2011, pp. 123-128

[14] Karamizadeh, S., and Arabsorkhi, A.: ‘Methods of pornography detection’, in Editor (Ed.)^(Eds.): ‘Book Methods of pornography detection’ (2018, edn.), pp. 33-38

[15] Sufyanu, Z., Mohamad, F.S., Yusuf, A.A., and Mamat, M.B.: ‘Enhanced Face Recognition Using Discrete Cosine Transform’, Engineering Letters, 2016, 24, (1)

[16] Liu, Z., Zhao, H., Pu, J., and Wang, H.: ‘Face recognition under varying illumination’, Neural Computing and Applications, 2013, 23, (1), pp. 133-139

[17] Anagha, K., and Ram, A.R.: ‘Pose Tolerant Face Recognition: A Review’, in Editor (Ed.)^(Eds.): ‘Book Pose Tolerant Face Recognition: A Review’ (IEEE, 2020, edn.), pp. 0147-0152

[18] Jin, X., Wang, Y., and Tan, X.: ‘Pornographic Image Recognition via Weighted Multiple Instance Learning’, IEEE transactions on cybernetics, 2018, 49, (12), pp. 4412-4420

[19] Lopes, A.P., de Avila, S.E., Peixoto, A.N., Oliveira, R.S., and Araújo, A.d.A.: ‘A bag-of-features approach based on hue-sift descriptor for nude detection’, in Editor (Ed.)^(Eds.): ‘Book A bag-of-features approach based on hue-sift descriptor for nude detection’ (IEEE, 2009, edn.), pp. 1552-1556

[20] Moustafa, M.: ‘Applying deep learning to classify pornographic images and videos’, arXiv preprint arXiv:1511.08899, 2015

[21] Ding, X., Li, B., Li, Y., Guo, W., Liu, Y., Xiong, W., and Hu, W.: ‘Web Objectionable Video Recognition Based on Deep Multi Instance Learning with Representative Prototypes Selection’, IEEE Transactions on Circuits and Systems for Video Technology, 2020

خودکار شدت نور و کاهش پارزیت است. در قسمت پردازش براي نرمال‌سازی شدت نور از معماری xception استفاده شده است. در ادامه از طبقهبندی پوست استفاده شده تا به تشخیص تصویر کمک کند در اين مرحله از الگوريتم Gaussian-KNN استفاده شده است. به علاوه در این مقاله از 33000 تصاویر اخلاقی و غیر اخلاقی استفاده شده که تصاوير از اینترنت جمع آوری شده‌است. نتایج بدست آمده نشان می‌دهد كه روش پیشنهادی 3/1 درصد بهتر از روش‌های موجود در این حوزه عمل نموده‌است.

بررسی چالش‌های تصاویر غیراخلاقی به ویژه تصاوير‌ سوء استفاده از کودکان به عنوان کارهای آینده پیشنهاد میشود؛ می‌توان با جمع آوری تصاویر سو استفاده از کودکان و با استفاده از مدل مختلف یادگیری عمیق ویژگی‌هایی بهتری رو استخراج نمود که باعث بهبود دقت در تشخیص این تصاویر شود.

9- تشکر و قدردانی

این تحقیق به وسيله مرکز تحقیقات مخابرات ایران حمایت شده‌است. این روش به عنوان بخشی از فعالیت‌های تحقیقاتی طرح صيانت (فرهنگي – اجتماعي) با بهره‌گيري از سامانه‌هاي هوشمند در پژوهشگاه ارتباطات و فناوري اطلاعات طراحی و پیاده‌سازی شده‌است.

Generations’ (Springer, 2016), pp. 1041-1050

4.Nian, F., Li, T., Wang, Y., Xu, M., and Wu, J.: ‘Pornographic image detection utilizing deep convolutional neural networks’, Neurocomputing, 2016, 210, pp. 283-293

5.Karamizadeh, S., Abdullah, S.M., Zamani, M., Shayan, J., and Nooralishahi, P.: ‘Face recognition via taxonomy of illumination normalization’: ‘Multimedia Forensics and Security’ (Springer, 2017), pp. 139-160

6.Brancati, N., De Pietro, G., Frucci, M., and Gallo, L.: ‘Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’, in Editor (Ed.)^(Eds.): ‘Book Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’ (Springer, 2016, edn.), pp. 27-35

[7] Karamizadeha, S., Mabdullahb, S., Randjbaranc, E., and Rajabid, M.J.: ‘A review on techniques of illumination in face recognition’, Technology, 2015, 3, (02), pp. 79-83

Clustering for Skin Detection Under Different Lighting Conditions’, in Editor (Ed.)^(Eds.): ‘Book Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’ (Springer, 2016, edn.), pp. 27-35

7.Karamizadeha, S., Mabdullahb, S., Randjbaranc, E., and Rajabid, M.J.: ‘A review on techniques of illumination in face recognition’, Technology, 2015, 3, (02), pp. 79-83

8.Surinta, O., and Khamket, T.: ‘Recognizing pornographic images using deep convolutional neural networks’, in Editor (Ed.)^(Eds.): ‘Book Recognizing pornographic images using deep convolutional neural networks’ (IEEE, 2019, edn.), pp. 150-154

9.Noh, Y., Koo, D., Kang, Y.-M., Park, D., and Lee, D.: ‘Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’, in Editor (Ed.)^(Eds.): ‘Book Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’ (IEEE, 2017, edn.), pp. 877-880

10.Md Noor, S.S., Ren, J., Marshall, S., and Michael, K.: ‘Hyperspectral image enhancement and mixture deep-learning classification of corneal epithelium injuries’, Sensors, 2017, 17, (11), pp. 2644

11.Gross, R., Baker, S., Matthews, I., and Kanade, T.: ‘Face recognition across pose and illumination’: ‘Handbook of face recognition’ (Springer, 2005), pp. 193-216

12.Chen, Z., Liu, C., Chang, F., Han, X., and Wang, K.: ‘Illumination processing in face recognition’, International Journal of Pattern Recognition and Artificial Intelligence, 2014, 28, (05), pp. 1456011

13.Basilio, J.A.M., Torres, G.A., Pérez, G.S., Medina, L.K.T., and Meana, H.M.P.: ‘Explicit image detection using YCbCr space color model as skin detection’, Applications of Mathematics and Computer Engineering, 2011, pp. 123-128

14.Karamizadeh, S., and Arabsorkhi, A.: ‘Methods of pornography detection’, in Editor (Ed.)^(Eds.): ‘Book Methods of pornography detection’ (2018, edn.), pp. 33-38

15.Sufyanu, Z., Mohamad, F.S., Yusuf, A.A., and Mamat, M.B.: ‘Enhanced Face Recognition Using Discrete Cosine Transform’, Engineering Letters, 2016, 24, (1)

16.Liu, Z., Zhao, H., Pu, J., and Wang, H.: ‘Face recognition under varying illumination’, Neural Computing and Applications, 2013, 23, (1), pp. 133-139

17.Anagha, K., and Ram, A.R.: ‘Pose Tolerant Face Recognition: A Review’, in Editor (Ed.)^(Eds.): ‘Book Pose Tolerant Face Recognition: A Review’ (IEEE, 2020, edn.), pp. 0147-0152

18.Jin, X., Wang, Y., and Tan, X.: ‘Pornographic Image Recognition via Weighted Multiple Instance Learning’, IEEE transactions on cybernetics, 2018, 49, (12), pp. 4412-4420

19.Lopes, A.P., de Avila, S.E., Peixoto, A.N., Oliveira, R.S., and Araújo, A.d.A.: ‘A bag-of-features approach based on hue-sift descriptor for nude detection’, in Editor (Ed.)^(Eds.): ‘Book A bag-of-features approach based on hue-sift descriptor for nude detection’ (IEEE, 2009, edn.), pp. 1552-1556

20.Moustafa, M.: ‘Applying deep learning to classify pornographic images and videos’, arXiv preprint arXiv:1511.08899, 2015

21.Ding, X., Li, B., Li, Y., Guo, W., Liu, Y., Xiong, W., and Hu, W.: ‘Web Objectionable Video Recognition Based on Deep Multi Instance Learning with Representative Prototypes Selection’, IEEE Transactions on Circuits and Systems for Video Technology, 2020

[1] Singular Value Decomposition

[2] Noise reduction

[3] Wiener

[4] mean

[5] Meadin

[6] Illumination Normalization

[7] Multi Scale Retinex

[8] Single Scale Retinex

[9] Difference of Gaussian

[10] Soft-max

[11] fuzzy fully convolutional network

[12] Contrast Limited Adaptive Histogram Equalization

[13] Local edge-based

[14] Morphological

[15] Detection error tradeoff(DET)

اشتراک گذاری

آدرس مقاله

روشی نوین برای کاهش تغيير روشنايي در تصاویر غيراخلاقي بر پایه شبکه عصبی عمیق فازی

رایمگ

پیوندهای سایت

مراکز مرتبط

پشتیبانی

صفحات رسمی