روشی نوین برای کاهش تغيير روشنايي در تصاویر غيراخلاقي بر پایه شبکه عصبی عمیق فازی
محورهای موضوعی : عمومىساسان کرمی زاده 1 , ابوذر عرب سرخی 2
1 - پژوهشگاه ارتباطات و فناوري اطلاعات(مركز تحقيقات مخابرات ايران) تهران ، ایران
2 - پژوهشگاه ارتباطات و فناوري اطلاعات(مركز تحقيقات مخابرات ايران) تهران ، ایران
کلید واژه: تغييرات روشنايي, طبقهبندي رنگ پوست, تغيير چهره, تصاوير اخلاقی و غیراخلاقی, Gaussian-KNN, الگوریتم ماشین بردار پشتیبان,
چکیده مقاله :
در فضای اینترنت شناسایی عکسهای غیراخلاقی امری ضروری در جهت حفاظت فیزیکی و ذهنی کودکان محسوب می شود؛ یکی از چالش های اصلی در تشخیص تصاوير غیر اخلاقی تغییرات روشنایی و رنگ پوست بدن است. به همین منظور در این مقاله روشی برای حل تغییرات روشنايي و بهبود تشخیص تصاویر غیراخلاقی ارایه شدهاست. در اين مقاله از شبکه عصبی عمیق فازی برای بهبود روشنایی تصاویر غیراخلاقی استفاده شده است. در روش پیشنهادی از مدل یادگیری عمیق xception جهت تقسیم تصویر براساس شدت روشنايي به بخشهای مختلف بهره گرفته شده است. تقسیم کردن تصویر به قسمتهای مختلف باعث بهبود تغییرات روشنايي با حفظ جزئیات تصویر و نهایتا شناسایی بهتر تصاویر غیراخلاقی شده است. به علاوه برای طبقهبندی رنگ پوست از ترکیب الگوریتم مبتنی بر Gaussian-KNN بهره گرفته شده است که روشی غیرپارامتری برای طبقهبندیها و رگرسیونها است؛ و در انتها از الگوریتم ماشین بردار پشتیبان براي طبقهبندی تصاویر استفاده شده است. به منظور پیاده سازی و ارزیابی روش پیشنهادی یک مجموعه شامل 33000 تصویر گردآوری شد، نتایج بدست آمده نشان میدهد که طرح پیشنهادی با دقت 7/99 درصد تصاویر غیراخلاقی را تشخیص می دهد.
In the era of the Internet, recognition of adult images is important to children's physical and mental protection. It is a challenge to recognize adult images with changes in the illumination and skin color. In this paper, we proposed a new method for solving illumination normalization with skin color classification in the diagnosis of the adult image. In this paper, the deep fuzzy neural network method is utilized to improve the illumination normalization of adult images, which has improved the recognization of adult images is utilized. Using Xception to dividing the images and reduce the illumination variations in each part separately, which makes it possible to reduce the illumination variation in the whole image without losing details. In addition, the advanced color combination algorithm based on Gaussian-KNN algorithm is used for skin color classification, a non-parametric method is used for classifications and regressions. Finally, the SVM algorithm is utilized for image classification. In this paper, 33,000 different types of images are collected from the Internet. The results show that the proposed method of 1/3 has improved the accuracy of the recognization.
1. Wang, H., and Fan, A.: ‘Pornographic information of Internet views detection method based on the connected areas’, in Editor (Ed.)^(Eds.): ‘Book Pornographic information of Internet views detection method based on the connected areas’ (International Society for Optics and Photonics, 2017, edn.), pp. 1032228
2.Wang, Y., Jin, X., and Tan, X.: ‘Pornographic image recognition by strongly-supervised deep multiple instance learning’, in Editor (Ed.)^(Eds.): ‘Book Pornographic image recognition by strongly-supervised deep multiple instance learning’ (IEEE, 2016, edn.), pp. 4418-4422
3.Adnan, A., and Nawaz, M.: ‘RGB and hue color in pornography detection’: ‘Information Technology: New Generations’ (Springer, 2016), pp. 1041-1050
4.Nian, F., Li, T., Wang, Y., Xu, M., and Wu, J.: ‘Pornographic image detection utilizing deep convolutional neural networks’, Neurocomputing, 2016, 210, pp. 283-293
5.Karamizadeh, S., Abdullah, S.M., Zamani, M., Shayan, J., and Nooralishahi, P.: ‘Face recognition via taxonomy of illumination normalization’: ‘Multimedia Forensics and Security’ (Springer, 2017), pp. 139-160
6.Brancati, N., De Pietro, G., Frucci, M., and Gallo, L.: ‘Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’, in Editor (Ed.)^(Eds.): ‘Book Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’, in Editor (Ed.)^(Eds.): ‘Book Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’ (Springer, 2016, edn.), pp. 27-35
7.Karamizadeha, S., Mabdullahb, S., Randjbaranc, E., and Rajabid, M.J.: ‘A review on techniques of illumination in face recognition’, Technology, 2015, 3, (02), pp. 79-83
8.Surinta, O., and Khamket, T.: ‘Recognizing pornographic images using deep convolutional neural networks’, in Editor (Ed.)^(Eds.): ‘Book Recognizing pornographic images using deep convolutional neural networks’ (IEEE, 2019, edn.), pp. 150-154
9.Noh, Y., Koo, D., Kang, Y.-M., Park, D., and Lee, D.: ‘Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’, in Editor (Ed.)^(Eds.): ‘Book Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’ (IEEE, 2017, edn.), pp. 877-880
10.Md Noor, S.S., Ren, J., Marshall, S., and Michael, K.: ‘Hyperspectral image enhancement and mixture deep-learning classification of corneal epithelium injuries’, Sensors, 2017, 17, (11), pp. 2644
11.Gross, R., Baker, S., Matthews, I., and Kanade, T.: ‘Face recognition across pose and illumination’: ‘Handbook of face recognition’ (Springer, 2005), pp. 193-216
12. .Chen, Z., Liu, C., Chang, F., Han, X., and Wang, K.: ‘Illumination processing in face recognition’, International Journal of Pattern Recognition and Artificial Intelligence, 2014, 28, (05), pp. 1456011
13.Basilio, J.A.M., Torres, G.A., Pérez, G.S., Medina, L.K.T., and Meana, H.M.P.: ‘Explicit image detection using YCbCr space color model as skin detection’, Clustering for Skin Detection Under Different Lighting Conditions’, in Editor (Ed.)^(Eds.): ‘Book Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’ (Springer, 2016, edn.), pp. 27-35
7.Karamizadeha, S., Mabdullahb, S., Randjbaranc, E., and Rajabid, M.J.: ‘A review on techniques of illumination in face recognition’, Technology, 2015, 3, (02), pp. 79-83
8.Surinta, O., and Khamket, T.: ‘Recognizing pornographic images using deep convolutional neural networks’, in Editor (Ed.)^(Eds.): ‘Book Recognizing pornographic images using deep convolutional neural networks’ (IEEE, 2019, edn.), pp. 150-154
9.Noh, Y., Koo, D., Kang, Y.-M., Park, D., and Lee, D.: ‘Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’, in Editor (Ed.)^(Eds.): ‘Book Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’ (IEEE, 2017, edn.), pp. 877-880
10.Md Noor, S.S., Ren, J., Marshall, S., and Michael, K.: ‘Hyperspectral image enhancement and mixture deep-learning classification of corneal epithelium injuries’, Sensors, 2017, 17, (11), pp. 2644
11.Gross, R., Baker, S., Matthews, I., and Kanade, T.: ‘Face recognition across pose and illumination’: ‘Handbook of face recognition’ (Springer, 2005), pp. 193-216
12.Chen, Z., Liu, C., Chang, F., Han, X., and Wang, K.: ‘Illumination processing in face recognition’, International Journal of Pattern Recognition and Artificial Intelligence, 2014, 28, (05), pp. 1456011
13.Basilio, J.A.M., Torres, G.A., Pérez, G.S., Medina, L.K.T., and Meana, H.M.P.: ‘Explicit image detection using YCbCr space color model as skin detection’, Applications of Mathematics and Computer Engineering, 2011, pp. 123-128
14.Karamizadeh, S., and Arabsorkhi, A.: ‘Methods of pornography detection’, in Editor (Ed.)^(Eds.): ‘Book Methods of pornography detection’ (2018, edn.), pp. 33-38
15.Sufyanu, Z., Mohamad, F.S., Yusuf, A.A., and Mamat, M.B.: ‘Enhanced Face Recognition Using Discrete Cosine Transform’, Engineering Letters, 2016, 24, (1)
16.Liu, Z., Zhao, H., Pu, J., and Wang, H.: ‘Face recognition under varying illumination’, Neural Computing and Applications, 2013, 23, (1), pp. 133-139
17.Anagha, K., and Ram, A.R.: ‘Pose Tolerant Face Recognition: A Review’, in Editor (Ed.)^(Eds.): ‘Book Pose Tolerant Face Recognition: A Review’ (IEEE, 2020, edn.), pp. 0147-0152
18.Jin, X., Wang, Y., and Tan, X.: ‘Pornographic Image Recognition via Weighted Multiple Instance Learning’, IEEE transactions on cybernetics, 2018, 49, (12), pp. 4412-4420
19.Lopes, A.P., de Avila, S.E., Peixoto, A.N., Oliveira, R.S., and Araújo, A.d.A.: ‘A bag-of-features approach based on hue-sift descriptor for nude detection’, in Editor (Ed.)^(Eds.): ‘Book A bag-of-features approach based on hue-sift descriptor for nude detection’ (IEEE, 2009, edn.), pp. 1552-1556
20.Moustafa, M.: ‘Applying deep learning to classify pornographic images and videos’, arXiv preprint arXiv:1511.08899, 2015
21.Ding, X., Li, B., Li, Y., Guo, W., Liu, Y., Xiong, W., and Hu, W.: ‘Web Objectionable Video Recognition Based on Deep Multi Instance Learning with Representative Prototypes Selection’, IEEE Transactions on Circuits and Systems for Video Technology, 2020
فصلنامه علمي- پژوهشي فناوري اطلاعات و ارتباطات ایران | سال یازدهم، شمارههاي 41 و 42، پاییز و زمستان1398 صص: 1- 13 |
|
روشی نوین برای کاهش تغيير روشنايي در تصاویر غيراخلاقي بر پایه شبکه عصبی عمیق فازی
*ساسان کرمیزاده **ابوذر عربسرخی
*پژوهشگاه ارتباطات و فناوري اطلاعات(مركز تحقيقات مخابرات ايران) تهران ، ایران
**پژوهشگاه ارتباطات و فناوري اطلاعات (مركز تحقيقات مخابرات ايران) تهران ، ایران
تاریخ دریافت: 02/02/1399 تاریخ پذیرش: 29/06/1399
چکيده
در فضای اینترنت شناسایی عکسهای غیراخلاقی امری ضروری در جهت حفاظت فیزیکی و ذهنی کودکان محسوب میشود؛ یکی از چالشهای اصلی در تشخیص تصاوير غیر اخلاقی تغییرات روشنایی و رنگ پوست بدن است. به همین منظور در این مقاله روشی برای حل تغییرات روشنايي و بهبود تشخیص تصاویر غیراخلاقی ارایه شدهاست. در اين مقاله از شبکه عصبی عمیق فازی برای بهبود روشنایی تصاویر غیراخلاقی استفاده شده است. در روش پیشنهادی از مدل یادگیری عمیق xception جهت تقسیم تصویر براساس شدت روشنايي به بخشهای مختلف بهره گرفته شده است. تقسیم کردن تصویر به قسمتهای مختلف باعث بهبود تغییرات روشنايي با حفظ جزئیات تصویر و نهایتا شناسایی بهتر تصاویر غیراخلاقی شدهاست. به علاوه برای طبقهبندی رنگ پوست از ترکیب الگوریتم مبتنی بر Gaussian-KNN بهره گرفته شده است که روشی غیرپارامتری برای طبقهبندیها و رگرسیونها است؛ و در انتها از الگوریتم ماشین بردار پشتیبان براي طبقهبندی تصاویر استفاده شده است. به منظور پیادهسازی و ارزیابی روش پیشنهادی یک مجموعه شامل 33000 تصویر گردآوری شد، نتایج بدست آمده نشان میدهد که طرح پیشنهادی با دقت 7/99 درصد تصاویر غیراخلاقی را تشخیص میدهد.
کلید واژه: تغييرات روشنايي، طبقهبندي رنگ پوست، تغيير چهره، تصاوير اخلاقی و غیراخلاقی، Gaussian-KNN، الگوریتم ماشین بردار پشتیبان
یکی از چالشهای اصلی تشخیص تصاوير غیر اخلاقی مبتنی بر پردازش تصویر، تغییرات روشنایی و رنگ پوست بدن است. میزان روشنایی در تصاویر مختلف متفاوت است و تغییرات روشنایی یکی از مسائل حیاتی در تشخیص تصوير محسوب میشود. به عبارت دیگر شناسایی تصاوير در تغییرهای نور یک مسئله چالشانگیز است[3]. |
نویسنده عهدهدار مکاتبات: ابوذر عربسرخی Abouzar_arab@itrc.ac.ir |
1- مقدمه امروزه حجم و تنوع اطلاعات در سطح اینترنت به شدت در حال افزایش است. گروه سنی کاربران این فضا نیز بسیار متنوع میباشد. دسترسی کودکان و گروههای سنی نوجوان به اطلاعات غیراخلاقی -اصطلاحاً تصاویر بزرگسالان- بسیار چالش انگیز است [1]. تاکنون پژوهشهای مختلفی برای شناسایی تصاویر غيراخلاقي مبتنی بر روشهای پردازش تصویر و یادگیری ماشین ارائه شده است[2].
|
الگوریتمهای تشخیص تصاویر بزرگسالان باید مقادیر قابل قبولی از تغییرهای نور بین تصاویر گالری و جستجو را در نظر بگیرند[4, 5]. تفاوت در میزان نور تصاویر بهرغم شباهتهای موجود در آنها به احتمال زیاد منجر به طبقهبندی اشتباه تصویرهای بزرگسالان خواهد شد[6]. به منظور به حداقل رساندن تغییرهای نور در مجموعه دادههای تصویر بزرگسالان از طرح عادیسازی روشنایی استفاده میشود. با اینکار به دلیل وجود شباهتها در ویژگیهای تصویر با نورهای مختلف، احتمال طبقهبندی اشتباه کاهش مییابد[7]. علاوهبراین، افراد با نژاد متفاوت میتوانند برخلاف رنگ پوستهای مختلف ویژگیهای مشابهی داشته باشند. در نتیجه مقادیر عددی پیکسلها نه تنها با تغییرات نور، بلکه به دلیل اختلاف رنگها نیز تغییر میکند. به دلیل این اختلاف مقادیر (رنگ/ شدت متغیر بین پیکسل)، برخی از محققان وابستگی به تغییرهای نور را اولویتبندی میکنند[1]. هدف از این طبقهبندی بر روی بسیاری از اطلاعات بیومتریک نظیر پوست بدن، دست و پا، تعیین نوع پیکسل رنگ پوست است. طبقهبندی رنگ پوست باید به اندازهای جامع باشد که رنگهای مختلف پوست همانند سفید، زرد و سیاه را پوشش دهد[4]. فضاهای مختلف رنگی در تقسیم بندی پوست استفاده شده است. در برخی موارد، طبقهبندی رنگ پوست تنها با استفاده از رنگآمیزی پیکسل انجام میشود، زیرا انتظار میرود در صورت از بینرفتن روشنایی پیکسل قابلیت شناسایی تغییرهاي نور بیشتر شود[8].
در این مقاله از روش ترکیبی فازی و شبکه عصبی کانولوشنی جهت بهبود شدت نور استفاده شده است. برای کاهش شدت تصویر غیراخلاقی از روش شبکه عصبی فازی برای تقسیمبندی عکس استفاده کردهایم و بعد از تقسیمبندی عکس برای بهبود شدت نور از روشهای هیستوگرام و کنتراست بر روی هر قسمت از عکس استفاده شده است.
2- کارهای مرتبط
تاکنون مطالعات ارزشمندی در حوزه تشخیص برهنگی و تصاویر غیراخلاقی مبتنی بر روشهای پردازش تصاویر انجام شده است. کارهای اولیه عمدتاً بر یافتن افراد برهنه در تصاویر براساس مدل ساختار انسانی تمرکز داشتند[9-11]. در این تحقیق از ماشینهای بردار پشتیبان جهت طبقهبندی استفاده شدهاست. اين الگوریتم معرف یک طبقهبندی دودویی است که در طبقهبندی چند کلاس استفاده میشود. این روش دارای محاسباتی پیچیده است؛ در نتیجه اجرای آن به کندی انجام میشود[12]. رویکردهای مبتنی بر قسمت بدن، چندین ویژگی معنایی مرتبط با پورنوگرافی همانند "سینه"، "شکم" و "پایین" را تعریف میکند، و برای این ویژگیها ردیابهای مربوط به بخش بدن را آموزش می دهد[13, 14]. با توجه به تصویر، از آشکارسازهای قسمتهای بدن برای پویش تصویر استفاده و نتایج بدست آمده جستجو میشود، آنگاه بوسیله یک بردار ویژگی معنایی طبقهبندی صورت میگیرد. با این حال، این آشکارسازهای قسمت بدن به دلیل پشتیبانی از وصلههای کوچک و تغییرهای ظاهری زیاد در آموزش، دچار مشکل تشخیص میشوند. در این مقاله از ویژگیهای تبدیل موجک مجتمع دوگانه برای بهبود استخراج ویژگی تصاویر استفاده شدهاست. در این تحقیق پیش از استفاده تبدیل کسینوس گسسته از انتشار بي نظير استفاده شده که یک تابع خطی است. این روش برای کاهش پارازیت در راستای حفظ مرز، بین اشکال استفاده میشود. باید به این موضوع توجه داشت که کاربرد توابع خطی در موقعیتهای پیچیده مناسب نیست[15,16]. یکی از عیبهای این تحقیق، نرمالسازي نوردهی بر روی کل تصویر است که در مقایسه با روشهای عادیسازی دارای دقت کمتریاست. در این تحقیق از نقشه خود سازماندهي جهت کاهش اثر تغییرات نور در تشخیص تصویر استفاده شده است [10, 17].
3- روش پیشنهادی برای کاهش تغییرات روشنایی
روش پیشنهادی در این مقاله شامل دو بخش اصلی
پیشپردازش و پردازش است.
پیش پردازش شامل دو مرحله است. فرایند پیش پردازش مربوط به تغییر اندازه و عادیسازی نور است. تصویر ورودی با نگه داشتن نسبت طول و عرض به اندازه 256 پیکسل اندازه گیری میشود، تا زمان محاسبات فرایند بعدی کاهش یابد. به منظور کاهش شدت نور در تصاویر، از یکسانسازی هیستوگرام استفاده شده است. پیکسلهای پوست که دارای تغییرات نور زیادی هستند، نمیتوانند در طبقهبندی به عنوان پوست عادی قرار گیرند. به عبارت دیگر، از هیستوگرام برای رسیدگی به تغییرات روشنایی تصاویر ورودی استفاده میشود. در بخش پیشپردازش برای متعادلسازی کنتراست از روش انحراف هیستوگرام استفاده شده است. پس از متعادلكردن خودکار کنتراست، نیاز به کاهش پارازیت موجود در تصویر ورودی -همانند لکههای سیاه وسفید- است. برای این مرحله از فیلتر وینر استفاده شده است.
بعد از انجام پیش پردازش، تصویر به بخش پردازش ارسال میشود، که گام نخست در این بخش، نرمالسازی نور است. نرمال سازی نور از طریق شبکه عصبی عمیق فازی مبتنی بر تکنیک تقسیمبندی انجام میشود. هدف از تقسیمبندی تصویر حذف بهتر تغییرات نور و حفظ ویژگیهای اصلی تصویر است. به عبارتي ديگر، اين فعاليت نورهای زائد را حذف میکند. مرحله بعدی در طرح پیشنهادی، طبقهبندي رنگ پوست است که برای تشخیص تصویرهای متعدد در یک فریم تصویر استفاده میشود. به منظور استخراج ویژگیهای عکس، از تکنیک استخراج ویژگی معادله تجزیه مقادیر منفرد1 بهره گرفته شدهاست. در نهايت ویژگیهای استخراج شده برای طبقهبندی به الگوریتم ماشین بردار پشتیبان اعمال میشوند.
شکل 1 بلوک دیاگرام روش پیشنهادی را به تصویر کشیده است. در ادامه جزئیات هریک از بخشهای روش پیشنهادی شرح داده میشود.
شکل 1 : بلوک دیاگرام روش پیشنهادی
1-3-تنظیم گر خودکار شدت نور
2-3-کاهش پارازیت
کاهش پارازیت2 یکی از مهمترین قسمتهای پیش پردازش است. در این بخش، ضمن حفظ پارامترهای مهم، پارازیت حذف میشود. در اين مقاله از سه نوع فیلتر وينر3، متوسط4 و ميانگين5 جهت کاهش پارازیت استفاده شده است.
بعد از انجام تست و گرفتن نتایج مشخص شده که فیلتر وینر بهترین عملکرد را دارد. بهاینصورت که فرض اولیه آن برای همه تصاویر، وجود لکههای کوچک پارازیت است. این الگوریتم برای از بین بردن پارازیتهای ظریف بسیار کارآمد است. فیلتر وینر با استفاده از روش وینر سازگار با پیکسل و براساس آمار تخمين زده شده از اطراف هر پیکسل و با استفاده از تابع توزیع نرمال عمل ميکند. معادله (1)میانگین و واریانس اطراف هر پیکسل را برآورد مینماید.
(1)
در این رابطه،
H (u, v): تابع کاهشی
H*(u,v): تابع پیچیدگی تابع کاهشی
Pn(u,v): قدرت تراکم طیفی از پارازيت
Ps(u,v): قدرت عددی طیفی تصویر ناسازگار.
اصطلاح Pn / Ps میتواند به عنوان نسبت سیگنال به پارازيت تفسیر شود. فیلترهای وينر توسط موارد زیر مشخص میشوند:
فرض: سیگنالهای پارازيت معرف فرآیند خطی ثابت با ویژگیهای طیفی شناختهشده هستند.
الزامات: فیلتر باید بطور فیزیکی قابل درك باشد.
معیارهای عملکرد: حداقل میانگین خطای مربع.
وینر به عنوان فیلتری برای برآورد یک فرآیند تصادفی مورد نظر یا هدف مطرح است و با فیلتر نمودن غیرخطی یک روند پارازیت اجرايي میشود. فیلتر وینر میانگین خطای مربع ما بین فرآیند تصادفی برآورد شده و روند مورد نظر را به حداقل میرساند.
3-3-نرمالسازی نور
گام بعدی اين فرآيند، نرمالسازی نور6 است. تنوع تابش میتواند باعث کاهش عملکرد سیستمهای تشخیص تصویر شوند. بنابراین برای حل این مسئله، نرمالسازی نور تصویر را براساس روش تقسیمبندی شبکه عصبی فازی انجام ميدهيم. تكنيكهاي عادیسازی نورپردازی، برخی تغییرها را در تصویر ایجاد میکنند. اين متغييرها سبب ایجاد یک فرم استاندارد بدون هیچگونه تغییر در نور و حذف ضریبهای تبدیل کسینوس گسسته در منطق لگاریتم میشوند. اینکار معادل جبران تغییرات نور است. در این مقاله، روشهای نرمالسازي زیر مورد بررسی قرار میگیرند: 1) تبدیل کسینوس گسسته، 2) چندین مقیاس رتینکس7 3) نرمال سازی مبتنی بر موجك،4) مقياس تك رتینکس8 و 5) تفاوت گاوسی .9 نرمالسازی نور تصویر بر اساس تکنیک تقسیمبندی شبکه فازی را میتوان به چهار مرحله تقسیم نمود، در شکل 2 نمای از مراحل نرمالسازی نور ارائه شده است.
شکل 2: مراحل نرمال سازینور
3-3-1 -بخشبندی شبکههای عصبی عمیق فازی با هدف بخشبندی تصویر
شبکه عصبي فازی عميق در قالب شکل 3 به تصوير كشيده شدهاست. همانطور که در شکل مشاهده میشود، این شبکه از پنج بخش تشکیل شدهاست. بخش اول تصویر ورودی است. در بخش دوم تابع عضویت فازی پردازش میشود. بخش سوم لایه فازي عصبی است که به وسيله شبکه عصبی عمیق xception ساخته شده است.
شکل 3- مراحل تقسیم شبکه عصبی عمیق فازی
قسمت اول- لایه تابع عضویت فازی :هر نورون در لایه ورودی با توابع عضو چندگانه در ارتباط است که برچسبهایی را برای هر متغیر ورودی اختصاص میدهد. در اینجا، متغیر ورودی یک بعد از بردار ورودی است. محاسبه درجه عضویت یک نورون ورودی به یک مجموعه فازی خاص توسط تابع عضویت معادله 2 انجام ميشود. در این لایه، نورون فازی نشان دهنده ورودی به عنوان درجه فازیاست که درمعادله 2 نشان داده شده است.
(2)
در این معادله (2) تابع عضویت گوسي با میانگین μ و واریانس مورد استفاده قرار میگیرد.
(3)
که در معادله (3)، Ωi مجموعهای از نورنها را در لایه را تعريف مينمايد که به i متصل میشوند. در این مورد، لایه ورودی است. خروجیهای این بخش درجههای فازی هستند.
قسمت دوم- شبكه عصبی فازی: در این قسمت از مفهوم یادگیری عصبی استفاده میشود تا ورودی را بهعنوان برخی از نمایندگیهای سطح بالا تغییر دهد. در اين قسمت لایهها به طور کامل متصل میشوند، به این معنی که هر پیکسل در لایه (l) به تمام پیکسلهای لایه (l − 1)th با پارامترهای θ (l) = {w (l) , b (l) }, متصل ميشوند.اين مثال در معادله (4) ارائه شدهاست.
(4) قسمت سوم - لایه کانولوشنال : تصویر از طریق یک ستون از لایههای کانولوشن و پس از نمایش عصبی فازی عبور داده میشود. در این لایه از فیلتر 8 × 8 استفاده میشود. گام کانولوشن، 1 پیکسل انتخاب شدهاست. این لایه همانند فیلتر به تصویر اعمال میشود. این فیلتر ویژگیهایی را از سطح پایین به سطح بالا میبرد. توابع فعالسازی مختلف در لایههای متفاوت برای استخراج ویژگیهای متنوعی استفاده میشوند. درلایه کانولوشن محاسبه ضرب نقطهای بین وزنهای نورون و یک ناحیه کوچک از حجم ورودی استفاده میشود. در طول هر گام، يك فیلتر در عرض و ارتفاع عکس ورودی، نقطهها بین ورودیهای فیلتر و نقشه فعال 2 بعدی ايجاد شده و از آن فیلتر را محاسبه میکند. در نتیجه، شبکه فیلتر را یاد میگیرد که وقتی یک نوع خاص از ویژگیها را در یک موقعیت مکانی از ورودی مشاهده میکنند، فعال میشود.
قسمت پنجم- لايه پیشبینی V : در اين مرحله تابع سافت مكس10 اعمال ميشود كه برای طبقهبندی دادهها به کلاسهای مختلف كاربرد دارد. اين تابع به عنوان ورودی و برچسب مربوط به آن به معنی تبدیل تغذیه شبکه کاملا متقارن فازی11 از لایه ورودی به آخرین لایهکار اعمال مينمايد. در ادامه، تابع سافتمكس میتواند بهعنوان لایه خروجی با ورودی محاسبه شده و توسط معادله (5) انجام شود.
(5)
در این رابطه و نشان دهنده ضریب رگرسیون و معرف کلاس است، که برچسبهای پیشبینی شده شبکه عصبی با کلاس k است. آنگاه، از بین رفتن میانگین مربع شبکه عصبی با اتصال کامل میتواند بر روی بيش از m نمونههای آموزش تعریف شود كه اين موضوع در قالب فرمول (6) نمايش داده شدهاست.
(6)
3-3-2 - هیستوگرام کاهش و کشش
مرحله دوم شامل کاهش و کشش هیستوگرام است. برش و کشش هیستوگرام یک تکنیک تکرار هیستوگرام محسوب ميشود. این روش شامل توزیع شدت در مقیاس مقادیر موجود است. این مقدار برای کشش هیستوگرام روی تمام تصوير است، بهطوریکه مقدار کمترین شدت صفر باشد و حداکثر مقدار آن بالاترین باشد. در نتیجه، پیکسلهای نور حتی سبکتر و تاریکتر به سیاه نزدیکتر میشوند که توزیع بهتري را شکل میدهند. عمل كوتاه كردن، قبل از کشش انجام ميشود تا قطر خاصی از انتهای پایین و بالاي هیستوگرام را قطع کند. اين كار اثر جعلی را از چندین پیکسل روشن یا تاریک بیش از بقیه حذف مينمايد. به طور مستقیم کاهش و کشش هیستوگرام در هر بخش تقسیم شده موجب ايجاد یک مشکل خاص ميشود. در این مورد، برخی از قطعههای محلی ممکن است به دهانههای مختلف تقسیم شوند و شدت این دهانهها برای کشیدن کل تصوير گسترش یافته باشد. در نتیجه، این قطعات الگوهای منفرد فضایی را با شدت در جهت معکوس در مقایسه با تصویر اصلی نمایش میدهند که در شکل4 به تصویر کشیده شده است.
شکل 4: تعییرات تصویر بعد از هیستوگرام کاهش و کشش
3-3-3-هیستوگرام سازگار محدود کنتراست
گام دوم کنتراست محدود انحصار هیستوگرام سازگار12است. تکنیکهای تقویت کنتراست در پردازش تصویر به طور گستردهای مورد استفاده قرار میگیرد. انحصار هیستوگرام سازگار محدود کنتراست معرف يک نسخه بهبود یافته از انعطافپذیری هیستوگرام سازگاراست. این رویکرد، مناطق کوچک تصویر را با استفاده از خصیصههای هیستوگرام برای هر پيكسل به صورت جداگانه پردازش میکند. کنتراست، به ویژه در مناطق شدت همگن، میتواند برای جلوگیری از تقویت پارازیت محدود شود. که در شکل 5 به تصویر کشیده شده است.
شکل 5: بعد از هیستوگرام سازگار محدود کنتراست
4-3-3- نرمالسازي
روش نرمالسازي تبدیل کسینوس گسسته جهت حذف اثرهای تنوع روشنایی بهکاربرده شدهاست. در این مقاله، تلاش بر اين بود تا یک روش نرمالسازی نور را برای حذف تغییرات نور در حالی که خصیصههای اصلی تصویر بدون تغییر بماند را بررسی نماييم. ایده کلیدی رویکرد پیشنهادی این است که تغییرات نور را میتوان با کاهش ضرایب تبدیل کسینوس تقریباً فرکانس پایین در دامنه لگاريتم تبدیل کسینوس گسسته کاهش داد. تکنیک نرمالسازی مبتنی بر تبدیل کسینوس گسسته یک مقدار ثابت از ضرایب تبدیل کسینوس گسسته را مطابق با فرکانسهای پایین تعیین میکند، که با تغییر دادن غیرمستقیم روشنایی دنبال میشود. علاوه بر اين، ضرایب تبدیل کسینوس گسسته با استفاده از الگوی زيگزاگ انتخاب میشوند.
تبدیل کسینوس گسسته به عنوان روشی قدرتمند در كاربردهاي تشخیص تصوير و برنامهنویسی تصویر شناخته میشود. الگوريتم نرمالسازی نور تصویر براساس تکنیک تقسیم شبکه عصبی فازی عمل مينمايد. تکنیکهای نرمالسازی نورپردازی برخی تغییرهاي در تصویر را برای ایجاد یک فرم استاندارد بدون هیچگونه تغییرهای نورانی و حذف ضریب تبدیل کسینوس گسسته با فرکانس پایین در منطق لگاریتم انجام میدهند. پیادهسازي تبدیل کسینوس گسسته نیاز به دو حلقه تو در تو دارد. دستورهاي رايانشيM × N بدان معنی است که افزایش M و N بهطور قابل توجهی متناسب با زمان پردازش است. با توجه به این محدودیتها، محققان تصویر ورودی را جهت غلبه بر این محدودیتها تغییر ميدهند. با این وجود، با استفاده از تبدیل کسینوس گسسته در قسمتهای مختلف تصویر، زمان محاسبه کمتری را لازم دارد. تعداد زیادی از ضرایب تبدیل کسینوس گسسته قرار داده شده در یک بردار، باید در مرحله پیادهسازی مرحله كميسازي به صفر برسد. توالی زيگزاگ بهعنوان بهترین روش در اين فضا عمل ميكند. تمام این اجزاء میتوانند پس از ضرایب تبدیل کسینوس گسسته در شکل بردار از طریق توالی زيگزاگ به صفر برسند.
4- طبقهبندی پوست
طبقهبندی پوست که یک ترکیب پیشرفته الگوریتم مبتنی بر Gaussian-KNN است، یک روش غیرپارامتری برای طبقهبندیها و رگرسیونها است. الگوریتم K-NN شامل برآورد شباهت ما بین نمونه ورودی و Kنزدیکترین نمونه موجود در فضای برجسته است. هر ویژگی یک برچسب کلاس دارد؛ بنابراین، الگوریتم به شمارش تعداد مواردی ميپردازد که متعلق به هر کلاساست. نتیجه طبقهبندی کلاس متاثر از حداکثر تعداد موارد اختصاص داده شدهاست. الگوریتم وزني K-NN از یک روش مشابه كه در فرمول (7) نشان داده شده است براي تخمين ارزش هر رای برای بهبود عملکرد طبقهبندی به روش زیر استفاده میکند.
(7)
در این رابطه موارد زیر را میتوان مد نظر قرار داد:
-کلاس (x): کلاس حقيقي نمونه x را باز میگرداند و یک کلاس پیشبینی را نشان میدهد.
-K: تعداد نزدیکترین همسایگان استفاده شده در K-NN را نشان ميدهد.
-NNi(x): نزدیکترین همسایه iام با توجه به یک نمونه بدون برچسب x از i = 1،2، ...، k را نشان ميدهد.
-F(x,y): یک تابع وزني براي رأی دهي است که میزان تاثیر نزدیکترین همسایه y را به x تعيين مینمايد.
-δ(class(x), class(y)): به این معنی است که k-NN وزن یکسانی را برای هرکدام از نزدیکترین همسایگان برای رایگيري اکثریت تعیین میکند. بنابراین f(x,y) مقدار هر كدام از ويژگيها را تخمين ميزند و تابع,j) δ (i، تابع دلتا Kronecker است كه بهصورت زير در معادلههای 8 و 9 تعریف ميشود،
(8) بنابراین
(9)
توابع كرنل گاوسي به دو دلیل انتخاب شدهاست. اولین دلیل این است که، تابع گاوسی صاف است و از این رو تابع چگالی برآورد شده نیز به آرامي تغيير میكند. دومین دليل، در فرم خاصی از توابع گاوسی که در آن تابع به طور شعاعی متقارن است، تابع میتواند بهطور کامل توسط پارامتر واریانس مشخص شود كه در معادله (10) تابع گاوسی را نشان داده شده است.
(10)
که در آن x نمونه ورودی است و y یک نمونه از ویژگی است؛ آنها را بردارهای RGB میسازند، و مقدار میانگین است .طبقهبندی نزدیکتری همسایگی K پیشنهادی نسبت به طبقه اقليت بسيار حساس است. ایده اصلی شناسایی نمونههای کلاس اقلیت در دادههای آموزشی و سپس تعمیم آنها به عملکرد گاوسی بهعنوان مفهومی برای طبقه اقلیت عمل مينمايد. این رویکرد مبتنی بر توسعه مرز تصمیمگیری برای طبقه اقلیت بنا نهاده شده است. معادله (11) Guassian-based weight K-NN را نشان میدهد:
KNN= class(x)
Gaussian
Gaussian based KNN= K-NN + Gaussian
Class(x) ' = KNN+Gaussian
(11)
یک آستانه برای شناسایی دادههای پوست در سیستم رنگ YC_bC_r استفاده میشود[13]. آستانه ای در آن بیشتر افراد با رنگ پوست مختلف در تصویر میتوانند با استفاده از تکنیکهای هیستوگرام تقسیم شوند. بنابراین نیاز است که تصویر را به این سیستم تغییر داده و انگاه تمام پیکسلهایی را که از یک محدوده داده از پیش تعیین شده خارج شدهاند را حذف نمود. زمانیکه میانگین پیکسلهای استخراج شده از بردارR,G,B محاسبه میشو؛ که در معادلههای12،13،14 بیان شده است.
Y=(0.299×R)+(0.587×G)+(0.114×B) (12) C_b=(B-Y)×0.564+135.0 (13)
C_r=(R-Y)×0.713+128.0 (14)
تصویر تبدیل شده YC_b C_r به مرحله بعدی منتقل میشود، یعنی استخراج پیکسلهای پوستی، پیکسلهای پوست با استفاده از معادله (15) زیر استخراج میشوند.
[85<Cb<135
135>Cr<180] (15)
هر منطقه از تغییرات نور تصاویر رنگی بر اساس تغییرات برآورد شده توسط یک الگوریتم ثبات رنگ مبتنی بر لبه محلی13 اصلاح میشود. سپس تصاویر تصحیح شده به یک فضای رنگی YC_bC_rتبدیل می شوند، و قسمت رنگ پوست و قسمتهای رنگی غیر پوست از هم جدا شده اند.
علاوه بر این، مورفولوژی14 نیز در این فرایند گنجانده شده است تا طبقهبندی پوست مثبت کاذب را حذف کند. ثابت شده است که این مدل عملکرد بهتری در شناخت تصاویر غیر اخلاقی ارائه میدهد [17]. در این تبدیل، تطبیق هیستوگرام در سطح شدت Y انجام میشود و در نهایت میتوان تصویر YC_b C_r حاصل را به RGB برگرداند بردار رنگ به طبقهبندیK-NN منتقل خواهدشد. با توجه به اینکهK-NN نیاز به آموزش ندارد، وزن K-NN بهعنوان طبقهبندی بسیار مناسب برای مجموعه دادههای جزئی مورد توجه قرار ميگيرد. طبقهبندیکننده K-NN فاصله اقلیدسی بردار رنگ و تمام نمونههاي مجموعه داده را 50 = kمحاسبه میکند. در ادامه فاصلهها را بهصورت صعودی مرتب میکند، علاوه بر این K نزدیکترین فاصله را انتخاب مینماید. سیستم امتیازدهی مبتنی بر گاوسي، مقدار گاوسی را براساس فاصله نمونه از بردار محاسبه میکند. در واقع، این طرح همه امتیازها برای هر برچسب کلاس را به طور جداگانه محاسبه مینمايد. برچسب کلاسي كه با بالاترین نمره انتخاب میشود تحت عنوان برچسب نمونه شناخته ميشود. نتیجه این مرحله تصویر طبقهبندیشده است که يكي از گروههاي پوستی سفيد، سياه یا زرد را نشان ميدهد.
5- استخراج ویژگیها
مرحله سوم پردازش تصویر به استخراج ویژگی اشاره دارد. در اين مرحله از تجزیه مقادیر منفرد برای استخراج ویژگیهایی استفاده ميشود که مبناي تشخیص طیف وسیعی از تصاویر هستند. اين الگوريتم در تشخیص تصاویر غیراخلاقی مؤثرتر است، زیرا ویژگی ارزش واحد نسبت به تغییرات رنگ خاکستري در طی فرآیند شناخت حساس نيست و میتواند بر برخی از عوامل دیگر همانند تغییر نور غلبه كند. دو دیدگاه عمده پيرامون ویژگیهای اين الگوريتم وجود دارد. اولين ديدگاه اين است كه از تجزیه مقادیر منفرد میتواند بهعنوان یک روش تبدیل متغیرهای هم بسته به مجموعه دادههاي اصلي استفاده نمود، و روابط مختلف را در میان اقلام دادههای اصلی موثرتر نشان داد. دومين ديدگاه اين است كه از اين روش براي شناسایی و ترتیب ابعاد دادهها که در آن نقاط دادهها بیشترین تغییر را نشان میدهند استفاده شود. استفاده از اين سازوكار برای تعیین بهترین تقریب نقاط دادههای اصلی با استفاده از ابعاد کمتر امکانپذیر است. از اینرو تجزیه مقادیر منفرد بهعنوان روشی برای کاهش دادهها مطرحاست.
معادله تجزیه مقادیر منفرد برای یک (m × n) ماتریس مفرد است، در جایی که U یک ماتریس قائم (m × m) است، V یک (n × n) است.
ماتریس قائم و S یک ماتریس مورب (m × n) است، که حاوی مقادیر منفرد A است که به ترتیب مرتبه کاهش مییابد. یک بردار در یک ماتریس متعامد می تواند به عنوان ترکیبی خطی از بردارهای دیگر بیان شود. بردارهای موجود در این فضا نیز به طور متقابل مستقل هستند و اکنون می توان یک راه حل برای x محاسبه کرد.
عناصر مورب ماتریس S به ترتیب نزولی ذکر شده و مقادیر منفرد A نامیده میشوند.
6- تشخیص تصویر
در این قسمت از الگوریتم ماشین برادر پشتیبان برای طبقهبندی عکسها استفاده شده است. کلاسبندی ماشین بردار پشتیبان به وسیله فرمول (16) بدست میآید.
(16)
که در آن K تابع کرنل و xiمعرف بردار پشتیبان، Ls معرف تعداد بردارهاي پشتیبان و diمعرف شماره کلاس xiمربوطه است و در نهایت ai ها اعداد ثابتی هستند که در مرحله آموزشی به دست میآیند. با توجه به تعریف، بردارهاي پشتیبان المانهایی از دادههاي آموزشی هستند که دقیقاً بر روي و یا داخل مرزهاي تصمیمگیري طبقهبندي قرار میگیرند. به عبارتی دیگر این بردارها شامل نمونههایی هستند که دستهبندي آنها از بقیه نمونهها مشکلتر است. ویژگی اصلی این روش توانایی بالا در استفاده از نمونههای تعلیمی کمتر و رسیدن به دقت بالاتر است.
به عبارتی دیگر این بردارها شامل نمونههایی هستند که دستهبندي آنها از بقیه نمونهها مشکلتر است. باید به این نکته توجه شود که در یک مسئله ماشین بردار پشتیبان تنها کسر کوچکی از دادههاي آموزشی به عنوان بردارهاي پشتیبان تعیین میگردند. توابع کرنل نقش مرکزي و اصلی را در نگاشت کردن منحنی بردار ورودي به فضاي ویژگی با ابعاد بالاتر، براي به دست آوردن تفکیکپذیري بیشتر بازي میکنند، در این مقاله از کرنل چند جملهای استفاده شده است.
7- نتایج بدست آمده
به منظور پیاده سازی و ارزیابی روش پیشنهادی یک پایگاه داده از طریق جستجو در اینترنت مشتمل بر 33000 تصاویر اخلاقی و غیر اخلاقی ایجاد شد. دقت یک هدف مناسب در هر سناریوی یادگیری ماشیني محسوب ميشود؛ زماني که دادههای یک کلاس در مقادیر بسیار بیشتری از دادههای کلاس دیگر وجود دارند. معادلههای (16) و (17) و (18) برای شاخصهای عملکرد استفاده شد. در این مقاله 70 درصد از مجموعه دادهها را برای آموزش دادهها و 30 درصد از دادهها را برای تست استفاده شده است. به علاوه داشتن یک مجموعه داده جامع، دستیابی به سطح بالاتری از آموزش را فراهم میکند یکی از عوامل موفقیت است.
FCN-AlexNet که از قبل روی مجموعه دادههای SYNTHIA آموزش داده شده است که حاوی بیش از 200،000 تصویر است. پس از آن، یادگیری انتقالی در تقسیمبندی متراکم از نور با استفاده از تقسیم داده ها و طرح اولیه وزن MSRA انجام شده است.
با توجه به تغييرات روشنايي در تصاوير غيراخلاقي كه داراي پوست تيره بوده اند خطاي كاذب بيشتر بوده است.
(16)
(17)
(18)
7-1- مقايسه مدل هاي يادگيري عميق
در این قسمت عملکرد مدلهای یادگیری عمیق به کار گرفته شده، مورد ارزیابی قرار گرفتهاست. عملکرد این مدل ها بر حسب پارامترهای ارزیابی ارائه شده است.
جدول شماره 3: مقایسه مدلهای یادگیری عمیق
precision | recall | دقت | سرعت | سایز | مدل |
0.93 | 0.91 | 0.94 | ms30
| 138 mi | VGG-16 |
0.94 | 0.94 | 0.990 | ms15
| 25 mi | Resnet50v2 |
0.96 | 0.96 | 0.997 | ms24
| 22 mi | xception |
همانطور که در جدول شماره 3 نشان داده شده است مدل xception بهترین دقت را نسبت به دو مدل دیگر ارائه نمودهاست، ولی از نظر سرعت مدل resent50v2 بهترین نتیجه نسبت به دو مدل xception و VGG-16به دست آورده است و چون شاخص دقت مهمتر بود مدل xecption انتخاب شد.
7-2 منحنی خطای تشخیص
در منحنی خطای تشخیصخطا15 در حالت ایده آل، احتمال بروز هر دو نوع خطا صفر خواهد بود. در عمل، این دو قابل معامله هستند: احتمال پذیرش کاذب میتواند با هزینه افزایش رد کاذب کاهش یابد.
منحنیهای خطای تشخیص نشان میدهد چگونه ممکن است نقطه عملیاتی برای تغییر مبادلات بین FA و FR تغییر کند، این منحنی در شکل 6 نشان داده شده است.
بهترین حالت این است که هر دو خطای FA و FR در هر نقطه عملیاتی کم باشند. به عبارت دیگر ، منحنی خطای تشخیص باید نزدیک یا در محورهای FA / FR باشد.
شکل 6: منحنی خطای تشخیص خطا
منحنی خطای تشخیص برای سه مدل مختلف یادگیری عمیق نشان داده شده است. طبقه بندی بهتر دارای منحنی پایین تر است که به محورها نزدیک تر است كه توسط خط مورب نشان داده شده است. که در این سه مدل، مدل xception بهترین نتیجه را ارائه نمودهاست.
7-3 معماری VGG-16
شبکه VGG- 16 شامل 16 لایه کانولوشنی یا 16 لایه پارامتری است. شبکه VGG -16، شامل دو لایه کانولوشنی با 64 فیلتر 3×3 هست که پشت سر هم قرار گرفتهاند. سپس، یک لایه ماکسپولینگ 2×2 با پرش به اندازه 2 قرار گرفته است. این لایه ماکسپولینگ علاوه بر نمونهبرداری، وظیفه کاهش بعد ویژگیها به نصف را هم دارد. در ادامه، دو لایه کانولوشنی دیگر با 128 فیلتر 3×3 و یک لایه ماکسپولینگ 2×2 و پرش 2 قرار گرفتهاند. بهطور مشابه، سه لایه کانولوشنی با 256 فیلتر 3×3 و یک لایه ماکسپولینگ 2×2 با پرش 2 قرار گرفتهاند 3 لایه کانولوشنی با 512 فیلتر 3×3 و یک لایه ماکسپولینگ ادامه این شبکه هست که البته دو بار تکرار میشود. درنهایت، ویژگیها تبدیل به یک بردار ویژگی میشوند تا در اختیار لایههای نورونی تمام اتصال قرار گیرند. دو لایه نورونی به ابعاد 4096 پشت سر هم قرار گرفتهاند. درنهایت، یک لایه نورونی به ابعاد 1000 که متناظر با تعداد کلاسهای کاربرد ما هست، در نظر گرفته شده است لایه خروجی شامل 1000 نورون است. در تمامی لایههای کانولوشنی و لایههای نورونی از تابع فعالساز بنام RELU استفاده شده است.
4-7- مقایسه روش انجام شده
در این بخش عملکرد روش پیشنهادی با روش سنتی شناسایی تصاویر غیراخلاقی و روشهای نوین مبتنی بر تکنیکهای یادگیری عمیق مقایسه شده است. مقايسه نتایج بین سه روش تشخیص عکسهای غیراخلاقی با روش پیشنهادی پيرامون محاسبه دقت در قالب جدول 4 ارائه شده است.
جدول4: مقايسه بين روشهاي موجود با روش پيشنهادي
نتایج مجموع | نتیجه اخلاقی | نتیجه غیراخلاقی | روشها | |
85/64 |
41/61 |
30/68 | Region-of-Interest Method[18] | |
83/75 | 87/71 | 79/79 | Bag-of-Feature method[19] | |
94/90 | 22/89 | 67/92 | Deep Fused CNN[20] | |
35/98 |
51/98 |
18/98 | Pornographic Image Recognition Via Weighted Multiple Instance Learning[21] | |
70/99 | 85/99 | 60/99 | روش ارایه شده |
روش سنتی یک روش بازیابی شده است که با استفاده از تشخیص پوست، رنگ، شکل و ویژگی های پوست را بر روی ROI استخراج می کند[18]. ویژگی BoF رویکرد مبتنی بر توصیف Hue-SIFT و نسخه بهبود یافته آن براساس مدل توجه بصری است[21]. در هر دو روش عملکرد خوبی برای مجموعه داده های کوچک است[19]. روش عمیق مبتنی بر CNN برای تشخیص تصویر غیراخلاقی وجود دارد [20]. برای انجام یک مقایسه جامع با مقدمات عمیق مبتنی بر CNN، الگوریتمهای توصیف شده در [20]، و سه تغییر مبتنی بر CNN را با داده های آموزش پیادهسازی کردیم.
روش ارایه شده در این مقاله بر روی انواع تصاویر با کیفیت های مختلف کار میکند، به طور خاص، روش ارایه شده نسبت به سایر روشها در تصاویر غیراخلاقی که بصورت غیرحرفه ای گرفته شدهاند، مزایای بارزی را نشان میدهد. این بخش از تصاویر غیراخلاقی عمدتاً از تصاویر غیرحرفهای در زندگی روزمره ناشی میشود که تغییرات زیادی در زمینه، مقیاس، روشنایی و افراد در معرض نمایش قرار میگیرند.
8- نتیجهگیری
طرح پیشنهادی در این مقاله شامل دو بخش پيش پردازش و پـردازش اسـت. بخـش پیـشپردازش شـامـل تنـظیمگر
8- منابع 1.Wang, H., and Fan, A.: ‘Pornographic information of Internet views detection method based on the connected areas’, in Editor (Ed.)^(Eds.): ‘Book Pornographic information of Internet views detection method based on the connected areas’ (International Society for Optics and Photonics, 2017, edn.), pp. 1032228 2.Wang, Y., Jin, X., and Tan, X.: ‘Pornographic image recognition by strongly-supervised deep multiple instance learning’, in Editor (Ed.)^(Eds.): ‘Book Pornographic image recognition by strongly-supervised deep multiple instance learning’ (IEEE, 2016, edn.), pp. 4418-4422 3.Adnan, A., and Nawaz, M.: ‘RGB and hue color in pornography detection’: ‘Information Technology: New Generations’ (Springer, 2016), pp. 1041-1050 [4] Nian, F., Li, T., Wang, Y., Xu, M., and Wu, J.: ‘Pornographic image detection utilizing deep convolutional neural networks’, Neurocomputing, 2016, 210, pp. 283-293 [5] Karamizadeh, S., Abdullah, S.M., Zamani, M., Shayan, J., and Nooralishahi, P.: ‘Face recognition via taxonomy of illumination normalization’: ‘Multimedia Forensics and Security’ (Springer, 2017), pp. 139-160 [6] Brancati, N., De Pietro, G., Frucci, M., and Gallo, L.: ‘Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’, in Editor (Ed.)^(Eds.): ‘Book Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’ (Springer, 2016, edn.), pp. 27-35 [7] Karamizadeha, S., Mabdullahb, S., Randjbaranc, E., and Rajabid, M.J.: ‘A review on techniques of illumination in face recognition’, Technology, 2015, 3, (02), pp. 79-83 [8] Surinta, O., and Khamket, T.: ‘Recognizing pornographic images using deep convolutional neural networks’, in Editor (Ed.)^(Eds.): ‘Book Recognizing pornographic images using deep convolutional neural networks’ (IEEE, 2019, edn.), pp. 150-154 [9] Noh, Y., Koo, D., Kang, Y.-M., Park, D., and Lee, D.: ‘Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’, in Editor (Ed.)^(Eds.): ‘Book Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’ (IEEE, 2017, edn.), pp. 877-880 [10] Md Noor, S.S., Ren, J., Marshall, S., and Michael, K.: ‘Hyperspectral image enhancement and mixture deep-learning classification of corneal epithelium injuries’, Sensors, 2017, 17, (11), pp. 2644 [11] Gross, R., Baker, S., Matthews, I., and Kanade, T.: ‘Face recognition across pose and illumination’: ‘Handbook of face recognition’ (Springer, 2005), pp. 193-216 [12] Chen, Z., Liu, C., Chang, F., Han, X., and Wang, K.: ‘Illumination processing in face recognition’, International Journal of Pattern Recognition and Artificial Intelligence, 2014, 28, (05), pp. 1456011 [13] Basilio, J.A.M., Torres, G.A., Pérez, G.S., Medina, L.K.T., and Meana, H.M.P.: ‘Explicit image detection using YCbCr space color model as skin detection’, Applications of Mathematics and Computer Engineering, 2011, pp. 123-128 [14] Karamizadeh, S., and Arabsorkhi, A.: ‘Methods of pornography detection’, in Editor (Ed.)^(Eds.): ‘Book Methods of pornography detection’ (2018, edn.), pp. 33-38 [15] Sufyanu, Z., Mohamad, F.S., Yusuf, A.A., and Mamat, M.B.: ‘Enhanced Face Recognition Using Discrete Cosine Transform’, Engineering Letters, 2016, 24, (1) [16] Liu, Z., Zhao, H., Pu, J., and Wang, H.: ‘Face recognition under varying illumination’, Neural Computing and Applications, 2013, 23, (1), pp. 133-139 [17] Anagha, K., and Ram, A.R.: ‘Pose Tolerant Face Recognition: A Review’, in Editor (Ed.)^(Eds.): ‘Book Pose Tolerant Face Recognition: A Review’ (IEEE, 2020, edn.), pp. 0147-0152 [18] Jin, X., Wang, Y., and Tan, X.: ‘Pornographic Image Recognition via Weighted Multiple Instance Learning’, IEEE transactions on cybernetics, 2018, 49, (12), pp. 4412-4420 [19] Lopes, A.P., de Avila, S.E., Peixoto, A.N., Oliveira, R.S., and Araújo, A.d.A.: ‘A bag-of-features approach based on hue-sift descriptor for nude detection’, in Editor (Ed.)^(Eds.): ‘Book A bag-of-features approach based on hue-sift descriptor for nude detection’ (IEEE, 2009, edn.), pp. 1552-1556 [20] Moustafa, M.: ‘Applying deep learning to classify pornographic images and videos’, arXiv preprint arXiv:1511.08899, 2015 [21] Ding, X., Li, B., Li, Y., Guo, W., Liu, Y., Xiong, W., and Hu, W.: ‘Web Objectionable Video Recognition Based on Deep Multi Instance Learning with Representative Prototypes Selection’, IEEE Transactions on Circuits and Systems for Video Technology, 2020
|
خودکار شدت نور و کاهش پارزیت است. در قسمت پردازش براي نرمالسازی شدت نور از معماری xception استفاده شده است. در ادامه از طبقهبندی پوست استفاده شده تا به تشخیص تصویر کمک کند در اين مرحله از الگوريتم Gaussian-KNN استفاده شده است. به علاوه در این مقاله از 33000 تصاویر اخلاقی و غیر اخلاقی استفاده شده که تصاوير از اینترنت جمع آوری شدهاست. نتایج بدست آمده نشان میدهد كه روش پیشنهادی 3/1 درصد بهتر از روشهای موجود در این حوزه عمل نمودهاست.
بررسی چالشهای تصاویر غیراخلاقی به ویژه تصاوير سوء استفاده از کودکان به عنوان کارهای آینده پیشنهاد میشود؛ میتوان با جمع آوری تصاویر سو استفاده از کودکان و با استفاده از مدل مختلف یادگیری عمیق ویژگیهایی بهتری رو استخراج نمود که باعث بهبود دقت در تشخیص این تصاویر شود.
9- تشکر و قدردانی
این تحقیق به وسيله مرکز تحقیقات مخابرات ایران حمایت شدهاست. این روش به عنوان بخشی از فعالیتهای تحقیقاتی طرح صيانت (فرهنگي – اجتماعي) با بهرهگيري از سامانههاي هوشمند در پژوهشگاه ارتباطات و فناوري اطلاعات طراحی و پیادهسازی شدهاست.
Generations’ (Springer, 2016), pp. 1041-1050 4.Nian, F., Li, T., Wang, Y., Xu, M., and Wu, J.: ‘Pornographic image detection utilizing deep convolutional neural networks’, Neurocomputing, 2016, 210, pp. 283-293 5.Karamizadeh, S., Abdullah, S.M., Zamani, M., Shayan, J., and Nooralishahi, P.: ‘Face recognition via taxonomy of illumination normalization’: ‘Multimedia Forensics and Security’ (Springer, 2017), pp. 139-160 6.Brancati, N., De Pietro, G., Frucci, M., and Gallo, L.: ‘Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’, in Editor (Ed.)^(Eds.): ‘Book Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’ (Springer, 2016, edn.), pp. 27-35 [7] Karamizadeha, S., Mabdullahb, S., Randjbaranc, E., and Rajabid, M.J.: ‘A review on techniques of illumination in face recognition’, Technology, 2015, 3, (02), pp. 79-83 [8] Surinta, O., and Khamket, T.: ‘Recognizing pornographic images using deep convolutional neural networks’, in Editor (Ed.)^(Eds.): ‘Book Recognizing pornographic images using deep convolutional neural networks’ (IEEE, 2019, edn.), pp. 150-154
|
Clustering for Skin Detection Under Different Lighting Conditions’, in Editor (Ed.)^(Eds.): ‘Book Dynamic Colour Clustering for Skin Detection Under Different Lighting Conditions’ (Springer, 2016, edn.), pp. 27-35
7.Karamizadeha, S., Mabdullahb, S., Randjbaranc, E., and Rajabid, M.J.: ‘A review on techniques of illumination in face recognition’, Technology, 2015, 3, (02), pp. 79-83
8.Surinta, O., and Khamket, T.: ‘Recognizing pornographic images using deep convolutional neural networks’, in Editor (Ed.)^(Eds.): ‘Book Recognizing pornographic images using deep convolutional neural networks’ (IEEE, 2019, edn.), pp. 150-154
9.Noh, Y., Koo, D., Kang, Y.-M., Park, D., and Lee, D.: ‘Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’, in Editor (Ed.)^(Eds.): ‘Book Automatic crack detection on concrete images using segmentation via fuzzy C-means clustering’ (IEEE, 2017, edn.), pp. 877-880
10.Md Noor, S.S., Ren, J., Marshall, S., and Michael, K.: ‘Hyperspectral image enhancement and mixture deep-learning classification of corneal epithelium injuries’, Sensors, 2017, 17, (11), pp. 2644
11.Gross, R., Baker, S., Matthews, I., and Kanade, T.: ‘Face recognition across pose and illumination’: ‘Handbook of face recognition’ (Springer, 2005), pp. 193-216
12.Chen, Z., Liu, C., Chang, F., Han, X., and Wang, K.: ‘Illumination processing in face recognition’, International Journal of Pattern Recognition and Artificial Intelligence, 2014, 28, (05), pp. 1456011
13.Basilio, J.A.M., Torres, G.A., Pérez, G.S., Medina, L.K.T., and Meana, H.M.P.: ‘Explicit image detection using YCbCr space color model as skin detection’, Applications of Mathematics and Computer Engineering, 2011, pp. 123-128
14.Karamizadeh, S., and Arabsorkhi, A.: ‘Methods of pornography detection’, in Editor (Ed.)^(Eds.): ‘Book Methods of pornography detection’ (2018, edn.), pp. 33-38
15.Sufyanu, Z., Mohamad, F.S., Yusuf, A.A., and Mamat, M.B.: ‘Enhanced Face Recognition Using Discrete Cosine Transform’, Engineering Letters, 2016, 24, (1)
16.Liu, Z., Zhao, H., Pu, J., and Wang, H.: ‘Face recognition under varying illumination’, Neural Computing and Applications, 2013, 23, (1), pp. 133-139
17.Anagha, K., and Ram, A.R.: ‘Pose Tolerant Face Recognition: A Review’, in Editor (Ed.)^(Eds.): ‘Book Pose Tolerant Face Recognition: A Review’ (IEEE, 2020, edn.), pp. 0147-0152
18.Jin, X., Wang, Y., and Tan, X.: ‘Pornographic Image Recognition via Weighted Multiple Instance Learning’, IEEE transactions on cybernetics, 2018, 49, (12), pp. 4412-4420
19.Lopes, A.P., de Avila, S.E., Peixoto, A.N., Oliveira, R.S., and Araújo, A.d.A.: ‘A bag-of-features approach based on hue-sift descriptor for nude detection’, in Editor (Ed.)^(Eds.): ‘Book A bag-of-features approach based on hue-sift descriptor for nude detection’ (IEEE, 2009, edn.), pp. 1552-1556
20.Moustafa, M.: ‘Applying deep learning to classify pornographic images and videos’, arXiv preprint arXiv:1511.08899, 2015
21.Ding, X., Li, B., Li, Y., Guo, W., Liu, Y., Xiong, W., and Hu, W.: ‘Web Objectionable Video Recognition Based on Deep Multi Instance Learning with Representative Prototypes Selection’, IEEE Transactions on Circuits and Systems for Video Technology, 2020
[1] Singular Value Decomposition
[2] Noise reduction
[3] Wiener
[4] mean
[5] Meadin
[6] Illumination Normalization
[7] Multi Scale Retinex
[8] Single Scale Retinex
[9] Difference of Gaussian
[10] Soft-max
[11] fuzzy fully convolutional network
[12] Contrast Limited Adaptive Histogram Equalization
[13] Local edge-based
[14] Morphological
[15] Detection error tradeoff(DET)