بخشبندي تصاوير رنگي بيروني به هدف تشخيص اشياء به كمك هيستوگرام با دقت دوگانه
محورهای موضوعی : عمومىجواد راستي 1 , سید امیرحسن منجمی 2 , عباس وفایی 3
1 - مهندسی پزشکی
2 - اصفهان
3 - دانشگاه اصفهان
کلید واژه: تصاوير بيروني, خوشهبندي, بخشبندي رنگي, دقت تصوير.,
چکیده مقاله :
يكي از مسايل مهم در پردازش خودكار تصاوير بيروني، نحوه بخشبندي اين تصاوير به هدف تشخيص شيء در آنها ميباشد. مشخصات خاص اين تصاوير از جمله تنوع رنگ، اثرات نوري متفاوت، وجود سايههاي رنگي، جزييات بافتي زياد و وجود اشياء كوچك و ناهمگن باعث ميشود مسأله بخشبندي تصاوير بيروني به ويژه بخشبندي رنگي با چالشهاي جدي مواجه شود. در تحقيقات قبليبراي خوشهبندي رنگي تصاوير بيروني به هدف بخشبندي ابتدايي، روشي مبتني بر الگوريتم خوشهبندي k-means در بستري با دقت چندگانه پيشنهاد شده بود.اين روش با استفاده از محو عمدي جزييات بافتي تصوير و حذف كلاسهاي محرز در تصاوير محو شده و سپس اضافه كردن كلاسها در تصاوير با دقت بالاتر، كارايي مناسبي براي بخشبندي ابتدايي اين تصاوير در مقايسه با روش k-means عادي نشان ميداد.در اين مقاله، يك روش تطبيقپذير با تصوير با استفاده از هيستوگرام حلقوي تهرنگ براي تشخيص كلاسهاي محرز در تصاوير محوشده در بستري با دقت دوگانه پيشنهاد گرديده است.كارايي اين الگوريتم به كمك يك روش ارزيابينظارتشده روي دو پايگاه داده از تصاوير بيروني بررسي شده كه حدود 20% كاهش خطاي پيكسلي در بخشبندي و نيز دقت و حدود 30% سرعت بيشتر در همگرايي الگوريتم خوشهبندي، نشانگر كيفيت بالاتر روش پيشنهادي نسبت به روش عادي است.
One of the important issues in the automatic processing of external images is how to divide these images for the purpose of recognizing something in them. The special characteristics of these images, including color diversity, different light effects, the presence of colored shadows, many texture details, and the existence of small and heterogeneous objects, make the problem of segmentation of external images, especially color segmentation, face serious challenges. In previous researches, a method based on the k-means clustering algorithm was proposed in a multi-accuracy bed for color clustering of external images for the purpose of primary segmentation. This method uses deliberate blurring of image textural details and removal of specific classes in blurred images and then added The classification of classes in images with higher accuracy showed a suitable performance for the initial segmentation of these images in comparison with the normal k-means method. In this article, an image-adaptive method using the ring histogram of the dark color to identify specific classes in blurred images in the bed is presented. It has been proposed with double precision. The efficiency of this algorithm has been investigated with the help of a supervised evaluation method on two databases of external images, which shows a 20% reduction in pixel error in segmentation, as well as a 30% higher accuracy and speed in the convergence of the clustering algorithm, indicating a higher quality. The proposed method is better than the normal method.
[1]. W. W. Mayol, "Wearable Visual Robots," Ph.D, Computer Science, University of Oxford, 2004.
[2]. M. Everingham, B. T. Thomas, and T. Troscianko, "Wearable mobility aid for low vision using scene classification in a Markov random field model framework," International Journal of Human Computer Interaction, special issue on mediated reality, vol. 15, pp. 231-244, 2003.
[3]. R. C. González and R. E. Woods, Digital Image Processing: Pearson/Prentice Hall, 2008.
[4]. R. Manduchi, "Learning Outdoor Color Classification," IEEE Transactions on Pattern Analysis and Machine Intelligence, pp. 1713-1723, 2006.
[5]. J. Batlle, A. Casals, J. Freixenet, and J. Martí, "A review on strategies for recognizing natural objects in colour images of outdoor scenes," Image and Vision Computing, vol. 18(6-7), pp. 515-530, 2000.
[6]. Y.-W. Tai, J. Jia, and C.-K. Tang, "Soft Color Segmentation and Its Applications," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 29, pp. 1520-1537, 2007.
[7]. H. D. Cheng, X. H. Jiang, Y. Sun, and J. Wang, "Color Image Segmentation: Advances & Prospects," Pattern Recognition, vol. 34, pp. 2259–2281, 2001.
[8]. H. B. M'hadheb, A. Douik, M. M. Fendri, and M. Annabi, "Reduction of color variability in color image segmentation," in IEEE International Conference on Electronics, Circuits and Systems, 2006.
[9]. I. Ashdown, "Octree color quantization," in Radiosity: A Programmer's Perspective, ed: Wiley New York 1994.
[10] P. Heckbert, "Color image quantization for frame buffer display," SIGGRAPH Comput. Graph., vol. 16, pp. 297-307, 1982.
[11]. S. J. Wan, P. Prusinkiewicz, and S. K. M. Wong, "Variance based color image quantization for frame buffer display," Color Res. Applicat, vol. 15(1), pp. 52-58, 1990.
[12]. P. Scheunders, "A comparison of clustering algorithms applied to color image quantization," Pattern Recognition Letters, vol. 18, pp. 1379-1384, 1997.
[13]. N. Vlajic and H. C. Card, "Vector quantization of images using modified adaptive resonance algorithm for hierarchical clustering," IEEE Transactions on Neural Networks, vol. 12, pp. 1147-1162, 2001.
[14]. B. Fritzke, "A Growing Neural Gas Network Learns Topologies," Advances in Neural Information Processing Systems, 1995.
[15]. A. Baraldi and P. Blonda, "A survey of fuzzy clustering algorithms for pattern recognition. II," IEEE Transactions on Systems, Man, and Cybernetics, Part B, vol. 29, pp. 786-801, 1999.
[16]. G .A.Carpenter , S. Grossberg, N. Markuzon, J. H. Reynolds, and D. B. Rosen, "Fuzzy ARTMAP: A neural network architecture for incremental supervised learning of analog multidimensional maps," IEEE Transactions on Neural Networks and Learning Systems, vol. 3, pp. 698-713, 1992.
[17]. N. Papamarkos, A. E. Atsalakis, and C. P. Strouthopoulos, "Adaptive color reduction," IEEE Transactions on Systems, Man, and Cybernetics, Part B, vol. 32, pp. 44-56, 2002.
[18]. G. Cheng, J. Yang, K. Wang, and X. Wang, "Image Color Reduction Based on Self-Organizing Maps and Growing Self-Organizing Neural Networks," in The Sixth International Conference on Hybrid Intelligent Systems, 2006, p. 24.
[19]. K. Zagoris, N. Papamarkos, and I. Koustoudis, "Color Reduction Using the Combination of the Kohonen Self-Organized Feature Map and the Gustafson-Kessel Fuzzy Algorithm," in The 5th international conference on Machine Learning and Data Mining in Pattern Recognition, Leipzig, Germany, 2007, pp. 703-715.
[20]. A. Atsalakis, N. Papamarkos, and I. Andreadis, "On estimation of the number of image principal colors and color reduction through self-organized neural networks," International Journal of Imaging Systems and Technology, vol. 12, pp. 117-127, 2002.
[21]. J. Rasti, A. Monadjemi, and A. Vafaei, "Color reduction using a multi-stage Kohonen Self-Organizing Map with redundant features," Expert Systems with Applications, vol. 38, pp. 13188-13197, 2011.
[22]. S. Kiranyaz, S. Uhlmann, and M. Gabbouj, "Dominant Color Extraction Based on Dynamic Clustering by Multi-dimensional Particle Swarm Optimization," in The Seventh International Workshop on Content-Based Multimedia Indexing, 2009, pp. 181-188.
[23]. R. O. Duda, P. E. Hart, and D. G. Stork, Pattern classification: Wiley, 2001.
[24]. J. C. Bezdek, Pattern Recognition with Fuzzy Objective Function Algorithms: Kluwer Academic Publishers, 1981.
[25]. M. Y. Choong, W. L. Khong, W. Y. Kow, L. Angeline, and K. T. K. Teo, "Graph-Based Image Segmentation Using K-Means Clustering and Normalised Cuts," in The Fourth International Conference on Computational Intelligence, Communication Systems and Networks, 2012, pp. 307-312.
[26]. Y. C. Hu and M. G. Lee, "K-means-based color palette design scheme with the use of stable flags," Journal of Electronic Imaging, vol. 16, pp. 033003-1 to 033003-11, 2007.
[27]. S. N. Sulaiman and N. A. M. Isa, "Adaptive fuzzy-K-means clustering algorithm for image segmentation," IEEE Transactions on Consumer Electronics, vol. 56, pp. 2661-2668, 2010.
[28]. P. Ng and C.-M. Pun, "Skin Color Segmentation by Texture Feature Extraction and K-mean Clustering," in The Third International Conference on Computational Intelligence, Communication Systems and Networks, 2011, pp. 213-218.
[29]. R. Figueiredo, L. Schnitman, and F. d. Souza, "Using Neural Network and K-means Clustering for Image Segmentation in Outdoor Scenes," in The 2nd International Congress on University-Industry Cooperation, Perugia, Italy, 2007.
[30]. R. Huang, N. Sang, D. Luo, and Q. Tang, "Image Segmentation via Coherent Clustering in Lab Color Space," Pattern Recognition Letters, vol. 32, pp. 891-902, 2011.
[31]. جواد راستي، سيد اميرحسن منجمي و عباس وفايي، «كاهش رنگ تصاوير بيروني به هدف بخشبندي ابتدايي با استفاده از خوشهبندي سلسلهمراتبي با حذف تدريجي در هرم گوسي»، ششمين کنفرانس ماشين بينايي و پردازش تصوير، دانشگاه اصفهان، آبان 1389.
[32]. A. Roy, S. K. Parui, D. Nandi, and U. Roy, "Color image segmentation using a semi-wrapped gaussian mixture model," in The 4th international conference on Pattern recognition and machine intelligence, Moscow, Russia, 2011, pp. 148-153.
[33]. M. Recky and F. Leberl, "Windows Detection Using K-means in CIE-Lab Color Space," in The 20th International Conference on Pattern Recognition, 2010, pp. 356-359.
[34]. S. Haykin, Neural Networks: A Comprehensive Foundation: Prentice Hall PTR, 1994.
[35] H. J. Aantonisse, "Image segmentation in pyramids," Computer Graphics and Image Processing vol. 19, pp. 367–383, 1982.
[36]. R. Marfil, L. Molina-Tanco, A. Bandera, J. A. Rodriguez, and F. Sandoval, "Pyramid segmentation algorithms revisited," Pattern Recognition, vol. 39, pp. 1430-1451, 2006.
[37]. G. Ramella and G. S. Baja, "Color Quantization by Multiresolution Analysis," in The 13th International Conference on Computer Analysis of Images and Patterns, Germany, 2009, pp. 525-532.
[38]. A. Atsalakis and N. Papamarkos, "Color reduction and estimation of the number of dominant colors by using a self-growing and self-organized neural gas," Engineering Applications of Artificial Intelligence, vol. 19, pp. 769-786, 2006.
[39]. S. Makrogiannis, G. Economou, and S. Fotopoulos, "A region dissimilarity relation that combines feature-space and spatial information for color image segmentation," IEEE Transactions on Systems, Man, and Cybernetics, Part B, vol. 35, pp. 44-53, 2005.
[40]. Y. J. Zhang, Advances in Image And Video Segmentation: IRM Press, 2006.
[41]. J. Rasti, A. Monadjemi, and A. Vafaei, "A Graph-Based Vision System for Automatic Object Detection in Outdoor Scenes," in The 22nd International DAAAM Symposium, Vienna, Austria, 2011, pp. 0167-0168.
[42]. A. Bosch, X. Munoz, and J. Freixenet, "Segmentation and description of natural outdoor scenes," Image and Vision Computing, vol. 25, pp. 727-740, 2007.
[43]. H. Zhang, J. E. Fritts, and S. A. Goldman, "A Co-Evaluation Framework for Improving Segmentation Evaluation," in SPIE Defense and Security Symposium - Signal Processing, Sensor Fusion, and Target Recognition XIV, 2005, pp. 420-430.
[44]. A. Alonso-Betanzos, B. Arcay-Varela, and A. Castro-Martínez, "Analysis and evaluation of hard and fuzzy clustering segmentation techniques in burned patient images," Image and Vision Computing, vol. 18, pp. 1045-1054, 2000.
[45]. D. Collins, W. A. Wright, and P. Greenway, "The sowerby image database," presented at the The 7th IEEE International Conference of Image Processing and Its Applications, Manchester, England, 1999.
[46]. X. He, R. S. Zemel, and M. Carreira-Perpi, "Multiscale conditional random fields for image labeling," in IEEE computer society conference on Computer vision and pattern recognition, Washington, D.C., USA, 2004, pp. 695-703.
[47]. A. Likas, M. Vlassis, and J. Verbeek, "The global k-means clustering algorithm," Pattern Recognition vol. 36, pp. 451-461, 2003.
[48]. جواد راستي، «ارائه يك روش بخشبندي مبتني بر الگوريتمهاي هوشمند به منظور تشخيص اشياء در تصاوير بيروني»، پاياننامه دکترا، گروه مهندسي کامپيوتر، دانشگاه اصفهان، 1391.
[49]. F. Y. Shih and S. Cheng, "Automatic seeded region growing for color image segmentation," Image and Vision Computing, vol. 23, pp. 877-886, 2005.
[50]. R. Datta, D. Joshi, J. Li, and J. Z. Wang, "Image retrieval: Ideas, influences, and trends of the new age," ACM Computing Surveys, vol. 40, pp. 1-60
فصلنامه علمي- پژوهشي فناوري اطلاعات و ارتباطات ایران | سال چهارم، شمارههاي 13 و 14، پاییز و زمستان 1391 صص: 37- 56 |
|
بخشبندي تصاوير رنگي بيروني به هدف تشخيص اشياء به كمك هيستوگرام با دقت دوگانه
جواد راستي*1 سيد اميرحسن منجمي** عباس وفایی***
* استادیار، دانشکده مهندسی پزشکی، دانشگاه اصفهان، اصفهان
** دانشیار، دانشکده مهندسی کامپیوتر، دانشگاه اصفهان، اصفهان
*** استادیار، دانشکده مهندسی کامپیوتر، دانشگاه اصفهان، اصفهان
تاريخ دريافت: 20/04/1391 تاريخ پذيرش: 30/11/1391
چکيده
يكي از مسايل مهم در پردازش خودكار تصاوير بيروني، نحوه بخشبندي اين تصاوير به هدف تشخيص شيء در آنها ميباشد. مشخصات خاص اين تصاوير از جمله تنوع رنگ، اثرات نوري متفاوت، وجود سايههاي رنگي، جزييات بافتي زياد و وجود اشياء كوچك و ناهمگن باعث ميشود مسأله بخشبندي تصاوير بيروني به ويژه بخشبندي رنگي با چالشهاي جدي مواجه شود. در تحقيقات قبليبراي خوشهبندي رنگي تصاوير بيروني به هدف بخشبندي ابتدايي، روشي مبتني بر الگوريتم خوشهبندي k-means در بستري با دقت چندگانه پيشنهاد شده بود.اين روش با استفاده از محو عمدي جزييات بافتي تصوير و حذف كلاسهاي محرز در تصاوير محو شده و سپس اضافه كردن كلاسها در تصاوير با دقت بالاتر، كارايي مناسبي براي بخشبندي ابتدايي اين تصاوير در مقايسه با روش k-means عادي نشان ميداد.در اين مقاله، يك روش تطبيقپذير با تصوير با استفاده از هيستوگرام حلقوي تهرنگ براي تشخيص كلاسهاي محرز در تصاوير محوشده در بستري با دقت دوگانه پيشنهاد گرديده است.كارايي اين الگوريتم به كمك يك روش ارزيابينظارتشده روي دو پايگاه داده از تصاوير بيروني بررسي شده كه حدود 20% كاهش خطاي پيكسلي در بخشبندي و نيز دقت و حدود 30% سرعت بيشتر در همگرايي الگوريتم خوشهبندي، نشانگر كيفيت بالاتر روش پيشنهادي نسبت به روش عادي است.
كليد واژگان: تصاوير بيروني، خوشهبندي، بخشبندي رنگي، دقت تصوير.
1. مقدمه
پردازش خودكار تصاوير بيروني يكي از زمينههاي مهم بينايي ماشين است كه از جمله كاربردهاي آن ميتوان به ساخت روباتهاي هوشمند براي ايفاي نقش در محيطهاي خارجي [1] و طراحي كامپيوترهاي پوشيدني[2]اشاره كرد. بخشبندي يكي از مهمترين گامهاي ابتدايي پردازش خودكار تصاوير است كه موفقيت در تحليل تصوير تا حد زيادي به آن وابسته است [3]. بخشبندي، تصوير را به اجزاء سازنده آن تقسيم ميكند تا به كمك روندهاي تشخيص شيء بتوان اين اجزاء را شناسايي نمود. اين تشخيص در زمينههاي زيادي از بينايي ماشين مانند تحليل صحنه و رديابي اشياء كاربرد خواهد داشت.
مشخصات خاص تصاوير بيروني از جمله تغييرات نوري، وجود جزييات بافتي زياد و وجود اشياء كوچك و زياد و ناهمگن، باعث ميشود مسأله بخشبندي تصاوير بيروني با چالشهاي جدي مواجه شود[4, 5]. به همين دليل استفاده از رويههاي پيشپردازش كه بتواند ابعاد فضاي اطلاعاتي تصوير را كاهش دهد،براي بخشبندي اين تصاوير معمولاً ضروري است.
رنگ يكي از مهمترين ويژگيهاي هر شكل است كه با تكيه بر آن ميتوان تا حد زيادي به موفقيت بخشبندي اميدوار بود[6, 7]. اما تنوع رنگي تصوير كه در سيستمهاي ديجيتال امروزي به صورت معمول چند ميليون رنگ را دربرميگيرد، مانعي جدي در اين راه به شمار ميرود. يكي از ابزارهاي معمول پيشپردازش براي عمليات بخشبندي استفاده از روشهاي كاهش و دستهبندي رنگهاست. روندهاي كاهش رنگ، تصوير را از يك فضاي اطلاعاتي با ابعاد چند ميليون رنگ به يك فضاي دستهبندي شده محدود با ابعاد چند رنگ مهم تبديل ميكنند. تحليل ماشيني اين فضاي محدود كاري سادهتر و طبعاً كاراتر است كه ميتواند به عنوان گامي ابتدايي در بخشبندي تصوير به كار رود[8].
هدف از كاهش تعداد رنگهاي يك تصوير، تركيب رنگهاي نزديك و ايجاد تصويري جديد با تعدادي محدود رنگ است كه بتواند رنگهايتصوير اصلي (الگوها يا اشياء) را به نمايش درآورد. اين فرآيند ميتواند براي تقسيم تصوير به عناصر اصلي سازندهاش مفيد باشد.
دستهاي از روشهاي كاهش رنگ بر مبناي تقسيم متوالي مكعب سهبعدي RGB عمل ميكنندكه از جمله آنها ميتوان به روشهاي Octree[9]، برش ميانه[10]، و الگوريتمهاي مبتني بر پراش [11] اشاره كرد. دستهي ديگر الگوريتمهاي كاهش رنگ، بر مبناي خوشهبنديرنگها عمل ميكنند[12]. اين الگوريتمها براي پيدا كردن رنگهاي مهم تصوير از روشهاي خوشهبندي مانند كوانتيزاسيون برداري [13]، GNG[14]، FOSART [15]، Fuzzy ART [16]، ACR[17] استفاده ميکنند. شبکههاي عصبي نيز براي خوشهبندي اطلاعات رنگي مورد استفاده قرار ميگيرند. به عنوان مثال، شبکه عصبي خودسامانده کوهونن براي کاهش رنگ محبوبيت فراواني دارد که از جمله پژوهشهاي مرتبط با آن ميتوان از [18-20] نام برد. پيشتر، با افزايش تعداد ويژگيهاي رنگي به صورت افزونه و در نظر گرفتن پيکسلها در فضاهاي رنگي مختلف، در [21] روشي مبتني بر شبکه عصبي خودسامانده پيشنهاد کرديم که به دستهبندي بهتر رنگها ميانجامد.
در روشهاي مزبور، پيكسلهاي تصوير مانند يك بردار با مؤلفههاي ويژگيهاي رنگي (مثلاً درصد مشاركت رنگهاي اصلي قرمز و سبز و آبي در ساخت آن) در نظر گرفته ميشوند كه بايد با هم تركيب شوند و بردارهايي بسازند كه نمايندگان خوبي از رنگهاي تصوير باشند. به بيان ديگر بهكاهش رنگميتوان به عنوان يك تبديل از فضاي برداري وسيع به فضاي برداري محدود نگريست. اين فضاي برداري محدود همان رنگهاي مهم تصوير است كه دستهبندي اشياء تصوير به كمك آنها ميتواند قدم مهمي در بخشبندي ابتدايي تصوير باشد[20, 22].
يكي از راهحلهاي ساده،سريع،و كارا براي مسأله خوشهبندي استفاده از الگوريتمk-means است[23] كه به همراه نسخه فازي آن به نام Fuzzy c-means يا FCM [24]،پركاربردترين الگوريتمهاي خوشهبندي در كاربردهاي صنعتي پردازش تصوير و يادگيري ماشين به شمار ميروند که از جمله پژوهشهاي اخير ميتوان به الگوريتمهاي پيشنهاد شده در [25-28] اشاره کرد.هرچند با استفاده از اين الگوريتم مانند آنچه پيشتر در [21] پيشنهاد کرديم، ميتوان با حفظ كيفيت بصري تصوير، پهناي باند لازم براي انتقال و نيز فضاي مورد نياز براي ذخيرهسازي تصوير را به نحو مطلوبي كاهش داد، اما به لحاظ تنوع رنگ و جزييات بافتي تصاوير بيروني، روش k-means استاندارد (مانند ديگر روشهاي خوشهبندي رنگي) معمولاً كارايي مناسبي در كاهش رنگ اين تصاوير به هدف بخشبندي ابتدايي (كه در آن شكل كلي اشياء اهميت بيشتري دارد) از خود نشان نميدهدو عموماً منجر به بخشبندي نادرست ميشود[29, 30]. به منظور بهبود روش k-means براي بخشبندي رنگي تصاوير بيروني، در [31]روشي مبتني بر خوشهبندي سلسلهمراتبي با حذف تدريجي خوشهها با استفاده از هرم گوسي با دقت چندگانه پيشنهاد كرديم كه در مقايسه با روش k-means عادي، كارايي بهتري در بخشبندي تصاوير بيروني و ايجاد شكل كلي اشياء از خود نشان ميداد. در اين مقاله، روش فوق به صورت تطبيقپذير با تصوير گسترش داده ميشود تا به كمك تجمع آماري رنگهاي تصوير كه از روي هيستوگرام توزيع رنگ به دست ميآيند، بتواند نسبت به شرايط نوري و بافتي متنوع تصاوير بيروني مقاوم باشد. كارايي اين الگوريتم نسبت به روش k-means استاندارد و نسخه بهبود يافته آن، به كمك يك روش ارزيابي نظارتشده روي دو مجموعه تصوير استاندارد در بستري با دقت دوگانه بررسي خواهد شد.
در بخش 2 به معرفي روش k-means و عملكرد آن در كاهش رنگ تصاوير بيروني خواهيم پرداخت. بخش 3 اين تحقيق به تشريح الگوريتم k-means بهبود يافته و نسخه گسترش يافته آن اختصاص دارد. روش و نتايج ارزيابي الگوريتم در بخش 4، تحليل نتايج در بخش 5 و جمعبندي نهايي و پيشنهادهايي براي بهبود روش مورد تحقيق در بخش 6 آورده شده است.
2. روش k-means براي كاهش رنگ
روش k-means استاندارد، يك الگوريتم خوشهبندي است كه ميتواند براي دستهبندي رنگهاي يك تصوير به كار رود. اگر هر پيكسل تصوير رنگي را برداريمتشكل از ويژگيهاي رنگيآن پيكسل در نظر بگيريم، روش k-means بايد اين بردارهاي رنگي را از رويشباهتشان به هم به kخوشه تقسيم كند. هرچند سادهترين ويژگيهاي رنگي مورد استفاده، ويژگيهاي فضاي RGB يا مانند [32] ويژگيهاي فضايHSV است، اما تحقيقات انجام شده در[33] نشان ميدهد فضاي رنگي CIE-Lab به لحاظ ادراكي بودن، بيشترين بازده را در مسأله خوشهبندي رنگي دارد. بهعلاوه چون فاصله اقليدسي دو رنگ در اين فضا متناسب با تفاوت بصري آنهاست، خوشهبندي رنگي با تكيه بر فاصله اقليدسي در اين فضا كاراتر ميشود. به همين لحاظ در اين تحقيق از ويژگيهاي رنگي پيكسلها درفضاي CIE-Labاستفاده شده است.
الگوريتم k-means براي خوشهبندي فوق به شرح زير است:
1) در آغاز k پيكسل تصادفي از تصويربه عنوان نمايندگان ابتداييkخوشه رنگي (در فضاي CIE-Lab) انتخاب ميشوند كه بايد در ادامه اصلاح شوند.
2) يكي از پيكسلهاي تصوير به صورت تصادفي انتخاب و به بردارهاي نماينده عرضه ميشود. شباهت بردار ورودي با هركدام از بردارهاي نماينده كه بيشتر باشد، بردار ورودي جذب آن شده و در عين حال آن بردار نماينده را به خود شبيه ميكند. براي اين هدف، مقدار جديد بردار نماينده «برنده» برابر ميانگين مقدار قبلي و بردار ورودي جذب شده خواهد بود (رابطه 1). معيار شباهت ميتواند فاصله اقليدسي، حاصلضرب داخلي، يا معيارهاي ديگر باشد.
(1) (پيكسل جديد ، بردار نماينده قديم)ƒ = بردار نماينده جديد
كه تابع ƒ در الگوريتم k-means تابع ميانگين ميباشد.
3) گام 2 با ارائه بقيه پيكسلهاي تصوير به بردارهاي نماينده و تكرار اين روند تا جايي ادامه مييابد كه بردارهاي نماينده در جاي صحيح خود قرار گيرند. معيار اين صحّت، كمينه شدن حاصلجمع خطاها، S، در رابطه 2 است:
S = Σi=all clustersΣj=all pixels in the i-th cluster d(ci,pj)(2)
كه در آن d(ci,pj) فاصله اقليدسي مركز خوشه iام تا پيكسل jام آن خوشه است.
انتساب بردارهاي ورودي براي تصحيح مقادير بردارهاي نماينده حتماً بايد تصادفي باشد؛ در غير اين صورت بردارهاي نماينده در فضاي برداري به خوبي پخش نخواهند شد و مشكل فراموشي پيش خواهد آمد[34].
4) پس از پايان فرآيند آموزش، بردارهاي نماينده در محل صحيح خود قرار گرفتهاند. اكنون با ارائه پيكسلهاي تصوير به اين بردارها و نظير كردن هر پيكسل به شبيهترين بردار نماينده، ميتوان به خوشهبندي صحيحي رسيد.
روش فوق به عنوان يكي از متداولترين شيوههاي خوشهبندي و كاهش رنگ تصاوير به كار ميرود؛ اما همانطور كه در بخش ارزيابي نتايج نشان داده خواهد شد، روش k-means استاندارد كارايي مناسبي در كاهش رنگ اين تصاوير به هدف بخشبندي ابتدايي از خود نشان نميدهد[29][30]. شكل 1 اين مطلب را به خوبي نشان ميدهد.
شكل 1 – تصوير اصلي (راست) و تصوير كاهش رنگ داده شده به كمك الگوريتم k-means (چپ)
همانطور كه مشاهده ميشود، الگوريتم k-meansميتواند رنگهاي تصوير را با حفظ كيفيت بصري تركيب كند. اما تصوير حاصل از آن براي بخشبندي به هدف تشخيص شيء مناسب نيست. مثلاً در شكل بالا ديده ميشود كه آسمان و چمن با وجود اينكه يك شيء واحد هستند، به دليل وجود جزييات بافتي و سايههاي رنگي مختلف، به چند بخش مختلف كماهميت تقسيم شدهاند. به علاوه، بعضي اشياء كوچك به اشتباه با كلاسهاي بزرگتر تركيب شدهاند؛ مثلاً برج وسط تصوير با جاده يا ساختمانهاي بالا سمت چپ با سبزه و شاخ و برگ درختان تلفيق شدهاند.
اهمّ دلايل عدم كارايي الگوريتم k-means استاندارد براي بخشبندي به هدف تشخيص اشياء در تصاوير بيروني به شرح زير است:
جزييات بافتي،تعداد زيادي بخش كوچك و جدا از هم توليد ميكند كه براي روندهاي تشخيص اشياء مشكلساز ميباشند (چمن در شكل 1).
تعدادي از اشياء كوچك در بخشهاي بزرگتر ادغام ميشوند (برج وسط تصوير در شكل 1)
سايههاي رنگي متعلق به يك شيء تعدادي بخش بيمورد توليد ميكنند (چمن و آسمان در شكل 1).
جزييات بافتي زياد و نيز اشياء كوچك و ناهمگن در تصاوير بيروني باعث ايجاد نويز زيادي ميشوند كه سرعت و نيز دقت همگرايي را كاهش ميدهد و يك خطاي مانا در رابطه (2) ايجاد ميكند.
شكل 2 يك نماي دوبعدي از مشكلات الگوريتم k-meansدر بخشبندي را نشان ميدهد.
|
|
الف) يك فضاي دوبعدي نوعي | ب) خوشهبندي ايدهآل |
|
|
ج) خوشهبندي به كمك الگوريتم k-means عادي | د) خوشهبندي به كمك الگوريتم پيشنهادي |
شكل 2) كارايي الگوريتم k-means در خوشهبندي
در شكل 2-الف تعدادي نقطه را در يك فضاي دوبعدي ميبينيد كه بايد دستهبندي شوند. يك خوشهبندي ايدهآل بايد اين نقاط را به شش دسته (سه دسته بزرگتر و سه دسته كوچكتر) تقسيم كند (شكل 2-ب). اما تعداد زياد نقاط در دستههاي بزرگتر سبب ميشود تمركز الگوريتم خوشهبندي k-means بر اين دستهها بيشتر شود. در نتيجه همانطور كه در شكل 2-ج ديده ميشود، خوشههاي بزرگتر به چند دسته كوچكتر تقسيم ميشوند و خوشههاي كوچكتر ناديده گرفته ميشوند. شكل 2-د خوشهبندي به كمك الگوريتمي كه در بخش بعد تشريح ميشود را نشان ميدهد.
3. بهبود الگوريتم k-means به كمك هرم تصاوير چند دقتي
حتماً تاكنون صحنهاي را كه شخصي كه تازه به هوش ميآيد در مقابل خود مشاهده ميكند، ديدهايد؛ اشياء ابتدا كاملاً محو هستند و تنها رنگ چند شيء اصلي مشخص است. رفتهرفته اشياء مشخصتر ميشوند و حتي اشياء جديد كه قبلاً ديده نميشدهاند اضافه ميشوند. اين موضوع ميتواند براي بخشبندي ابتدايي تصاوير بيروني يك ايده مناسب باشد؛ چون چشم انسان نيز در وهله اول براي تشخيص اشياء مختلف به رنگ آنها بيشتر از جزييات بافتي توجه ميكند.
اگر يك فيلتر ملايمكننده (مانند فيلتر ميانگير يا گوسي) را پيدرپي روي يك تصوير اعمال كنيم، تعدادي تصوير محوشده با دقتهاي متفاوت به دست ميآيند. اين تصاوير در بسياري از كاربردهاي پردازش تصوير از جمله بخشبندي و دستهبندي تصاوير مفيد هستند[35-37]. چون با هربار اعمال فيلتر ملايمكننده روي تصوير، حجم اطلاعات کمتر ميشود، ميتوان با کاهش ترکيبي نمونهها اندازه تصوير را نيز کاهش داد. بنابراين مجموعه تصاوير چنددقتي ميتوانند يك هرم تشكيل دهند كه تصوير اصلي در قاعده آن و تصاوير محوتر (و البته كوچكتر) در طبقات بالاتر قرار ميگيرند. شكل 3 يك هرم تصاوير چنددقتي را نشان ميدهد.
اولين كاربرد هرم تصاوير چنددقتي در بخشبندي تصاوير به كمك ايجاد پيوندهايي بين پيكسلهاي نظير در طبقات مختلف هرم در [35] مطرح شد. در سالهاي اخير بخشبندي تصاوير با استفاده از ويژگيهايي كه از طبقات مختلف اين هرم استخراج ميشوند، موضوع تحقيقات زيادي بوده است كه نمونههايي از آنها در [36] فهرست شدهاند. همچنين در [37] روشي براي خوشهبندي رنگي بر اساس تحليل قلههاي هيستوگرام در طبقات مختلف هرم فوق مطرح شده است.
شكل 3) هرم تصاوير چنددقتي براي يك تصوير بيروني
3.1. الگوريتم بهبوديافته
در طبقات بالاي هرم چنددقتي، جزييات بافتي و اشياء كوچك محو شده و رنگ مهمترين ويژگي شيء براي بخشبندي خواهد بود.به علاوه سايههاي مربوط به يك رنگ تا حد زيادي با هم تركيب ميشوند. اين دو ويژگي يك بستر مناسب براي كاهش رنگ تصاوير بيروني را فراهم ميكند. در[31]براي ايجاد تصاوير 6 رنگ و 9 رنگ يك روشكاهش رنگ بر اساس الگوريتم k-meansپيشنهاد كرديم كه در هر طبقه هرم تصاوير چنددقتي به كمك خوشهبندي رنگي اشياء مهم را تشخيص داده و در طبقه زيرينآنها را حذف ميكند تا بخشبندي در ادامه فقط روي اشياء باقيمانده متمركز شود. استفاده از اين روش نسبت به خوشهبندي كامل و يكمرحلهاي تصوير در طبقات مختلف هرم فوق كارايي بهتري از خود نشان داده است؛ چون از تأثير خوشههاي بزرگ در خوشهبندي رنگي در طبقات پايين هرم جلوگيري ميكند.
مراحلاين روش (كه از اين پس الگوريتم حذف تدريجي ناميده ميشود) براي ايجاد يك تصوير 6 رنگ به كمك دو طبقه از هرم چنددقتي به شرح ذيل ميباشد:
1) يك فيلتر ملايمكننده 3×3 ميانگيررا 5 بار و 10 بار روي تصوير اصلي اعمال ميكنيم تا دو نسخه محو شده از تصوير (كه به ترتيب B1 وB2 ناميده ميشوند) به دست آيند.شكل 4 اين تصاوير محو شده را نشان ميدهد.
|
|
|
الف | ب | ج |
شكل 4- الف) تصوير اصلي ب) تصوير B1 ج) تصوير B2
اين كار باعث ميشود تا نقاط مزاحم، اشياء بسيار كوچك و به ويژه جزييات بافتي كه در تصاوير بيروني بسيار ديده ميشود و كار بخشبندي را با مشكل مواجه ميكند از بين بروند و با تركيب سايههاي رنگي مشابه، تنها دستههاي رنگي مهم باقي بمانند.
2) به كمك روش k-means تصوير B2 (محوترين نسخه تصوير) را به سه خوشه رنگي تقسيم ميكنيم. شكل 5-الف يك تصوير بيروني و شكل 5-ب، نسخه سهرنگي آن را نشان ميدهد.اين سه خوشه از رنگهاي بسيار مهم تصوير با چگالي پيكسلي بالا هستند. نكته مهمي كه بايد در اينجا مورد توجه قرار بگيرد اين است كه تعدادي از پيكسلهاي تصوير واقعاً به اين سه كلاس شباهت دارند و در خوشه رنگي آنها قرار ميگيرند؛ اما نقاطي ديگر هم در تصوير وجود دارند كه مربوط به اشياء ديگر هستند و رنگهاي آنها شباهتي به اين سه خوشه رنگي ندارد؛ اما به ناچار در اين خوشهها قرار گرفتهاند. در گام بعدي اين نقاط به صورت مجزا خوشهبندي خواهند شد. مقايسه شكلهاي 5-ب و5-ج نشان ميدهد حتي اين كاهش رنگ سهخوشهاي به كمك تصاوير محوشده، به خاطر حذف جزييات بافتي از ديد بخشبندي بهتر از كاهش رنگ در فضاي معمولي عمل ميكند (هرچند كيفيت بصري پايينتري دارد).
3) اكنون فاصله اقليدسي نقاط تصوير B1(نسخه واضحتر تصوير) را تا سه نماينده به دست آمده از مرحله قبل محاسبه ميكنيم. نقاطي كه فاصله اقليدسيشان از هر سه نماينده بيش از حد آستانه th1 باشد، در هيچكدام از خوشههاي رنگي جا نميگيرند و بايد مجدداً خوشهبندي شوند. روش تعيين حد آستانه مزبور را در ادامه خواهيم ديد.اين نقاط را (كه نقاط يتيم ناميده ميشوند) در شكل 5-د ميبينيد (قسمت سفيدرنگ اين تصوير حاوي پيكسلهاي غيريتيم است كه در خوشهبندي مرحله اول نمايندگان مناسب خود را يافتهاند).
4) اكنون به روشي مشابه گام 2، نقاط يتيم را به سه خوشه جديد تقسيم ميكنيم تا مجموعاً شش خوشه رنگي در تصوير به دست آوريم.تصوير 6 كلاسه كه به اين روش به دست آمده (شكل 5-هـ) براي بخشبندي مناسب است؛ به ويژه وقتي آن را با زماني مقايسه كنيم كه از ابتدا تصوير را به 6 كلاس تقسيم كرده باشيم (شكل 5-و). براي مقايسه بهتر از يك جعبه رنگ متفاوت و درخشان استفاده شده است.
|
|
|
الف | ب | ج |
|
|
|
د | هـ | و |
شكل 5) الف) تصوير اصلي ب) تصوير B2 سهرنگي شده ج) تصوير اصلي سهرنگي شده د) نقاطي كه در 3 خوشه رنگي جا نگرفتهاند هـ) تصوير شش رنگ به كمك k-means در هرم تصاوير چنددقتي و) تصوير شش رنگ به كمك k-means عادي
اين كيفيت بهتر ناشي از اين است كه در مرحله مياني، سه خوشهاي كه از مرحله اول به دست آمدهاند حذف ميشوند و در مرحله آخر سه خوشه جديد فقط با تمركز بر بقيه تصوير به دست ميآيند؛ در حالي كه وقتي از ابتدا تصوير را به 6 خوشه تقسيم كنيم، نقش خوشههايي با چگالي بالا پررنگتر ميشود.به بيان ديگر، اين روش با حذف خوشههاي رنگي مهم كه از طبقه بالاتر به دست آمدهاند، از نسخه واضحتر تصوير براي يافتن اشياء جديد استفاده ميكند و با جلوگيري از تمركز خوشههاي رنگي در رنگهاي مهم با چگالي پيكسلي بالا، به خوشههاي رنگي كوچكتر (اشياء كوچكتر) ميدان بروز ميدهد (شكل 2 را مجدداً ببينيد).
|
|
الف | ب |
|
|
ج | د |
شكل 6- الف) تصوير اصلي ب) تصوير 3 رنگ شده ج) تصوير 6 رنگ شده با روش حذف تدريجي د) تصوير 6 رنگ شده با k-meansعادي
شكل 6 اثر اجراي اين الگوريتم روي تصويري ديگر را نشان ميدهد.
3.2. تعيين تطبيقي تعداد خوشهها
همانطور که پیشتر اشاره شد، هدف از بهکارگيري خوشهبندي در اين تحقيق، ايجاد پيشالگوهاي مناسب براي بخشبندي و تشخيص اشياء در تصاوير بيروني است. يکي از مسايل مهم در خوشهبندي رنگي، تشخيص تعداد صحيح رنگهای تصوير است[20, 38]. ايجاد پيشالگوهاي زياد (در نظر گرفتن تعداد زياد رنگ نهايي در فرآيند کاهش رنگ مانند آنچه در[39]پيشنهاد شده است) ميتواند باعث سنگين شدن فرآيند بخشبندي و نهايتاً منجر به فرابخشبندي شود. از سوي ديگر تعداد کم پيشالگوها هم باعث از دست رفتن تعدادي از بخشها و بخشبندي نادرست خواهد شد[40]. در اين تحقيق، مطابق با آنچه در[41]پيشنهاد کرديم، براي تخمين تعداد خوشههاي رنگي مهم در هر مرحله خوشهبندي به صورت زير عمل ميکنيم:
1) به کمک الگوريتم تقسيم تطبيقي مکعب RGB تعدادي تجمع پيکسلي در فضاي رنگي مييابيم؛ به گونهاي که اين تعداد، از تعداد رنگي که معمولاً در يک تصوير بيروني يافته ميشود بيشتر باشد.
2) يک گراف وزندار کاملاً متصل که هر گره آن، ويژگي رنگي ميانگين در يک خوشه در فضاي رنگي CIE-Lab و وزن هر يال آن فاصله اقليدسي بين رنگ دو گره دو سر آن (که در فضاي مزبور متناظر با تفاوت بصري آنها است) باشد، ايجاد ميکنيم.
3) يالي که کمترين وزن را دارد، کمترين فاصله اقليدسي (معادل با کمترين تفاوت بصري) موجود بين دو رنگ را نشان ميدهد. اگر وزن اين يال از يک حد آستانه کمتر باشد، نشان ميدهد که گرههاي (رنگهاي) دو سر اين يال به دليل تشابه رنگي زياد نامزد ترکيب شدن با يکديگر هستند. بنابراين دو رنگ مزبور را با هم ترکيب کرده و يک رنگ ايجاد ميکنيم؛ به علاوه در ساختار گراف، دو گره معادل اين دو رنگ را ترکيب کرده و رنگ ميانگين را به عنوان ويژگي رنگي گره جديد ثبت کرده و وزن يالهايي که به يکي از دو گره قبلي مرتبط بودهاند را بهروز ميکنيم. به کمک ايده هرس گراف که در[41] نمونهاي از آن را مطرح کرديم، اين کار را تا جايي ادامه ميدهيم که کمترين وزن يال موجود در گراف (کمترين تفاوت بصري بين دو خوشه رنگي) از يک حد آستانه بيشتر شود (يعني دو رنگ خيلي شبيه به هم نداشته باشيم). تعداد گرههاي باقيمانده نشاندهنده تعداد خوشههاي رنگي مهم تصوير هستند.
حد آستانه را درصدي از فاصله اقليدسي بيشينه در فضاي رنگي CIE-Lab در نظر ميگيريم. هرچه اين درصد بالاتر باشد، به رنگها بيشتر اجازه ترکيب شدن داده ميشود؛ يعني تعداد خوشههاي رنگي در هر مرحله کمتر ميشود و پيشالگوهاي کليتري خواهيم داشت. براي دستيابي به بخشبندي جزييتر، بايد اين درصد کمتر شود. در اين تحقيق بهترين پاسخها با 5% ديده شده است. اين تعداد خوشهها به الگوريتم خوشهبندي با حذف تدريجي داده ميشوند تا خوشههاي مناسب پيشالگوهاي بخشبندي را ايجاد کند.
3.3. تعيين سطوح آستانه شباهت
همانطور كه پيشتر گفته شد، در روش حذف تدريجي در مرحله اول تصوير به سه رنگ اصلي خوشهبندي ميشود و در مرحله دوم، نقاطي كه به نمايندگان سه رنگ اصلي شبيه نيستند (پيكسلهاي يتيم)، مجدداً خوشهبندي ميشوند. معيار خوشهبندي مجدد يك پيكسل اين است كه فاصله اقليدسي آن پيكسل تا نماينده دستهاش از سطح آستانه th1بيشتر باشد.شكل 7 نمودار هيستوگرام تعداد پيكسلها برحسب فاصله تا نماينده دسته در يك خوشه نوعي را نشان ميدهد.
شكل 7- نمودار تعداد پيكسلها برحسب فاصله اقليدسي تا نماينده دسته در يك خوشه نوعي
همانطور كه در اين شكل ميبينيد، نمودار دو قلهاي است؛ قله اول مربوط به تجمع پيكسلهايي است كه به نماينده دسته شبيه هستند و قله دوم، پيكسلهايي را نشان ميدهد كه به نماينده خوشه شبيه نيستند (احتمالاً مربوط به يك شيء جديد). بديهي است آستانه th1 بايد جايي بين اين دو قله باشد.
تعيين صحيح حد آستانه شباهت، يك عامل تعيينكننده در كيفيت الگوريتم فوق است. به همين لحاظ روشي بايد تدوين شود كه اين حد آستانه را از روي مشخصات آماري تصوير به صورتي تعيين كند كه در مقابل تغييرات ويژگيهاي خاص تصاوير بيروني از جمله تغييرات بافتي و رنگي و نوري مقاوم باشد.
3.3.1. سطح آستانه ثابت
ميتوان سطح آستانه شباهت هر خوشه را مانند روشي كه در[31]پيشنهاد دادهايم، يك مقدار ثابت (مثلاً 90% بيشينه فاصله اقليدسيبين پيكسلهاي آن خوشه با مركز آن) در نظر گرفت؛ رابطه 3جزييات اين روش را نشان ميدهد:
thi= Max(di) × 90% (3)
thi سطح آستانه خوشه iام و di مجموعه فاصله اقليدسي پيكسلهاي خوشه iام با مركز آن است.
اين روش در بسياري از موارد بهبود خوبي نسبت به روش k-means عادي از نظر دقت بخشبندي ايجاد ميكند؛ اما در بعضي از موارد نيز موفق عمل نميكند؛ دليل اين عدم موفقيت را ميتوان در عدم توجه كافي رابطه 3 به توزيع رنگهاي درون يك خوشه جستجو كرد. به بيان ديگر تعيين يك درصد ثابت براي تمام خوشهها در تمام تصاوير (به ويژه در مورد تصاوير بيروني كه داراي تنوع رنگ و نور هستند) نميتواند انتخاب مناسبي باشد.به عنوان مثال، حتي چند پيكسل محدود كه دور از مركز يك خوشه قرار گرفته باشند (مثلاً در اثر نويز)، باعث زياد شدن سطح آستانه ميشوند. در شكل 8دو خوشه نوعي دوبعدي با سطح آستانه ثابت 50% با هم مقايسه شدهاند:
شكل 8- مقايسه حد آستانه شباهت دو خوشه تقريباً مشابه
در شكل بالا دو خوشه با توزيع تقريباً مشابه را ميبينيد كه حد آستانه شباهت آنها (كه با يك دايره نشان داده شده است) اصولاً بايد شبيه هم باشند؛ اما چند پيكسل دور از مركز در خوشه سمت چپ باعث افزايش قابل ملاحظه سطح آستانه شباهت اين خوشه شده است. هرچند احتمالاً ميتوان براي يك مجموعه ثابت از تصاوير يك سطح آستانه شباهت مناسب از راه سعي و خطا به دست آورد؛ اما اين حد آستانه بهمجموعه ديگري از تصاوير قابل تعميم نيست. به بيان ديگر الگوريتم فوق در برابر تغييرات شرايط نوري و بافتي مقاوم نيست؛ به همين لحاظ بهتر است حد آستانه شباهت هر خوشه با توجه به توزيع آماري رنگها در آن خوشه تعيين شود.
3.3.2. تعيين سطح آستانه به كمك هيستوگرام رنگ
همانطور كه گفته شد، الگوريتم خوشهبندي در مرحله اول تعدادي از رنگهاي تصوير را در يك دسته قرار ميدهد. تعدادي از رنگهاي همدسته واقعاً به هم شبيه هستند (احتمالاً مربوط به يك شيء)؛ اما در هر دسته چند رنگ (چند شيء) وجود دارند كه شباهتي به رنگهاي ديگر آن دسته ندارند و به ناچار در آن دسته قرار گرفتهاند. اين رنگها بايد از اين دسته تفكيك و مجدداً خوشهبندي شوند تا بتوانند اشياء ديگر تصوير را مشخص كنند.مطابق آنچه در [42] پيشنهاد شده است، ميتوان توزيع رنگهاي داخل يك خوشه را (مانند ديگر پديدههاي طبيعي)،توزيع نرمال تجمعي حول رنگ ميانگين آن دسته فرض كرد. شكل 9 نمودار يك توزيع نرمال را نشان ميدهد.
شكل 9- نمودار تجمع دادهها در يك توزيع نرمال
همانطور كه در اين نمودار ديده ميشود، حدود 68% انرژي توزيع نرمال در فاصله «انحراف معيار±ميانگين» و حدود 95% انرژي آن در فاصله «انحراف معيار×2 ± ميانگين» قرار دارد. بنابراين براي به دست آوردن پيكسلهاي يتيم ميتوان حد آستانه شباهت را مثلاً در فاصله اقليدسي2σ(دوبرابر انحراف معيار) از ميانگين خوشه در نظر گرفت. البته براي مسأله مورد نظر ما در اين تحقيق، «ميانگين خوشه رنگي» پارامتر برآورد تجمع رنگها در يك خوشه نيست؛ چون ميتواند توسط رنگهاي دور از مركز دسته تحت تأثير سوء قرار گيرد. شاخص تجمع در اين مسأله «تكرار رنگها» و به عبارت ديگر «مد» توزيع آماري رنگها در يك خوشه است؛ به بيان ديگر رنگهاي كه دور از رنگهاي پرتكرار خوشهشان قرار ميگيرند، بايد به عنوان «يتيم» در نظر گرفته شده و مجدداً خوشهبندي شوند. بنابراين هرچند در مورد توزيع نرمال ميانگين و مد با هم برابرند، اما در ادامه شاخص مد را به عنوان معيار تجمع در نظر ميگيريم.
شكل 10–هيستوگرام تهرنگ (Hue) در سه خوشه رنگي مربوط به شكل 5
توزيع رنگهاي يك تصوير بيروني در خوشههاي رنگي، كمي با توزيع نرمال متفاوت است (هرچند اين توزيعها را نميتوان به توزيعي بهتر از نرمال نظير كرد). شكل 10 نمونه توزيع هيستوگرام تهرنگ (پارامتر H در فضاي رنگي HSV[32]) در سه خوشه شكل 5 را نشان ميدهد. اين هيستوگرامها حالت حلقوي دارند؛ به عبارت ديگر پيكسلهايي كه در انتهاي نمودار (با مقدار 1) قرار دارند، با پيكسلهاي ابتداي نمودار (با مقدار صفر) همرنگ ميباشند. شكل 11 اين موضوع را نشان ميدهد.
0 1
شكل 11– نمودار تغييرات تهرنگ (Hue)
نمودارهاي شكل 10 نشان ميدهند كه توزيع رنگها در يك خوشه رنگي حالت شبهنرمال داشته و نيز در خوشههاي مختلف شكلي متفاوت دارد؛ بنابراين فاصله اقليدسي 2σاز «مد» رنگها در همه تصاوير انتخاب مناسبي نيست. به علاوه گاهي با توزيعهاي نرمال چندقلهاي مواجه هستيم كه تكيه بر مشخصات توزيع نرمال تكقلهاي را ناموجه ميسازد (هيستوگرام خوشه اول در شكل 10 را ببينيد).
براي رفع اين مشكل، در اين تحقيق از شيوهاي ديگر براي تعيين رنگهاي يتيمدر يك خوشه استفاده ميكنيم. مراحل اين روش به شرح ذيل است:
بلندترين قله هيستوگرام رنگ يك خوشه را انتخاب ميكنيم (µ). اين رنگ، پرتكرارترين رنگ در اين خوشه و به عبارتي «مد» اين توزيع آماري است.
از سمت راست µ به سمت انتهاي هيستوگرام حركت ميكنيم تا به رنگي برسيم كه تعداد پيكسلهاي آن كمتر از 5% پيكسلهاي به رنگ µ باشد. اين رنگ را U ميناميم. اگر در اين حركت به انتهاي هيستوگرام برخورديم و هنوز به رنگ U نرسيده باشيم، به دليل حلقوي بودن هيستوگرام تهرنگ «چرخ زده» و جستجو را از ابتداي هيستوگرام پيگيري ميكنيم.
از سمت چپ µ به سمت ابتداي هيستوگرام حركت ميكنيم تا به رنگي برسيم كه تعداد پيكسلهاي آن كمتر از 5% پيكسلهاي به رنگ µ باشد. اين رنگ را L ميناميم. اگر در اين حركت به ابتداي هيستوگرام برخورديم و هنوز به رنگ L نرسيده باشيم، به دليل حلقوي بودن هيستوگرام تهرنگ «چرخ زده» و جستجو را از انتهاي هيستوگرام پيگيري ميكنيم.
به كمك رابطه 4، رنگهايي كه پيكسلهاي آن رنگ يتيم هستند را تعيين ميكنيم:
(4)
شكل 12رنگهاي مزبور(داخل مستطيل قرمز رنگ) در مورد سه خوشه رنگي را نشان ميدهد. پيكسلهايي به اين رنگها يتيم هستند و مجدداً خوشهبندي ميشوند تا رنگهاي جديدي (مربوط به اشياء جديد) را معرفي كنند. توجه كنيد كه در خوشه اول شكل 12 شرط L < U و در خوشههاي دوم وسوم شرط U < L صادق است.
4. ارزيابي روشها
همانطور كه در شكلهاي 5 و 6 ديديم، روش حذف تدريجي از نظر بصري نسبت به روش عادي نتايج مناسبتري براي بخشبندي توليد ميكند. اما ارزيابي بصري نميتواند ملاكي مناسب براي ارزيابي كيفيت يك روش بخشبندي باشد. به همين لحاظ، براي ارزيابي كارايي الگوريتم بهتر است از يك روش كمّي نيز استفاده شود.
روشهاي كمّي ارزيابي الگوريتمهاي بخشبندي به سه دسته عمده تقسيم ميشوند[43]:
الف) روشهاي تحليلي كه بر ويژگيهاي يك الگوريتم بخشبندي مانند پيچيدگي و بهرهوري زماني و نوع پردازش، فارغ از خروجي آن تمركز ميكنند. اين روشها براي مقايسه كارايي الگوريتمهاي بخشبندي در تشخيص شيء چندان مناسب نيستند.
ب) روشهاي تجربي نظارت شده كه كيفيت يك الگوريتم بخشبندي را بر اساس اختلاف خروجي آن با بخشبندي دستي توسط ناظر ميسنجند.
ج) روشهاي تجربي نظارتنشده كه بر اساس پارامترهاي ديد انساني نسبت به كيفيت يك الگوريتم بخشبندي اظهار نظر ميكنند.
بهترين و معمولترين شيوه ارزيابي كمّي الگوريتمهاي بخشبندي كه در اين تحقيق نيز از آن استفاده شده است، روش نظارت شده ميباشد كه بيشترين دقت در ارزيابي الگوريتمها را داراست [43]. بنابراين بايد تعدادي تصوير بيروني را توسط ناظر انساني به 6 رنگ بخشبندي كنيم و سپس تصاوير خوشهبندي شده به كمك روش k-means استاندارد و روشهاي حذف تدريجي پيشنهاد شده را با تصاوير مرجع مقايسه كنيم. هر روشي كه تصوير حاصل از آن اختلاف كمتري در برچسب پيکسلها با تصوير مرجع داشته باشد روش بهتري است.
شكل 12–رنگهاي يتيم در سه خوشه متفاوت (داخل كادر قرمزرنگ)
براي اين كار، يك پايگاه داده به نام UIDSتوسط «گروه پژوهشي پردازش کاربردي تصوير و سيگنال دانشگاه اصفهان» فراهم آورده شده است که شامل 50 تصوير بيروني با اندازههاي 480×640 و 640×640 ميباشد و توسط يك ناظر،بر اساس شباهتهاي رنگي بين پيكسلها بخشبندي شده تا تصاوير مرجع 6 رنگ(كه به اصطلاح استاندارد طلايي يا Ground Truthناميده ميشوند) ايجاد شوند. تصاوير اين پايگاه داده از محيطهاي طبيعي و در شرايط نوري، رنگي و بافتي متنوع و بدون نرماليزه شدن تهيه شده است.نقطه ضعف روش نظارتشده، امكان عدم دقت ناظر يا اعمال سليقه شخصي وي هنگام بخشبندي است؛ براي به حداقل رساندن اين مشكل، تنها رنگهاي اصلي توسط ناظر انتخاب ميشود و يافتن رنگهاي مشابه رنگ اصلي در تصوير (پيكسلهايي كه در يك خوشه رنگي قرار ميگيرند) توسط نرمافزار فوتوشاپ و بدون هيچگونه اعمال نظر از سوي ناظر انجام ميپذيرد. شكل 13 چند نمونه از تصاويري كه به اين روش بخشبندي شدهاند را نشان ميدهد.
شكل 13– تصاوير مرجع ايجاد شده به كمك ناظر انساني و نرمافزار فوتوشاپ
اكنون بايد تصاوير ايجاد شده توسط روش k-means استاندارد و دو روش حذف تدريجي(كه در 3-3-1 و 3-3-2 پيشنهاد شدهاند) را با تصوير مرجع مقايسه كنيم تا مشخص شود كدام روش كيفيت بهتري دارد.
در شكل 14بخشهاي ايجاد شده در تصوير مرجع، تصوير ايجاد شده به كمك روش عادي و تصوير ايجاد شده به كمك روش حذف تدريجي را ميبينيد.بخشهاي مشابه به روشي خودكار و با توجه به بيشينه شباهت بين دو بخش تعيين ميشوند.
براي ارزيابي هر الگوريتم مطابق با روشي كه در[44] پيشنهاد شده به شيوه زير عمل ميكنيم:
الف) تفاضل بين بخشهاي به دست آمده از آن الگوريتم و بخشهاي به دست آمده از تصوير مرجع (تعداد پيكسلهاي مورد اختلاف بين دو بخش متناظر) را مييابيم.
ب) تفاضلهاي فوق (كه تعداد آنها بيانگر ضعف الگوريتم در بخشبندي صحيح است) را به ازاي تمام بخشها با هم جمع ميكنيم.
ج) تعداد پيكسلهايي كه به اشتباه بخشبندي شدهاند را بر تعداد كل پيكسلهاي تصوير تقسيم ميكنيم تا درصد خطاي بخشبندي به دست آيد. بديهي است هرچه اين درصد خطا كمتر باشد، الگوريتم قويتر است.
د) متوسط درصد خطا را به ازاي تمام تصاوير پايگاه داده مورد بررسي به دست ميآوريم. رابطه 5 نحوه محاسبه متوسط خطاي بخشبندي (كه به اختصار ASE ناميده ميشود) را نشان ميدهد.
(5)
در اين رابطه K تعداد تصاوير در پايگاه داده مورد بررسي (در اينجا 53)، M تعداد بخشهاي تصوير مرجع (در اينجا 6)، Ni تعداد پيكسلهاي تصوير iام و تعداد پيكسلهاي به اشتباه بخشبندي شده در بخش jام تصوير iام است.
جدول 1 درصد متوسط خطا در پايگاه داده تهيه شده را در مورد روش k-means عادي و دو نسخه روش حذف تدريجي را نشان ميدهد.
جدول 1 – مقايسه كيفيت روشهاي خوشهبندي براي بخشبندي تصاوير به 6 رنگ
الگوريتم | kmeans عادي | روش حذف تدريجي 1 (بخش 3-3-1) | روش حذف تدريجي 2 (بخش 3-3-2) |
درصد متوسط خطا (ASE) | 21/40% | 82/36% | 16/29% |
|
|
|
|
الف | ب | ج | د |
|
هـ |
|
و |
|
ز |
شكل 14- الف) تصوير اصلي ب) تصوير مرجع ج) تصوير 6 رنگ شده به كمك روش k-means عادي د) تصوير 6 رنگ شده به كمك روش حذف تدريجي هـ) بخشهاي به دست آمده از تصوير مرجع و) بخشهاي به دست آمده از تصوير 6 رنگ شده به روش حذف تدريجي ز) بخشهاي به دست آمده از تصوير 6 رنگ شده به روشk-means عادي
مقادير ذكر شده در جدول 1 نشاندهنده كاهش قابل ملاحظه درصد متوسط خطا به كمك روش حذف تدريجي است.
علاوه بر پايگاه داده ذكر شده، روش مورد بررسي اين تحقيق به كمك پايگاه داده استاندارد Sowerby Image Data-base (SID) كه در [45]معرفي شده نيز مورد ارزيابي قرار گرفت. اين مجموعه شامل 104 تصوير بيروني است كه توسط ناظر انساني بر اساس اشياء موجود در تصاوير به 5 تا 7 بخش تقسيم شدهاند. از اين پايگاه داده براي ارزيابي تحقيقات ديگري از جمله [46] نيز استفاده شده است. جدول 2 كيفيت روشهاي مورد بحث در اين مقاله را در مورد اين پايگاه داده نشان ميدهد.براي آزمايش روش پيشنهادي در يك بستر با دقت دوگانه روي تصويري از اين پايگاه داده كه به N بخش تقسيم شدهباشد، ابتدا تصوير به سه خوشه و سپس پيكسلهاي يتيم به N-3 خوشه تقسيم ميشوند.
جدول 2– مقايسه كيفيت روشهاي خوشهبندي براي بخشبندي تصاوير به كمك پايگاه داده SID
الگوريتم | kmeans عادي | روش حذف تدريجي (بخش 3-2-1) | روش حذف تدريجي (بخش 3-2-2) |
درصد متوسط خطا (ASE) | 12/46% | 8/44% | 7/26% |
همانطور كه در جدول 2 ميبينيد، روش حذف تدريجي با آستانه شباهت ثابت براي پايگاه داده SIDبه كيفيت مناسبي نرسيده است. اين در حال است كه با تغيير درصد حذف پيكسلهاي يتيم در رابطه 3 با سعي و خطا، درصد خطاي كمتري به دست خواهد آمد(مثلاً به ازاي 50% در رابطه 3 به درصد متوسط خطاي 83/24% ميرسيم). مزيت روش پيشنهادي در اين مقاله براي تعيين حد آستانه شباهت، تعيين اين آستانه از روي ويژگيهاي آماري رنگي تصوير است كه آن را نسبت به تغييرات شرايط نوري و رنگي و بافتي تصاوير بيروني مقاوم ميكند و كاربر را از تنظيم الگوريتم به ازاي شرايط مختلف تصاوير بينياز مينمايد.
5. تحليل نتايج
تصاوير به دست آمده نشان ميدهد كيفيت روش پيشنهادي براي بخشبندي ابتدايي تصاوير مناسب است.بهعنوان نمونه، در شكل 15 تصوير بخشبندي شده به كمك روش پيشنهادي بيشتر از تصوير بخشبندي شده به كمك روش عادي، به تصوير مرجع شبيه است.
الف
ب ج د
شكل 15) مقايسه الگوريتمهاي بخشبندي به روش k-means الف) تصوير اصلي ب) تصوير مرجع ج) تصوير حاصل از روش k-meansعادي د) تصوير حاصل از روش حذف تدريجي
يك ويژگي جالب توجه روش پيشنهادي در شكلهاي 5 و 6 ديده ميشود؛ در روش عادي، تعداد پيكسلها روي نمايندهها تأثير ميگذارد. به همين دليل اگر در تصوير چند سايه مربوط به يك رنگ با تعداد پيكسل زياد موجود باشد (مثلاً بخشهاي مختلف آسمان يا چمن)، اين سايهها به عنوان اشياء مختلف در نظر گرفته ميشوند. مثلاً در هر دو شكل 4 و 5 ميبينيد كه آسمان به بيش از يك بخش تقسيم شده است؛ در حالي كه انتظار داريم كل آسمان يك بخش در نظر گرفته شود. اين موضوع نه تنها باعث اشتباه در بخشبندي اشياء بزرگتر ميشود، بلكه به دليل تأثيرپذيري از تعداد پيكسلها، گاهي باعث ميشود اشياء كوچك هم در تصوير بخشبندي شده نهايي حضور نداشته باشند. اين مشكل يكي از نقاط ضعف عمده روش k-meansبراي كاهش رنگ به عنوان پيشگام بخشبندي است؛ به ويژه وقتي تصاوير مورد بررسي از تصاوير بيروني باشند كه از نور محيط تأثير بسيار ميپذيرند و گاه يك شيء واحد را در قالب چند رنگ نزديك به هم نشان ميدهند.
در روش پيشنهادي، در هر مرحله اشيائي كه تعداد پيكسلهاي زياد (و حتي چند سايه رنگي) دارند به عنوان يك شيء واحد درنظر گرفته شده و حذف ميشوند و خوشهبندي مرحله بعد تنها بر پيكسلهاي باقيمانده متمركز ميشود؛ به همين دليل نه تنها سايههاي يك رنگ به عنوان يك شيء واحد در نظر گرفته ميشوند، بلكه بخشهايي كه در روش عادي از بين ميروند (مانند اشياء كوچك)، در روش پيشنهادي خود را نشان ميدهند.
البته اين ويژگي روش پيشنهادي در مواردي باعث بروز خطا نيز ميشود. مثلاً در شكل 16 ميبينيد كه بخشي از ساختمان كه روي آن سايه افتاده است، رنگي نزديك به آسمان دارد. اين موضوع باعث بروز خطا در روش پيشنهادي نسبت به روش عادي شده است.
|
|
|
الف | ب | ج |
شكل 16) الف) تصوير اصلي ب) روش عادي ج) روش پيشنهادي
مزيت ديگر اين روش دقت همگرايي و سرعت بيشتر آن نسبت به روش عادي است. همانگونه كه پيشتر گفته شد، تكرار الگوريتم خوشهبندي k-means تا جايي ادامه مييابد كهحاصلجمع «مجموع فواصل نقاط هر دسته تا نماينده آن دسته»كمينه شود (رابطه 2 را ببينيد). اگر انتخاب مكان اوليه بردارهاي نماينده به درستي صورت نگيرد (كه در انتخاب تصادفي تنها به اقبال شما بستگي دارد)، حاصلجمع فوق يا به كمينهاي همگرا نميشود يا به يك كمينه محلي همگرا خواهد شد كه طبعاً نتيجه مناسبي نخواهد داشت[47]. اين مشكل هنگام زياد بودن تعداد خوشهها، بيشتر بروز ميكند؛ چون تعداد نمايندهها و به تبع آن احتمال واقع شدن تعدادي از نمايندهها در كمينههاي محلي بيشتر ميشود. به همين لحاظ الگوريتمي كه از ابتدا تصوير را به 6 يا 9 رنگ تقسيم كند، در بسياري از مواقع به كمينه عمومي همگرا نخواهد شد (در پايگاه داده ما، در بيش از70% موارد اين مشكل ايجاد ميشود). به علاوه تكرارهاي زياد الگوريتم براي همگرا شدن به يك كمينه عمومي، زمان اجراي آن را بالا ميبرد. در مقابل، روش پيشنهادي در هر مرحله تنها با سه بردار نماينده سروكار دارد؛ به همين لحاظ احتمال درگير شدن با كمينههاي محلي و طولاني شدن زمان همگرايي آن ناچيز خواهد بود.در برآورد زماني کارايي الگوريتم که به کمک کامپيوتري با پردازنده پنتيوم Core i5 با فرکانس 2 گيگاهرتز و RAM چهار گيگابايتي روي پايگاه داده UIDS انجام شد، الگوريتم پيشنهادي در کمتر از 17 دقيقه خوشههاي رنگي مناسب را در تصاوير ايجاد ميکند. اين در حالي است که در روش k-means در کمتر از 30% موارد همگرايي به کمينه عمومي در مرتبه اول اجراي الگوريتم به دست خواهد آمد و با احتساب تکرارهاي لازم براي همگرايي همه تصاوير، اين زمان بيش از 50 دقيقه خواهد بود. البته بايد اذعان داشت که در مواردي که روش k-means به کمينه عمومي همگرا ميشود، سرعت آن از روش پيشنهادي بيشتر است؛ چون ساختار مرحله به مرحله آن را ندارد. اما همانطور که ذکر شد، دقت الگوريتم پيشنهادي در تشخيص رنگهاي صحيح از روش k-means بالاتر است.
نكته ديگري كه بايد در مورد روش پيشنهادي مدنظر قرار گيرد اين است كه اگر سه رنگ ابتدايي (در واقع محل تصادفي اوليه سه بردار نماينده) به اشتباه انتخاب شود، كل الگوريتم با شكست مواجه ميشود. البته اين يك اشكال ذاتي الگوريتم k-means است و در نسخه استاندارد اين روش نيز ديده ميشود.
استفاده از هرم تصاوير چنددقتي باعث بهبود قابل توجهي در نتايج ميشود؛ به گونهاي كه بدون استفاده از طبقات اين هرم خطاي بخشبندي پيكسلي حدود 6% افزايش مييابد. شكل 17 نشان ميدهد با استفاده از هرم فوق، تغييرات نمودار هيستوگرام فاصله پيكسلهاي يك دسته از مركز آن دسته ملايمتر ميشود.به بيان ديگر با استفاده از اين هرم، رنگهاي نزديك با هم تركيب ميشوند و باعث يكنواخت شدن توزيع پيسكلهاي همرنگ در يك دسته ميشوند. اين موضوع به نوبه خود سبب كاهش اشتباه الگوريتم بخشبندي در مواجهه با سايههاي همرنگ و نيز بافتهاي تصاوير بيروني خواهد شد. البته بايد به اين نكته توجه داشت كه با وجود اينكه محو كردن تصاوير با از بين بردن جزييات بافتي و تركيب سايههاي رنگي به بخشبندي كمك ميكند، اما نكته كليدي الگوريتم پيشنهادي، محو كردن تصاوير نيست؛ چون در كنار مزاياي آن، اشياء كوچك در محوسازي از بين ميروند. استفاده از هرم تصاوير چنددقتي باعث بهكارگيري همزمان تصاوير محوشده و تصاوير با وضوح بالا ميشود تا در كنار توجه به اشياء كوچك و جزييات بافتي در موقعيت مناسب، از مزاياي تصاوير محو شده نيز استفاده كند.
شكل 17- مقايسه نمودار هيستوگرام فاصلههاي پيكسلهاي يك دسته تا مركز دسته در هرم تصاوير چنددقتي (تصوير بالا) و بدون استفاده از هرم تصاوير چنددقتي (تصوير پايين)
در پايان بايد به اين نکته توجه داشت که در [48] از آمارگانهاي مرتبه بالاتر نيز براي تشخيص پيکسلها يتيم بهره برديم. اما روش تحليل هيستوگرام که شکل توزيع رنگها در خوشهها را در نظر ميگيرد به مراتب سادهتر و کيفيت آن بالاتر است.
6. نتيجهگيري و پیشنهادات
در اين مقاله، مشكلات الگوريتم k-means براي كاهش رنگ تصاوير بيروني به هدف بخشبندي ابتدايي و تشخيص شيء در آنها بررسي و روشي براي حل اين مشكل پيشنهاد شد. در اين روش كه بر مبناي بستري متشكل از دو دقت متفاوت تصوير عمل ميكند، با حذف تدريجي خوشههاي اشياء مهم در هر طبقه هرم، تمركز روش خوشهبندي بر بقيه اشياء افزايش مييابد. در اين تحقيق، روشي براي تعيين حدود رنگهاي مهم در هر مرحله پيشنهاد شد كه با استفاده از ويژگيهاي آماري خوشههاي رنگي، وابستگي الگوريتم به شرايط تصاوير بيروني را به حداقل ميرساند.كارايي اين الگوريتم به كمك يك روش ارزيابي نظارتشده روي دو پايگاه داده از تصاوير بيروني بررسي شد. نتايج بهدست آمده نشان ميدهد اين روش براي كاهش رنگ تصاوير بيروني به هدف بخشبندي ابتدايي از الگوريتمk-means عادي بهتر عمل ميكند.
با انجام اصلاحاتي روي روش پيشنهادي، ميتوان به كيفيت بهتري دست يافت. مثلاًيكي از اشكالات به كارگيري هرم تصاوير چنددقتي اين است كه با اعمال فيلتر ملايمكننده روي تصوير، لبههاي تصوير تغيير شكل و نيز تغيير رنگ ميدهند كه اين موضوع باعث ميشود لبههاي تصوير به عنوان يك دسته رنگي جديد در نظر گرفته شوند. در شكلهاي 18-الف و 18-ب، يك تصوير بيروني و نسخه محو شده آن و در شكل 18-ج لبههاي تغيير رنگ داده مشاهده ميشوند.
الف ب ج
شكل 18– الف) تصوير اصلي ب) تصوير محو شده ج) لبههاي تغيير رنگ داده شده در اثر محو شدن
براي رفع اين مشكل، ميتوان ابتدا لبههاي تصوير را به دست آورد و از در نظر گرفتن پيكسلهاي نزديك به لبهها به عنوان پيكسل يتيم اجتناب نمود؛ چون احتمالاً اين پيكسلها همرنگ با زمينه هستند و به دليل استفاده از فيلترهاي ملايمكننده تغيير رنگ دادهاند. ميزان نزديكي به لبه در روش بالا ميتواند با توجه به قوت لبه تعيين شود.
براي بهبود دقت بخشهاي ايجاد شده، بعد از به كار بردن روش مزبور يك مرحله ادغام نيز ميتواند انجام بپذيرد تا كلاسهاي ايجاد شده را در صورت لزوم بر حسب شباهتهاي رنگي و بافتي و شكلي و نيز پيوستگي پيكسلها ادغام كند و يا اشيائي كه تعداد پيكسلهاي آنها كم است (اشياء كوچك يا كم اهميت) را حذف كند. ايدههايي براي ادغام در[49] مطرح شده است.
نكته ديگر در مورد درصد استفاده شده در مراحل 2 و 3 الگوريتم پيشنهاد شده در اين تحقيق براي تعيين رنگهايL و U (در اينجا 5%) است. واضح است هرچه اين درصد بزرگتر باشد، تعداد پيكسلهايي كه به مرحله بعد راه مييابند بيشتر خواهد بود و اين موضوع احتمال تقسيم يك شيء واحد به چند بخش (over-segmentation) را افزايش ميدهد؛ اين در حالي است كه اگر درصد فوق خيلي كوچك باشد، رنگهاي كمي به مرحله بعد راه مييابند و احتمال از نظر دور ماندن بخشهاي كوچك (under-segmentation) بيشتر ميشود[40]. حتي اگر درصد فوق خيلي كوچك (مثلاً 1%) باشد، گاهي با بررسي هيستوگرام تهرنگ موفق به يافتن رنگهاي U و L نميشويم. به بيان ديگر، در هيستوگرام تهرنگ نميتوان رنگي يافت كه تعداد پيكسلهاي آن كمتر از 1% پيكسلهاي به رنگ µ باشد. نمونهاي از اين هيستوگرام را در شكل 19 ميبينيد.
شكل 19–يك هيستوگرام تهرنگ «تخت»
چنين مينمايد كه در اين خوشه تمام رنگها وجود دارند! در حالي كه اين طور نيست؛ در چنين خوشهاي پارامترهاي اشباع و روشنايي (S و V در فضاي HSV) مقاديري دارند كه تغيير تهرنگ در رنگهاي آن خوشه تأثيري ندارد و به همين لحاظ در هيستوگرام تهرنگ تمام رنگها ديده ميشوند. مثلاً اگر روشنايي صفر باشد، پارامترهاي H و S هر مقداري داشته باشند تفاوتي ندارد و آن رنگ، سياه ديده ميشود (نوار بالايي شكل 11 را ببينيد). بنابراين اگر هيستوگرام تهرنگ يك خوشه تخت باشد (رنگي كه شرايط رنگهاي U و L را ارضا كند وجود نداشته باشد)، رنگهاي آن خوشه همگي به يك رنگ ديده ميشوند و به همين لحاظ هيچيك از آنها به عنوان رنگ يتيم در نظر گرفته نميشوند. درهرحال تعيين بهينه مقدار درصد مذكور با توجه به شرايط تصوير ميتواند به كيفيت الگوريتم پيشنهادي كمك كند.
نكته ديگر اينكه همزمان با شفافسازي تصوير (عبور به طبقات پاييني هرم تصاوير چنددقتي) ويژگيهاي بافتي خود را بهتر نشان ميدهند كه ميتوان آنها را نيز براي بخشبندي ابتدايي تصوير مورد استفاده قرار داد. در واقع طول بردارهاي مربوط به ويژگيهاي پيكسلها ميتواند با عبور به طبقات پايين هرم تصاوير چنددقتي افزايش يابد و شامل ويژگيهاي بافتي نيز شود.
هرچند در اين مقاله به هدف بخشبندي تصاوير بيروني الگوريتم خوشهبندي k-means سفارشي شد، اما روش پيشنهادي در اين مقاله ميتواند براي بهبود نتايج الگوريتمهاي ديگر خوشهبندي مانند [15, 21]نيز مورد استفاده قرار گيرد.
پس از بخشبندي ابتدايي بايد به كمك تكنيكهاي بازيابي تصاوير، ماهيت بخشها تشخيص داده شود كه بخش تكميلكننده اين تحقيق خواهد بود [42, 50].
از نتايج اين پژوهش ميتوان در بخشبندي و تشخيص صحيح اشياء در تصاوير بيروني و در کاربردهاي مختلفي از جمله طراحي روباتهاي خودکار، کنترل ترافيک، کاربردهاي امنيتي و نيز طراحي كامپيوترهاي پوشيدني براي كمك به افراد نابينا و كمبينا در مسيريابي بيرون منزل و کمک به آنها در مواجهه با چالشهايي نظير عبور از خيابان و چهارراه بهره برد.
مراجع
[1]. W. W. Mayol, "Wearable Visual Robots," Ph.D, Computer Science, University of Oxford, 2004.
[3]. R. C. González and R. E. Woods, Digital Image Processing: Pearson/Prentice Hall, 2008.
[15]. A. Baraldi and P. Blonda, "A survey of fuzzy clustering algorithms for pattern recognition. II," IEEE Transactions on Systems, Man, and Cybernetics, Part B, vol. 29, pp. 786-801, 1999.
[16]. G .A.Carpenter , S. Grossberg, N. Markuzon, J. H. Reynolds, and D. B. Rosen, "Fuzzy ARTMAP: A neural network architecture for incremental supervised learning of analog multidimensional maps," IEEE Transactions on Neural Networks and Learning Systems, vol. 3, pp. 698-713, 1992.
[23]. R. O. Duda, P. E. Hart, and D. G. Stork, Pattern classification: Wiley, 2001.
[31]. جواد راستي، سيد اميرحسن منجمي و عباس وفايي، «كاهش رنگ تصاوير بيروني به هدف بخشبندي ابتدايي با استفاده از خوشهبندي سلسلهمراتبي با حذف تدريجي در هرم گوسي»، ششمين کنفرانس ماشين بينايي و پردازش تصوير، دانشگاه اصفهان، آبان 1389.
[32]. A. Roy, S. K. Parui, D. Nandi, and U. Roy, "Color image segmentation using a semi-wrapped gaussian mixture model," in The 4th international conference on Pattern recognition and machine intelligence, Moscow, Russia, 2011, pp. 148-153.
[34]. S. Haykin, Neural Networks: A Comprehensive Foundation: Prentice Hall PTR, 1994.
[40]. Y. J. Zhang, Advances in Image And Video Segmentation: IRM Press, 2006.
[48]. جواد راستي، «ارائه يك روش بخشبندي مبتني بر الگوريتمهاي هوشمند به منظور تشخيص اشياء در تصاوير بيروني»، پاياننامه دکترا، گروه مهندسي کامپيوتر، دانشگاه اصفهان، 1391.