استخراج مفاهیم کلیدی با استفاده از شبکه قاب و زنجیره مفاهیم
محورهای موضوعی : مهندسی برق و کامپیوترسودابه محمدی 1 , کامبیز بدیع 2
1 - دانشگاه صنعتی کرمانشاه
2 - مرکز تحقیقات مخابرات ایران
کلید واژه: استخراج مفاهیم کلیدی تجزیهگر معنایی زنجیره مفاهیم شبکه قاب,
چکیده مقاله :
طی سالهای اخیر، رویکردهای متنوعی جهت استخراج خودکار کلمات و یا عبارات کلیدی ارائه شده است اما رویکردهای اندکی برای استخراج مفاهیم/ نکات کلیدی به طور خودکار وجود دارد که اغلب آنها نیز مبتنی بر متدهای آماری هستند. استخراج مفاهیم کلیدی فرایند شناسایی عباراتی است که بیانگر مفهوم اصلی متن هستند. در این مقاله رویکرد جدیدی جهت استخراج مفاهیم کلیدی با استفاده از شبکه قاب پیشنهاد شده که مبتنی بر پردازش زبان طبیعی است. در این رویکرد، تجزیه معنایی متن اصلی با استفاده از شبکه قاب صورت میگیرد و زنجیرههای مفاهیم ساخته میشوند. به هر مفهوم بردار امتیازی متشکل از چهار امتیاز که سه تای آنها مبتنی بر زنجیرههای مفاهیم هستند، نسبت داده میشود. در نهایت مفاهیمی که امتیاز آنها بیش از حد آستانه است، به عنوان مفاهیم کلیدی استخراج میشوند. سه حد آستانه متفاوت در این پژوهش مورد استفاده قرار گرفته و در نهایت با یکدیگر مقایسه میشوند. برای ارزیابی سیستم پیشنهادی از خبره استفاده میشود و معیارهای دقت و یادآوری بررسی میشوند. کاربرد مفاهیم کلیدی در مسایلی نظیر شاخصگذاری متون الکترونیکی، ساخت کتابخانههای دیجیتال، خلاصهسازی متون، موتورهای جستجو، خوشهبندی، دستهبندی و ... است.
During last years, many approaches have been presented for the automatic keyword or key phrase extraction. But there are a few approaches for the key concept or key point extraction and they are often based on the statistical methods. The key Concept extraction is a process to identify phrases referring to the concepts of the interests in an unstructured text. In this paper, a new approach has been proposed to the Key Concept Extraction (KCE) by using of FrameNet. This approach is based on the natural language processing methods. The FrameNet is used for shallow semantic parsing of the original texts. Then the concept chains are constructed. For each concept, a score vector with four elements is assigned. Three of them are based on the chains. As the final attempt, a set of concepts is extracted its score are greater than threshold. They contain the most important concept of the main text. The objective and the human-based subjective evaluation have been performed. Precision and recall criteria are investigated. The process of the automatic key concept extraction can be useful in the electronic document indexing, the digital libraries’ building, the categorizing, the text clustering and classifying, the summarizing and the searching.
