-
دسترسی آزاد مقاله
1 - Automatic Construction of Domain Ontology Using Wikipedia and Enhancing it by Google Search Engine
Sedigheh KhalatbariThe foundation of the Semantic Web are ontologies. Ontologies play the main role in the exchange of information and development of the Lexical Web to the Semantic Web. Manual construction of ontologies is time-consuming, expensive, and dependent on the knowledge of doma چکیده کاملThe foundation of the Semantic Web are ontologies. Ontologies play the main role in the exchange of information and development of the Lexical Web to the Semantic Web. Manual construction of ontologies is time-consuming, expensive, and dependent on the knowledge of domain engineers. Also, Ontologies that have been extracted automatically from corpus on the Web might have incomplete information. The main objective of this study is describing a method to improve and expand the information of the ontologies. Therefore, this study first discusses the automatic construction of prototype ontology in animals’ domain from Wikipedia and then a method is presented to improve the built ontology. The proposed method of improving ontology expands ontology concepts through Bootstrapping methods using a set of concepts and relations in initial ontology and with the help of the Google search engine. A confidence measure was considered to choose the best option from the returned results by Google. Finally, the experiments showed the information that was obtained using the proposed method is twice more than the information that was obtained at the stage of automatic construction of ontology from Wikipedia. پرونده مقاله -
دسترسی آزاد مقاله
2 - افزایش سرعت جستجو در مدلهای مبتنی بر مجاورت
جواد پاکسيما عليمحمد زارع بيدكي ولي درهميیکی از اصلیترین چالشهای مدلهای مبتنی بر مجاورت مسأله سرعت بازیابی اطلاعات میباشد. در مدلهای مبتنی بر مجاورت مفهومی به نام فاصله تعریف میشود که برای محاسبه آن باید موقعیت کلمات پرس و جو در سند استخراج شود. این موضوع یعنی استخراج موقعیتها و محاسبه فاصلهها چکیده کاملیکی از اصلیترین چالشهای مدلهای مبتنی بر مجاورت مسأله سرعت بازیابی اطلاعات میباشد. در مدلهای مبتنی بر مجاورت مفهومی به نام فاصله تعریف میشود که برای محاسبه آن باید موقعیت کلمات پرس و جو در سند استخراج شود. این موضوع یعنی استخراج موقعیتها و محاسبه فاصلهها فرایندی زمانبر است و چون غالباً در زمان جستجو اجرا میشود از دید کاربر اهمیت بیشتری دارد. در صورتی که بتوان تعداد اسناد مورد بررسی را کاهش داد بازیابی سریعتر میشود. در این مقاله الگوریتمی به نام 3SNTK برای هرسکردن پویای اسناد در موقع جستجوی عبارت ارائه گردیده است. برای اجتناب از تخصیص بیش از حد حافظه و کاهش ریسک بروز خطا در موقع بازیابی، امتیاز تعدادی از اسناد بدون هیچ گونه هرسی محاسبه میشود (Skip-N). در این الگوریتم از سه هرم حداقل برای استخراج اسناد دارای بالاترین امتیازها استفاده شده و آزمایشها نشان میدهد که استفاده از الگوریتم پیشنهادی باعث بهبود سرعت بازیابی میگردد. پرونده مقاله -
دسترسی آزاد مقاله
3 - ارائه یک موتور جستجو برای بازیابی رویداد ساختارمند از منابع خبری
علیرضا میرزائیان صادق علی اکبریتحلیل محتوای اخبار منتشرشده، یکی از مسایل مهم در حوزه بازیابی اطلاعات است. امروزه تحقیقات زیادی برای تحلیل تکتک مقالات خبری انجام شده است، در حالی که اکثر رویدادهای خبری به شکل چندین مقاله مرتبط به هم به طور مکرر در رسانهها منتشر میشوند. تشخیص رویداد، وظیفه کشف و گر چکیده کاملتحلیل محتوای اخبار منتشرشده، یکی از مسایل مهم در حوزه بازیابی اطلاعات است. امروزه تحقیقات زیادی برای تحلیل تکتک مقالات خبری انجام شده است، در حالی که اکثر رویدادهای خبری به شکل چندین مقاله مرتبط به هم به طور مکرر در رسانهها منتشر میشوند. تشخیص رویداد، وظیفه کشف و گروهبندی اسنادی را دارد که رویدادی یکسان را شرح میدهد و با ارائه یک ساختار قابل درک از گزارشهای خبری، هدایت بهتر کاربران در فضاهای خبری را تسهیل میکند. با رشد سریع و روزافزون اخبار برخط، نیاز به ایجاد موتورهای جستجو برای بازیابی رویدادهای خبری به منظور تسهیل جستجوی کاربران در این فضاهای خبری بیش از پیش احساس میشود. فرض اصلی تشخیص رویداد بر این است که به احتمال زیاد کلمات مرتبط به یک رویداد یکسان در دنیای واقعی، در اسناد و پنجرههای زمانی مشابه ظاهر میشوند. بر همین اساس ما در این تحقیق روشی گذشتهنگر و ویژگیمحور پیشنهاد میکنیم که کلمات را بر اساس ویژگیهای معنایی و زمانی گروهبندی میکند. سپس از این کلمات برای تولید یک بازه زمانی و توصیف متنی قابل درک برای انسان استفاده میکنیم. ارائه یک معماری مناسب و استفاده مؤثر از خوشهبندی جهت بازیابی رویدادها و همچنین تشخیص مناسب زمان رویداد، از نوآوریهای این پژوهش به شمار میروند. روش پیشنهادی روی مجموعه داده AllTheNews که تقریباً شامل دویست هزار مقاله از ۱۵ منبع خبری در سال 2016 میباشد ارزیابی شده و با روشهای دیگر مقایسه گردیده است. ارزیابیها نشان میدهد که روش پیشنهادی در دو معیار دقت و یادآوری نسبت به روشهای پیشین عملکرد بهتری دارد. پرونده مقاله