-
مقاله
1 - افزایش سرعت جستجو در مدلهای مبتنی بر مجاورتفصلنامه مهندسی برق و مهندسی کامپيوتر ايران , شماره 56 , سال 15 , تابستان 1396یکی از اصلیترین چالشهای مدلهای مبتنی بر مجاورت مسأله سرعت بازیابی اطلاعات میباشد. در مدلهای مبتنی بر مجاورت مفهومی به نام فاصله تعریف میشود که برای محاسبه آن باید موقعیت کلمات پرس و جو در سند استخراج شود. این موضوع یعنی استخراج موقعیتها و محاسبه فاصلهها چکیده کاملیکی از اصلیترین چالشهای مدلهای مبتنی بر مجاورت مسأله سرعت بازیابی اطلاعات میباشد. در مدلهای مبتنی بر مجاورت مفهومی به نام فاصله تعریف میشود که برای محاسبه آن باید موقعیت کلمات پرس و جو در سند استخراج شود. این موضوع یعنی استخراج موقعیتها و محاسبه فاصلهها فرایندی زمانبر است و چون غالباً در زمان جستجو اجرا میشود از دید کاربر اهمیت بیشتری دارد. در صورتی که بتوان تعداد اسناد مورد بررسی را کاهش داد بازیابی سریعتر میشود. در این مقاله الگوریتمی به نام 3SNTK برای هرسکردن پویای اسناد در موقع جستجوی عبارت ارائه گردیده است. برای اجتناب از تخصیص بیش از حد حافظه و کاهش ریسک بروز خطا در موقع بازیابی، امتیاز تعدادی از اسناد بدون هیچ گونه هرسی محاسبه میشود (Skip-N). در این الگوریتم از سه هرم حداقل برای استخراج اسناد دارای بالاترین امتیازها استفاده شده و آزمایشها نشان میدهد که استفاده از الگوریتم پیشنهادی باعث بهبود سرعت بازیابی میگردد. پرونده مقاله -
مقاله
2 - تأثیر الگوی موضوعی رفتار جستجوی كاربران نوجوان بر پیشنهاد پرسوجوفصلنامه مهندسی برق و مهندسی کامپيوتر ايران , شماره 62 , سال 16 , بهار 1400کاربران نوجوان هنگام جستجوی موضوعهای مورد نظرشان، دایره لغات محدودی را در فرمولبندی پرسوجو به کار میبرند. مسئله مهم دیگر آن است که کاربران نوجوان غالباً بر روی اقلام اولیه ارائهشده در لیست نتایج جستجو کلیک میکنند. در این پژوهش برای ترمیم و جبران این ویژگیها، پیشن چکیده کاملکاربران نوجوان هنگام جستجوی موضوعهای مورد نظرشان، دایره لغات محدودی را در فرمولبندی پرسوجو به کار میبرند. مسئله مهم دیگر آن است که کاربران نوجوان غالباً بر روی اقلام اولیه ارائهشده در لیست نتایج جستجو کلیک میکنند. در این پژوهش برای ترمیم و جبران این ویژگیها، پیشنهاد میشود که الگوی موضوعی از روی رفتار کاربر نوجوان بر اساس جستجوهای قبلی کشف شوند و با تکیه بر الگوهای یافتشده، پرسوجوی مناسب استخراج و به کاربر نوجوان پیشنهاد گردد. در روش پیشنهادی، الگوهای موضوعی بر اساس ویژگی محبوبیت كلیكها و مرتبطترین موضوعها از روی لاگهای جستجو که عموماً حجیم هستند استخراج میگردند. در ادامه با استفاده از كلاسهبندی دودویی، نزدیکترین پرسوجو به پرسوجوی مورد نظر كاربر نوجوان مشخص میشود. در نتیجه با فیلترنمودن نویز ناوبری موضوعی بر اساس استخراج الگوهای موضوعی کلیکهای کاربران نوجوان یک مدل کاربر با دقت بالاتری برای پیشنهاد پرسوجو حاصل میگردد. روش پیشنهادی با استفاده از ابزارهای Alteryx و weka پیادهسازی و عملکرد آن بر روی لاگ جستجوی AOL که شامل حدود 20 ميليون نمونه تراکنش جستجو مربوط به 650 هزار کاربر میباشد ارزیابی گردید. نتایج آزمایشها نشان میدهند که پرسوجوهای ارائهشده توسط سیستم پیشنهادی به پرسوجوی مورد نظر کاربر نوجوان نزدیکتر است و به تبع آن موجب بهبود دستیابی به نتایج مرتبط میگردد. پرونده مقاله -
مقاله
3 - ارائه سیستم توصیهگر مبتنی بر جلسه شخصیسازی شده با استفاده از شبکههای خودتوجهفصلنامه مهندسی برق و مهندسی کامپيوتر ايران , شماره 98 , سال 20 , پاییز 1401سیستمهای توصیهگر مبتنی بر جلسه بر اساس رفتار و تعاملات کاربر در یک جلسه، رفتار بعدی یا علاقه کاربر را پیشبینی کرده و بر این اساس، آیتمهای مناسب را به کاربر پیشنهاد میدهند. مطالعات اخیر برای ایجاد توصیهها عمدتاً روی اطلاعات جلسه فعلی متمرکز شدهاند و اطلاعات جلسات چکیده کاملسیستمهای توصیهگر مبتنی بر جلسه بر اساس رفتار و تعاملات کاربر در یک جلسه، رفتار بعدی یا علاقه کاربر را پیشبینی کرده و بر این اساس، آیتمهای مناسب را به کاربر پیشنهاد میدهند. مطالعات اخیر برای ایجاد توصیهها عمدتاً روی اطلاعات جلسه فعلی متمرکز شدهاند و اطلاعات جلسات قبلی کاربر را نادیده میگیرند. در این مقاله، یک مدل توصیهگر مبتنی بر جلسه شخصیسازی شده با شبکههای خودتوجه پیشنهاد میشود که علاوه بر جلسه فعلی از جلسات قبلی اخیر کاربر هم استفاده میکند. مدل پیشنهادی به منظور یادگیری وابستگی کلی بین همه آیتمهای جلسه، از شبکههای خودتوجه (SAN) استفاده میکند. ابتدا SAN مبتنی بر جلسات ناشناس آموزش داده میشود و سپس برای هر کاربر، توالیهای جلسه فعلی و جلسات قبلی به صورت جداگانه به شبکه داده میشود و با ترکیب وزنی نتایج رتبهبندی حاصل از هر جلسه، آیتمهای توصیهشده نهایی به دست میآید. مدل پیشنهادی بر روی مجموعه داده واقعی Reddit در دو معیار دقت و میانگین رتبه متقابل، تست و ارزیابی شده است. مقایسه نتایج حاصل از مدل پیشنهادی با رویکردهای قبلی، توانایی و اثربخشی مدل پیشنهادی را در ارائه توصیههای دقیقتر نشان میدهد. پرونده مقاله -
مقاله
4 - درون سازی معنایی واژه ها با استفاده از BERT روی وب فارسیفصلنامه مهندسی برق و مهندسی کامپيوتر ايران , شماره 104 , سال 21 , تابستان 1402استفاده از بافت و ترتیب واژگان در یک عبارت از مواردی است که میتواند به فهم بهتر آن عبارت منجر گردد. در سالهای اخیر، مدلهای زبانی از پیشآموزشیافته، پیشرفت شگرفی در زمینه پردازش زبان طبیعی به وجود آودهاند. در این راستا مدلهای مبتنی بر ترنسفورمر مانند الگوریتم BERT چکیده کاملاستفاده از بافت و ترتیب واژگان در یک عبارت از مواردی است که میتواند به فهم بهتر آن عبارت منجر گردد. در سالهای اخیر، مدلهای زبانی از پیشآموزشیافته، پیشرفت شگرفی در زمینه پردازش زبان طبیعی به وجود آودهاند. در این راستا مدلهای مبتنی بر ترنسفورمر مانند الگوریتم BERT از محبوبیت فزایندهای برخوردار گردیدهاند. این مسئله در زبان فارسی کمتر مورد بررسی قرار گرفته و بهعنوان یک چالش در حوزه وب فارسی مطرح میگردد. بنابراین در این مقاله، درونسازی واژگان فارسی با استفاده از این الگوریتم مورد بررسی قرار میگیرد که به درک معنایی هر واژه بر مبنای بافت متن میپردازد. در رویکرد پیشنهادی، مدل ایجادشده بر روی مجموعه دادگان وب فارسی مورد پیشآموزش قرار میگیرد و پس از طی دو مرحله تنظیم دقیق با معماریهای متفاوت، مدل نهایی تولید میشود. در نهایت ویژگیهای مدل استخراج میگردد و در رتبهبندی اسناد وب فارسی مورد ارزیابی قرار میگیرد. نتایج حاصل از این مدل، بهبود خوبی نسبت به سایر مدلهای مورد بررسی دارد و دقت را نسبت به مدل برت چندزبانه تا حداقل یک درصد افزایش میدهد. همچنین اعمال فرایند تنظیم دقیق با ساختار پیشنهادی بر روی سایر مدلهای موجود توانسته به بهبود مدل و دقت درونسازی بعد از هر فرایند تنظیم دقیق منجر گردد. نتایج رتبهبندی بر مبنای مدلهای نهایی، بیانگر بهبود دقت رتبهبندی وب فارسی نسبت به مدلهای پایه مورد ارزیابی با افزایش حدود 5 درصدی دقت در بهترین حالت است. پرونده مقاله -
مقاله
5 - بهبود رتبهبندی با استفاده از BERTفصلنامه مهندسی برق و مهندسی کامپيوتر ايران , شماره 110 , سال 22 , بهار 1403رتبهبندی کارآمد اسناد در عصر اطلاعات امروز، نقش مهمی در سیستمهای بازیابی اطلاعات ایفا میکند. این مقاله یک رویکرد جدید برای رتبهبندی اسناد با استفاده از مدلهای درونسازی با تمرکز بر مدل زبانی BERT برای بهبود نتایج رتبهبندی ارائه میکند. رویکرد پیشنهادی از روشهای د چکیده کاملرتبهبندی کارآمد اسناد در عصر اطلاعات امروز، نقش مهمی در سیستمهای بازیابی اطلاعات ایفا میکند. این مقاله یک رویکرد جدید برای رتبهبندی اسناد با استفاده از مدلهای درونسازی با تمرکز بر مدل زبانی BERT برای بهبود نتایج رتبهبندی ارائه میکند. رویکرد پیشنهادی از روشهای درونسازی واژگان برای بهتصویرکشیدن نمایشهای معنایی پرسوجوهای کاربر و محتوای سند استفاده میکند. با تبدیل دادههای متنی به بردارهای معنایی، ارتباط و شباهت بین پرسوجوها و اسناد تحت روابط رتبهبندی پیشنهادی با هزینه کمتر مورد ارزیابی قرار میگیرد. روابط رتبهبندی پیشنهادی عوامل مختلفی را برای بهبود دقت در نظر میگیرند که این عوامل شامل بردارهای درونسازی واژگان، مکان واژگان کلیدی و تأثیر واژگان باارزش در رتبهبندی بر مبنای بردارهای معنایی است. آزمایشها و تحلیلهای مقایسهای برای ارزیابی اثربخشی روابط پیشنهادی اعمال گردیده است. نتایج تجربی، اثربخشی رویکرد پیشنهادی را با دستیابی به دقت بالاتر در مقایسه با روشهای رتبهبندی رایج نشان میدهند. این نتایج بیانگر آن مسئله است که استفاده از مدلهای درونسازی و ترکیب آن در روابط رتبهبندی پیشنهادی بهطور قابل توجهی دقت رتبهبندی را تا 87/0 در بهترین حالت بهبود میبخشد. این بررسی به بهبود رتبهبندی اسناد کمک میکند و پتانسیل مدل درونسازی BERT را در بهبود عملکرد رتبهبندی نشان میدهد. پرونده مقاله