فهرست مقالات علی محمد زارع بیدکی


  • مقاله

    1 - افزایش سرعت جستجو در مدل‌‌های مبتنی بر مجاورت
    فصلنامه مهندسی برق و مهندسی کامپيوتر ايران , شماره 56 , سال 15 , تابستان 1396
    یکی از اصلی‌‌ترین چالش‌‌های مدل‌‌های مبتنی بر مجاورت مسأله سرعت بازیابی اطلاعات می‌‌باشد. در مدل‌‌های مبتنی بر مجاورت مفهومی به نام فاصله تعریف می‌‌شود که برای محاسبه آن باید موقعیت کلمات پرس و جو در سند استخراج شود. این موضوع یعنی استخراج موقعیت‌‌ها و محاسبه فاصله‌‌ها چکیده کامل
    یکی از اصلی‌‌ترین چالش‌‌های مدل‌‌های مبتنی بر مجاورت مسأله سرعت بازیابی اطلاعات می‌‌باشد. در مدل‌‌های مبتنی بر مجاورت مفهومی به نام فاصله تعریف می‌‌شود که برای محاسبه آن باید موقعیت کلمات پرس و جو در سند استخراج شود. این موضوع یعنی استخراج موقعیت‌‌ها و محاسبه فاصله‌‌ها فرایندی زمان‌‌بر است و چون غالباً در زمان جستجو اجرا می‌‌شود از دید کاربر اهمیت بیشتری دارد. در صورتی که بتوان تعداد اسناد مورد بررسی را کاهش داد بازیابی سریع‌‌تر می‌‌شود. در این مقاله الگوریتمی به نام 3SNTK برای هرس‌کردن پویای اسناد در موقع جستجوی عبارت ارائه گردیده است. برای اجتناب از تخصیص بیش از حد حافظه و کاهش ریسک بروز خطا در موقع بازیابی، امتیاز تعدادی از اسناد بدون هیچ گونه هرسی محاسبه می‌‌شود (Skip-N). در این الگوریتم از سه هرم حداقل برای استخراج اسناد دارای بالاترین امتیازها استفاده شده و آزمایش‌‌ها نشان می‌‌دهد که استفاده از الگوریتم‌‌ ‌‌پیشنهادی باعث بهبود سرعت بازیابی می‌‌گردد. پرونده مقاله

  • مقاله

    2 - تأثیر الگوی موضوعی رفتار جستجوی كاربران نوجوان بر پیشنهاد پرس‌وجو
    فصلنامه مهندسی برق و مهندسی کامپيوتر ايران , شماره 62 , سال 16 , بهار 1400
    کاربران نوجوان هنگام جستجوی موضوع‌های مورد نظرشان، دایره لغات محدودی را در فرمول‌بندی پرس‌وجو به کار می‌برند. مسئله مهم دیگر آن است که کاربران نوجوان غالباً بر روی اقلام اولیه ارائه‌شده در لیست نتایج جستجو کلیک می‌کنند. در این پژوهش برای ترمیم و جبران این ویژگی‌ها، پیشن چکیده کامل
    کاربران نوجوان هنگام جستجوی موضوع‌های مورد نظرشان، دایره لغات محدودی را در فرمول‌بندی پرس‌وجو به کار می‌برند. مسئله مهم دیگر آن است که کاربران نوجوان غالباً بر روی اقلام اولیه ارائه‌شده در لیست نتایج جستجو کلیک می‌کنند. در این پژوهش برای ترمیم و جبران این ویژگی‌ها، پیشنهاد می‌شود که الگوی موضوعی از روی رفتار کاربر نوجوان بر اساس جستجوهای قبلی کشف شوند و با تکیه بر الگوهای یافت‌شده، پرس‌وجوی مناسب استخراج و به کاربر نوجوان پیشنهاد گردد. در روش پیشنهادی، الگوهای موضوعی بر اساس ویژگی محبوبیت كلیك‌ها و مرتبط‌ترین موضوع‌ها از روی لاگ‌های جستجو که عموماً حجیم هستند استخراج می‌گردند. در ادامه با استفاده از كلاسه‌بندی دودویی، نزدیک‌ترین پرس‌وجو به پرس‌وجوی مورد نظر كاربر نوجوان مشخص می‌شود. در نتیجه با فیلترنمودن نویز ناوبری موضوعی بر اساس استخراج الگوهای موضوعی کلیک‌های کاربران نوجوان یک مدل کاربر با دقت‌ بالاتری برای پیشنهاد پرس‌وجو حاصل می‌گردد. روش پیشنهادی با استفاده از ابزارهای Alteryx و weka پیاده‌سازی و عملکرد آن بر روی لاگ جستجوی AOL که شامل حدود 20 ميليون نمونه تراکنش جستجو مربوط به 650 هزار کاربر می‌باشد ارزیابی گردید. نتایج آزمایش‌ها نشان می‌دهند که پرس‌وجوهای ارائه‌شده توسط سیستم پیشنهادی به پرس‌وجوی مورد نظر کاربر نوجوان نزدیک‌تر است و به تبع آن موجب بهبود دستیابی به نتایج مرتبط می‌گردد. پرونده مقاله

  • مقاله

    3 - ارائه سیستم توصیه‌گر مبتنی بر جلسه شخصی‌سازی شده با استفاده از شبکه‌های خودتوجه
    فصلنامه مهندسی برق و مهندسی کامپيوتر ايران , شماره 98 , سال 20 , پاییز 1401
    سیستم‌های توصیه‌گر مبتنی بر جلسه بر اساس رفتار و تعاملات کاربر در یک جلسه، رفتار بعدی یا علاقه کاربر را پیش‌بینی کرده و بر این اساس، آیتم‌های مناسب را به کاربر پیشنهاد می‌دهند. مطالعات اخیر برای ایجاد توصیه‌ها عمدتاً روی اطلاعات جلسه فعلی متمرکز شده‌اند و اطلاعات جلسات چکیده کامل
    سیستم‌های توصیه‌گر مبتنی بر جلسه بر اساس رفتار و تعاملات کاربر در یک جلسه، رفتار بعدی یا علاقه کاربر را پیش‌بینی کرده و بر این اساس، آیتم‌های مناسب را به کاربر پیشنهاد می‌دهند. مطالعات اخیر برای ایجاد توصیه‌ها عمدتاً روی اطلاعات جلسه فعلی متمرکز شده‌اند و اطلاعات جلسات قبلی کاربر را نادیده می‌گیرند. در این مقاله، یک مدل توصیه‌گر مبتنی بر جلسه شخصی‌سازی شده با شبکه‌های خودتوجه پیشنهاد می‌شود که علاوه بر جلسه فعلی از جلسات قبلی اخیر کاربر هم استفاده می‌کند. مدل پیشنهادی به منظور یادگیری وابستگی کلی بین همه آیتم‌های جلسه، از شبکه‌های خودتوجه (SAN) استفاده می‌کند. ابتدا SAN مبتنی بر جلسات ناشناس آموزش داده می‌شود و سپس برای هر کاربر، توالی‌های جلسه فعلی و جلسات قبلی به صورت جداگانه به شبکه داده می‌شود و با ترکیب وزنی نتایج رتبه‌بندی حاصل از هر جلسه، آیتم‌های توصیه‌شده نهایی به دست می‌آید. مدل پیشنهادی بر روی مجموعه داده واقعی Reddit در دو معیار دقت و میانگین رتبه متقابل، تست و ارزیابی شده است. مقایسه نتایج حاصل از مدل پیشنهادی با رویکردهای قبلی، توانایی و اثربخشی مدل پیشنهادی را در ارائه توصیه‌های دقیق‌تر نشان می‌دهد. پرونده مقاله

  • مقاله

    4 - درون سازی معنایی واژه ها با استفاده از BERT روی وب فارسی
    فصلنامه مهندسی برق و مهندسی کامپيوتر ايران , شماره 104 , سال 21 , تابستان 1402
    استفاده از بافت و ترتیب واژگان در یک عبارت از مواردی است که می‌تواند به فهم بهتر آن عبارت منجر گردد. در سال‌های اخیر، مدل‌های زبانی از پیش‌آموزش‌یافته، پیشرفت شگرفی در زمینه پردازش زبان طبیعی به وجود آوده‌اند. در این راستا مدل‌های مبتنی بر ترنسفورمر مانند الگوریتم BERT چکیده کامل
    استفاده از بافت و ترتیب واژگان در یک عبارت از مواردی است که می‌تواند به فهم بهتر آن عبارت منجر گردد. در سال‌های اخیر، مدل‌های زبانی از پیش‌آموزش‌یافته، پیشرفت شگرفی در زمینه پردازش زبان طبیعی به وجود آوده‌اند. در این راستا مدل‌های مبتنی بر ترنسفورمر مانند الگوریتم BERT از محبوبیت فزاینده‌ای برخوردار گردیده‌اند. این مسئله در زبان فارسی کمتر مورد بررسی قرار گرفته و به‌عنوان یک چالش در حوزه وب فارسی مطرح می‌گردد. بنابراین در این مقاله، درون‌سازی واژگان فارسی با استفاده از این الگوریتم مورد بررسی قرار می‌گیرد که به درک معنایی هر واژه بر مبنای بافت متن می‌پردازد. در رویکرد پیشنهادی، مدل ایجادشده بر روی مجموعه دادگان وب فارسی مورد پیش‌آموزش قرار می‌گیرد و پس از طی دو مرحله تنظیم دقیق با معماری‌های متفاوت، مدل نهایی تولید می‌شود. در نهایت ویژگی‌های مدل استخراج می‌گردد و در رتبه‌بندی اسناد وب فارسی مورد ارزیابی قرار می‌گیرد. نتایج حاصل از این مدل، بهبود خوبی نسبت به سایر مدل‌های مورد بررسی دارد و دقت را نسبت به مدل برت چندزبانه تا حداقل یک درصد افزایش می‌دهد. همچنین اعمال فرایند تنظیم دقیق با ساختار پیشنهادی بر روی سایر مدل‌های موجود توانسته به بهبود مدل و دقت درون‌سازی بعد از هر فرایند تنظیم دقیق منجر گردد. نتایج رتبه‌بندی بر مبنای مدل‌های نهایی، بیانگر بهبود دقت رتبه‌بندی وب فارسی نسبت به مدل‌های پایه مورد ارزیابی با افزایش حدود 5 درصدی دقت در بهترین حالت است. پرونده مقاله

  • مقاله

    5 - بهبود رتبه‌بندی با استفاده از BERT
    فصلنامه مهندسی برق و مهندسی کامپيوتر ايران , شماره 110 , سال 22 , بهار 1403
    رتبه‌بندی کارآمد اسناد در عصر اطلاعات امروز، نقش مهمی در سیستم‌های بازیابی اطلاعات ایفا می‌کند. این مقاله یک رویکرد جدید برای رتبه‌بندی اسناد با استفاده از مدل‌های درون‌سازی با تمرکز بر مدل زبانی BERT برای بهبود نتایج رتبه‌بندی ارائه می‌کند. رویکرد پیشنهادی از روش‌های د چکیده کامل
    رتبه‌بندی کارآمد اسناد در عصر اطلاعات امروز، نقش مهمی در سیستم‌های بازیابی اطلاعات ایفا می‌کند. این مقاله یک رویکرد جدید برای رتبه‌بندی اسناد با استفاده از مدل‌های درون‌سازی با تمرکز بر مدل زبانی BERT برای بهبود نتایج رتبه‌بندی ارائه می‌کند. رویکرد پیشنهادی از روش‌های درون‌سازی واژگان برای به‌تصویرکشیدن نمایش‌های معنایی پرس‌وجوهای کاربر و محتوای سند استفاده می‌کند. با تبدیل داده‌های متنی به بردارهای معنایی، ارتباط و شباهت بین پرس‌و‌جوها و اسناد تحت روابط رتبه‌بندی پیشنهادی با هزینه کمتر مورد ارزیابی قرار می‌گیرد. روابط رتبه‌بندی پیشنهادی عوامل مختلفی را برای بهبود دقت در نظر می‌گیرند که این عوامل شامل بردارهای درون‌سازی واژگان، مکان واژگان کلیدی و تأثیر واژگان باارزش در رتبه‌بندی بر مبنای بردارهای معنایی است. آزمایش‌ها و تحلیل‌های مقایسه‌ای برای ارزیابی اثربخشی روابط پیشنهادی اعمال گردیده است. نتایج تجربی، اثربخشی رویکرد پیشنهادی را با دستیابی به دقت بالاتر در مقایسه با روش‌های رتبه‌بندی رایج نشان می‌دهند. این نتایج بیانگر آن مسئله است که استفاده از مدل‌های درون‌سازی و ترکیب آن در روابط رتبه‌بندی پیشنهادی به‌طور قابل توجهی دقت رتبه‌بندی را تا 87/0 در بهترین حالت بهبود می‌بخشد. این بررسی به بهبود رتبه‌بندی اسناد کمک می‌کند و پتانسیل مدل درون‌سازی BERT را در بهبود عملکرد رتبه‌بندی نشان می‌دهد. پرونده مقاله