• فهرس المقالات Hashtag recommendationtopic vectormicroblogTwitter

      • حرية الوصول المقاله

        1 - پیشنهاد هشتگ در سیستم‌های میکروبلاگ توسط بردار موضوعی: مورد کاربرد توئیتر
        میر سامان تاجبخش جمشید باقرزاده
        با معرفی وب ۲.۰، داده‌های ایستا که در وب ۱.۰ وجود داشتند، حالت ساخت‌یافته‌تری به خود گرفتند. ویکی‌ها، بلاگ‌ها، شبکه‌های اجتماعی و سیستم‌های بوکمارکینگ اجتماعی مثال‌هایی از آن هستند که کاربران در آنها محتوا تولید می‌کنند. یکی از مشکلات تولید محتوا توسط کاربر، عدم یکپارچگ أکثر
        با معرفی وب ۲.۰، داده‌های ایستا که در وب ۱.۰ وجود داشتند، حالت ساخت‌یافته‌تری به خود گرفتند. ویکی‌ها، بلاگ‌ها، شبکه‌های اجتماعی و سیستم‌های بوکمارکینگ اجتماعی مثال‌هایی از آن هستند که کاربران در آنها محتوا تولید می‌کنند. یکی از مشکلات تولید محتوا توسط کاربر، عدم یکپارچگی محتوای تولیدشده می‌باشد که باعث تولید داده‌های ناهمگون شده و اجرای الگوریتم‌ها و تکنیک‌های کامپیوتری را دشوار می‌سازد. راه حل وب ۲.۰ برای کاهش اثر این مشکل، استفاده از هشتگ (تگ) برای مطالب منتشرشده توسط کاربر است که خود کاربر به مطالب منتشرشده خود، تگ می‌زند. این راهکار در میکروبلاگ‌هایی چون توئیتر کماکان رفع نشده است چرا که کاربران با محدودیت کاراکتری (۱۴۰ کاراکتر برای هر توئیت) مواجه هستند و ممکن است تعداد کاراکترهای محتوا باعث شود که برخی کاراکترهای هشتگ در پست نباشد. در این مقاله سعی شده تا با استفاده از روش تخصیص دیریکله نهفته و نمونه‌برداری Gibbs فروریخته، مشکل پیشنهاد هشتگ در محیط ناهمگون توئیتر رفع شود. پیشنهاد هشتگ بر روی 8396744 توئیت به زبان انگلیسی پیاده‌سازی و در آزمایش‌های مختلف بین ۱ تا ۵ مرتبط‌ترین هشتگ پیشنهاد شده است. نتایج در حالات مختلف دقت بالای ۲۰% و فراخوانی بالای ۴۵% را نشان می‌دهد که نشانگر افزایش دقت از ۳% به ۲۱% و افزایش فراخوانی از ۳۲% به ۴۶% در مقایسه با دقیق‌ترین روش بررسی‌شده پیشنهاد هشتگ توسط LDA بدون تغییر، توسط نویسندگان است. تفاصيل المقالة