اين مقاله روش جديدي را مطرح ميکند که قادر به استخراج گذرگاهها بهصورت اتوماتيک براي عامل يادگيري تقويتي است. روش پيشنهادي از سيستمهاي بيولوژيکي، رفتار و مسيريابي حيوانات الهام گرفته شده است و بهواسطه تعاملات عامل با محيط پيرامونياش عمل ميکند. عامل با استفاده از خو أکثر
اين مقاله روش جديدي را مطرح ميکند که قادر به استخراج گذرگاهها بهصورت اتوماتيک براي عامل يادگيري تقويتي است. روش پيشنهادي از سيستمهاي بيولوژيکي، رفتار و مسيريابي حيوانات الهام گرفته شده است و بهواسطه تعاملات عامل با محيط پيرامونياش عمل ميکند. عامل با استفاده از خوشهبندي و تشخيص اشيا بهصورت سلسله مراتبي، نشانههايي را پيدا ميکند. اگر اين نشانهها در فضاي اقدام به هم نزديک باشند، گذرگاهها با استفاده از حالتهاي بين آنها استخراج ميشوند. نتايج آزمايشها بهبود قابل ملاحظهاي را در فرايند يادگيري تقويتي در مقايسه با ساير روشهاي مشابه نشان ميدهد.
تفاصيل المقالة
رایمگ
يقوم نظام رایمگ بتنفيذ جميع عمليات الاستلام والتقييم والحكم والتحرير وتخطيط الصفحة والنشر الإلكتروني للمجلات العلمية.