استفاده از تكنيكهاي فناوري اطلاعات در بازارهاي الکترونيکي، پویایی و پيچيدگي سيستم عرضه و تقاضا را بالا برده است. بنابراين بهکارگيري عاملهاي هوشمند جهت خريد و فروش و چانهزني در اين گونه بازارها بهعنوان يک راهکار مؤثر پيشنهاد شده است. الگوريتم یادگیری تقويتي يكي از ر چکیده کامل
استفاده از تكنيكهاي فناوري اطلاعات در بازارهاي الکترونيکي، پویایی و پيچيدگي سيستم عرضه و تقاضا را بالا برده است. بنابراين بهکارگيري عاملهاي هوشمند جهت خريد و فروش و چانهزني در اين گونه بازارها بهعنوان يک راهکار مؤثر پيشنهاد شده است. الگوريتم یادگیری تقويتي يكي از روشهاي قوي یادگیری عاملهاست که با كمترين اطلاعات ممكن ميتواند بهصورت تعاملي براي آموزش عامل، در راستاي پيشنهاد قيمت بهکار گرفته شود. چانهزني يك مذاكره چالش برانگيز و پيچيده است كه علت آن تنوع متغيرهاي بسيار زياد در روابط عرضه و تقاضا و دانش ناكافي شركتكنندگان در بازار ميباشد. در اين مقاله نحوه بهکارگيري یادگیری تقويتي در مسأله چانهزني در دو بازار مناقصه و مزايده در راستاي بيشينهسازي افزايش سود عامل بيان ميگردد. متغيرهاي حالت، عمل و تابع یادگیری تقويتي براي مسأله چانهزني در بازار به کمک يک مسأله یادگیری تقويتي نمونه فرمولبندي میشوند. با مقايسه روش ارائهشده و يك روش تجربی به اين واقعيت خواهيم رسيد كه عامل آموزشديده، سود به مراتب بيشتري را از يک عامل تجربی کسب مينمايد.
پرونده مقاله
رایمگ
سامانه رایمگ تمامی فرآیندهای دریافت، ارزیابی و داوری، ویراستاری، صفحهآرایی و انتشار الکترونیکی نشریات علمی را به انجام میرساند