همكاري در سيستمهاي چند عامله با استفاده از اتوماتاهاي يادگير

محورهای موضوعی : مهندسی برق و کامپیوتر

1 - دانشگاه صنعتی امیرکبیر
2 - دانشگاه صنعتی امیرکبیر

تاریخ دریافت : 1381/06/03 تاریخ پذیرش : 1382/05/06 تاریخ انتشار : 1382/03/31

کلید واژه: اتوماتاي يادگيرعاملسيستمهاي چندعاملهفوتبال روباتهاهمكاري,

چکیده مقاله :

عاملها موجودات نرم‏افزاري هستند كه بطور پيوسته و خود مختار در يک محيط که براي آن طراحي شده‏اند کار ميکنند. براي عاملها نيازهايي از قبيل واكنشي بودن نسبت به كنش‏هاي محيطي، خود مختاري در انتخاب مسير و ادامه آن، قابليت تطبيق و يادگيري و ... ضروري به نظر مي‏رسد. امروزه مطالعه سيستمهاي مبتني بر عاملها به يك موضوع مهم آكادميك تبديل شده است كه كاربردهاي تجاري و صنعتي فراواني را نيز دربر دارد. در سيستمهاي چندعامله، چندين عامل هوشمند با قابليت برقراري ارتباط با يكديگر، جهت رسيدن به مجموعه‏اي از اهداف، با هم همكاري مي‏كنند. بدليل پيچيدگيهاي موجود در محيطهاي چندعامله پويا و متغير نياز به روشهاي يادگيري ماشين در چنين محيطهايي احساس مي‏شود. اتوماتاي يادگير يك مدل انتزاعي است كه تعداد محدودي عمل را مي‏تواند انجام دهد. هر عمل انتخاب شده توسط محيطي احتمالي ارزيابي مي‏گردد و پاسخي به اتوماتاي يادگير داده مي‏شود. اتوماتاي يادگير از اين پاسخ استفاده نموده و عمل خود براي مرحله بعد را انتخاب مي‏كند. در اين مقاله با استفاده از بستر تست شبيه‏سازي فوتبال روباتها به بررسي كارآيي اتوماتاي يادگير در همكاري بين عاملهاي عضو يك تيم پرداخته شده است. بدليل وجود تعداد حالات بسيار زياد در دامنه‏هاي چند‏عامله پيچيده، داشتن روشي براي عمومي‏سازي حالات محيطي، امري ضروري است چرا كه انتخاب مناسب چنين روشي، در تعيين حالات و اعمال عامل نقشي تعيين كننده دارد. در اين مقاله همچنين به معرفي و پياده‏سازي تكنيك "بهترين گوشه در مربع حالت" پرداخته شده است. با استفاده از اين روش فضاي حالات پيوسته و بسيار وسيع عامل به فضاي حالات گسسته و محدود نگاشته مي‏شود. كارآيي اين تكنيك در عمومي‏سازي حالات محيطي در يك دامنه چند عامله همكاري گرا مورد بررسي قرار گرفته است.

چکیده انگلیسی:

Agents are software entities that act continuously and autonomously in a special environment. It is very essential for the agents to have the ability to learn how to act in the special environment for which they are designed to act in, to show reflexes to their environment actions, to choose their way and pursue it autonomously, and to be able to adapt and learn. In multi-agent systems, many intelligent agents that can interact with each other, cooperate to achieve a set of goals. Because of the inherent complexity that exists in dynamic and changeable multi-agent environments, there is always a need to machine learning in such environments. As a model for learning, learning automata act in a stochastic environment and are able to update their action probabilities considering the inputs from their environment, so optimizing their functionality as a result. Learning automata are abstract models that can perform some numbers of actions. Each selected action is evaluated by a stochastic environment and a response is given back to the automata. Learning automata use this response to choose its next action. In this paper, the goal is to investigate and evaluate the application of learning automata to cooperation in multi-agent systems, using soccer server simulation as a test-bed. Because of the large state space of a complex multi-agent domains, it is vital to have a method for environmental states’ generalization. An appropriate selection of such a method can have a great role in determining agent states and actions. In this paper we have also introduced and designed a new technique called “The best corner in state square” for generalizing the vast number of states in the environment to a few number of states by building a virtual grid in agent’s domain environment. The efficiency of this technique in a cooperative multi-agent domain is investigated

منابع و مأخذ:

اشتراک گذاری

آدرس مقاله

همكاري در سيستمهاي چند عامله با استفاده از اتوماتاهاي يادگير

رایمگ

پیوندهای سایت

مراکز مرتبط

پشتیبانی

صفحات رسمی