Automatische Belohnungsformung für Multi-Agenten-RL

Das Paper „ARMS: Automatic Reward Shaping for Sparse-Reward Multi-Agent Reinforcement Learning“ von Elie Abboud und Oren Gal präsentiert ein Framework, das automatisch dichte Belohnungssignale aus dünnen Umgebungsbelohnungen in multiagenten Systemen erzeugt. ARMS verwendet Trajektorienbewertung und sorgt für die Erhaltung der Nash-Gleichgewichte durch bedingte Best-Antwort-Argumentation. Die Studie zeigt, dass ARMS die Lerneffizienz unter zunehmender Belohnungs-Sparheit und Agentenzahl verbessert und neue Herausforderungen in der Exploration aufdeckt. Das Werk ist relevant für die langfristige Entwicklung von autonom agierenden Systemen und deren Wechselwirkung mit menschlichen Entscheidungen.

Einordnung

Kategorie Code & Algorithms

Score 8

Relevanz Das Paper untersucht die Entwicklung von autonom agierenden Systemen im Kontext der Multi-Agent-Systeme und deren Auswirkungen auf menschliche Entscheidungsprozesse. Es passt in den Kontext von Digitalität und Gesellschaft, indem es das Schichtenmodell durch die Betrachtung von Code und Anwendung erweitert und die Wechselwirkung zwischen technischer Struktur und sozialer Dynamik beleuchtet.

Automatische Belohnungsformung für Multi-Agenten-RL

Einordnung

Quelle

Details