MirrorCode Benchmark
MirrorCode zeigt Fähigkeiten moderner AI-Systeme in der Reimplementierung komplexer Software.
MirrorCode zeigt Fähigkeiten moderner AI-Systeme in der Reimplementierung komplexer Software.
Erklärungsbasiertes Gleichgewicht in multiagenten Systemen.
Graphify creates full knowledge graphs from any folder with one command.
Studie untersucht emotionale Signale in LLMs und Agents.
Policy-Gradient-Methoden für partiell beobachtbare Spiele
LLM-Agenten kooperieren eher als sie auf Nash-Gleichgewichte zusteuern.