MARS: Effizientes Co-Scheduling

MARS koordiniert GPU-CPU-Ressourcen zur Latenzreduktion.

Das Paper präsentiert MARS, ein effizientes und anpassungsfähiges Co-Scheduling-System für heterogene agente Systeme. Es koordiniert die Ressourcenanforderungen von GPU und CPU, um die End-to-End-Latenz zu reduzieren und gleichzeitig das Systemdurchsatzoptimum beizubehalten. Die Arbeit ist relevant für die Entwicklung autonomer Agenten in der Digitalgesellschaft, da sie die Effizienz und Skalierbarkeit solcher Systeme verbessert.

Einordnung

Kategorie Code & Algorithms
Score 8
Relevanz Die Arbeit trägt zum Verständnis der technischen Herausforderungen bei, die mit autonom agierenden Systemen verbunden sind. Sie zeigt, wie Infrastruktur und Code optimiert werden können, um die Effizienz solcher Systeme zu steigern, was für den langfristigen gesellschaftlichen Nutzen von großer Bedeutung ist.

Quelle

Art Scientific Paper
Autor Yifei Wang, Hancheng Ye, Yechen Xu, Cong Guo, Chiyue Wei, Qinsi Wang, Dongting Li, Tingjun Chen, Hai "Helen" Li, Danyang Zhuo, Yiran Chen
Veröffentlicht am April 14, 2026
Original-Link Original-Link

Details

Stichwort MARS: Efficient, Adaptive Co-Scheduling for Heterogeneous Agentic Systems
LLM Type qwen2.5:32b-instruct-q5_K_M
Edition Daily News
Markierung Bot
Archiviert am Mai 1, 2026
Nach oben scrollen