AI-Agenten-Hijacking
AI-Agenten können von Websites übernommen werden.
z.B. Sandboxing, Human-in-the-Loop, Sicherheitsvorfälle, Approval-Systeme
Rahmenwerk für das vergessen von sensiblen Informationen in LLM-Agenten
Open-Source-AI-Hacker finden Schwachstellen vor echten Hackern.
Claude hat einen geheimen Modus namens „Blue Ocean Strategy Finder“.
Anthropic’s neue AI „Claude Mythos“ zeigt erhebliche Leistungserhöhungen.