OpenAI hat ein Benchmarking-Framework vorgestellt, das darauf abzielt zu messen, wie effektiv AI Agents Sicherheitslücken in Krypto-Smart-Contracts erkennen, mindern und sogar ausnutzen können. Das Projekt mit dem Titel „EVMbench: Evaluating AI Agents on Smart Contract Security" wurde in Zusammenarbeit mit Paradigm und OtterSec veröffentlicht, zwei Organisationen mit umfassender Erfahrung im Bereich Blockchain-Sicherheit und Investment. Die Studie bewertet AI Agents anhand einer kuratierten Sammlung von 120 potenziellen Schwachstellen aus 40 Smart Contract Audits und versucht, nicht nur Erkennungs- und Patch-Fähigkeiten zu quantifizieren, sondern auch das theoretische Exploit-Potenzial dieser Agenten in einer kontrollierten Umgebung.
Erkennungsprämien für AI Agents werden im begleitenden OpenAI-PDF zur Studie detailliert beschrieben, das auch die Bewertungsmethodik und die Szenarien zur Simulation realer Smart-Contract-Risiken beschreibt. Die Autoren betonen, dass es zwar AI Agents gelungen ist, eine breite Palette von Routineaufgaben zu automatisieren, die Bewertung ihrer Leistung in „wirtschaftlich bedeutsamen Umgebungen" jedoch entscheidend ist, um zu verstehen, wie sie unter Druck in Produktionssystemen abschneiden werden.
OpenAI stellt fest, dass es erwartet, dass agentische Technologien den Umfang von Zahlungen und Abrechnungen erweitern werden, einschließlich Stablecoins, die in automatisierten Workflows verwendet werden. Die Diskussion über KI-aktivierte Zahlungen geht über Sicherheitstests hinaus und erstreckt sich auf die umfassendere Frage, wie autonome Systeme an täglichen Finanzaktivitäten teilnehmen werden. Die eigenen Prognosen des Unternehmens deuten darauf hin, dass agentische Zahlungen alltäglicher werden könnten, indem sie AI-Fähigkeiten in praktischen Anwendungsfällen verankern, die alltägliche Verbrauchertransaktionen berühren.
Parallel zu den Benchmark-Ergebnissen hat Circle-CEO Jeremy Allaire öffentlich prognostiziert, dass Milliarden von AI Agents innerhalb der nächsten fünf Jahre mit Stablecoins für alltägliche Zahlungen handeln könnten. Diese Ansicht überschneidet sich mit einem wiederkehrenden Thema in Krypto-Kreisen: dem Potenzial für Krypto, zur nativen Währung von AI Agents zu werden – eine Erzählung, die von Branchenführern und Investoren gleichermaßen bemerkenswerte Aufmerksamkeit erhalten hat. Während solche Vorhersagen spekulativ bleiben, ist der zugrunde liegende Trend klar – die KI-Automatisierung bewegt sich vom Labor zur Transaktionsebene, wo sie die Art und Weise, wie Werte über Netzwerke fließen, neu gestalten könnte.
Die Studie kommt zu einem Zeitpunkt, an dem Krypto-Sicherheit weiterhin ein bedeutender Risikofaktor für Investoren ist. Der Datenpunkt über den Angriff auf Krypto-Fonds 2025 – bei dem Angreifer etwa 3,4 Milliarden $ erbeuteten – unterstreicht die Dringlichkeit verbesserter Tools und schnellerer, zuverlässigerer Patch-Mechanismen. Das EVMbench-Framework ist teilweise als eine Möglichkeit positioniert, zu messen, ob AI Agents in der Lage sind, einen bedeutenden Beitrag zu defensiven Fähigkeiten im großen Maßstab zu leisten, Ausbeutungsmöglichkeiten zu reduzieren und die Bedrohungsminderung zu beschleunigen.
Um den Benchmark zu erstellen, stützten sich die Forscher auf 120 kuratierte Schwachstellen aus 40 Smart Contract Audits, wobei viele Schwachstellen auf Open-Source-Audit-Herausforderungen zurückzuführen sind. OpenAI argumentiert, dass der Benchmark dabei helfen wird, den Fortschritt der KI bei der Erkennung und Minderung von Schwachstellen auf Vertragsebene im großen Maßstab zu verfolgen und eine standardisierte Möglichkeit bietet, zukünftige AI-Modelle zu vergleichen, während sie sich weiterentwickeln. Die Studie bietet auch einen Einblick, wie KI zur Normalisierung der Risikobewertung über eine Vielzahl von Smart-Contract-Architekturen hinweg angewendet werden könnte, anstatt sich ausschließlich auf isolierte Fälle zu konzentrieren.
In einem zeitgleichen Thread auf X argumentierte Haseeb Qureshi, Partner bei Dragonfly, dass das Versprechen von Krypto, Eigentumsrechte und traditionelle Verträge zu ersetzen, nicht deshalb nicht verwirklicht wurde, weil die Technologie versagt hat, sondern weil sie nie mit menschlicher Intuition im Hinterkopf entwickelt wurde. Er hat die anhaltende Angst hervorgehoben, die mit der Unterzeichnung großer Transaktionen in einer Umgebung verbunden ist, in der Drainer-Wallets und andere Angriffsvektoren eine ständige Bedrohung darstellen, im krassen Gegensatz zur vergleichsweise reibungsloseren Erfahrung traditioneller Banküberweisungen.
Qureshi behauptet, dass die nächste Phase von Krypto-Transaktionen durch KI-vermittelte, selbstfahrende Wallets ermöglicht werden könnte. Solche Wallets würden Risiken überwachen, komplexe Operationen verwalten und autonom auf Bedrohungen im Auftrag der Benutzer reagieren, wodurch möglicherweise die Reibung und Angst verringert wird, die große Überweisungen heute kennzeichnen.
Die umfassendere Erkenntnis aus diesem Thread ist, dass AI Agents eine entscheidende Rolle bei der Transformation der Art und Weise spielen könnten, wie Menschen mit Krypto interagieren – von manuellen, fehleranfälligen Transaktionen hin zu automatisierten, risikobewussten Prozessen, die mit der Akzeptanz skalieren können. Wenn AI Agents beginnen, mehr Kompetenz im Umgang mit Sicherheitsbedenken zu demonstrieren, könnten Benutzer eine verbesserte Zuverlässigkeit und Widerstandsfähigkeit in dezentralisierten Finanz-Workflows erleben, auch wenn die zugrunde liegenden Technologien weiter reifen.
Die EVMbench-Studie zeigt, dass große Sprachmodelle und verwandte AI Agents beginnen, bedeutsame Sicherheitsarbeiten im Smart-Contract-Bereich durchzuführen, mit klar quantifizierbaren Unterschieden zwischen den Modellen. Die Führung von Claude Opus 4.6 bei durchschnittlichen Erkennungsprämien signalisiert, dass bestimmte Architekturen möglicherweise besser darin sind, Schwachstellen in komplexer Vertragslogik zu erkennen und zu mindern, während andere hinterherhinken und ein Spektrum an Fähigkeiten bieten, das Forscher wahrscheinlich verfeinern möchten. Die Einbeziehung mehrerer Branchenpartnerschaften in das Projekt unterstreicht den wachsenden Konsens, dass KI-aktivierte Sicherheit und automatisiertes Risikomanagement für die Skalierung in dezentralisierten Umgebungen unerlässlich werden könnten.
Während sich das Feld weiterentwickelt, werden Beobachter darauf achten, wie schnell AI Agents von der Erkennung zur Behebung übergehen können und ob diese Agenten zuverlässig in Live-Systemen arbeiten können, ohne neue Risiken einzuführen. Die Diskussion über KI-gesteuert Wallets und autonome Zahlungen berührt eine breitere Reihe von Fragen rund um Sicherheits-Governance, Benutzerzustimmung und regulatorische Ausrichtung. Wenn die von OpenAI und seinen Partnern vorgeschlagene Entwicklung fortgesetzt wird, könnten KI-unterstützte Tools zu einer Kernkomponente der zukünftigen Krypto-Infrastruktur werden und sowohl die Risikokalkulation als auch die Benutzererfahrung auf bedeutsame Weise verändern. Die nächste Runde von Benchmarks wird zusammen mit realen Einsätzen dazu beitragen zu bestimmen, wie schnell sich diese Vision materialisiert und welche Schutzmaßnahmen sie begleiten müssen.
Dieser Artikel wurde ursprünglich als OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts auf Crypto Breaking News veröffentlicht – Ihre vertrauenswürdige Quelle für Krypto-Nachrichten, Bitcoin-Nachrichten und Blockchain-Updates.


