NVIDIA hat gerade seine neuesten GB300 NVL72-Systeme vorgestellt. Sie können 50-mal mehr Arbeit pro Megawatt Strom bewältigen im Vergleich zur älteren Hopper-Plattform. Das bedeutet, dass die Kosten um das 35-fache pro verarbeiteter Information sinken.
Signal65 führte separate Tests am GB200 NVL72 durch und stellte fest, dass es mehr als 10-mal mehr Informationen pro Watt verarbeitet, wodurch die Kosten auf ein Zehntel reduziert werden.
Die Verbesserungen gehen weiter. Allein die Upgrades von NVIDIAs TensorRT-LLM-Bibliothek brachten dem GB200 in nur vier Monaten eine fünffache Leistungssteigerung bei Aufgaben, die sofortige Antworten erfordern. Teams, die an Dynamo-, Mooncake- und SGLang-Tools arbeiten, treiben die Effizienz noch weiter voran.
Diese KI-Tools versagen, wenn es Verzögerungen gibt oder sie sich nicht genug Kontext merken können. Unternehmen brauchen sie, damit sie in echten Geschäftssituationen funktionieren, nicht nur in Demos.
KI-gesteuerte Tools, die Code schreiben und als digitale Helfer fungieren, machen inzwischen fast die Hälfte aller KI-bezogenen Suchanfragen aus, gegenüber nur 11% vor einem Jahr.
Die Zahlen stammen aus dem State of Inference-Bericht von OpenRouter und zeigen, wie schnell sich die Dinge in diesem Bereich ändern.
Dieser plötzliche Anstieg lässt Unternehmen hektisch Hardware entwickeln, die mithalten kann. Diese KI-Assistenten müssen sofort reagieren und sich den Kontext ganzer Softwareprojekte merken, was ernsthafte Anforderungen an die Rechenleistung stellt.
Marktexplosion befeuert Kampf der Tech-Giganten um Dominanz
Die beteiligten Summen sind enorm. Der AI Agent-Markt war 2024 4,92 Milliarden Dollar wert. Schätzungen gehen von 6,016 Milliarden Dollar für 2025 aus, die dann bis 2035 auf 44,97 Milliarden Dollar anwachsen. Das sind 22,28% Wachstum pro Jahr für das nächste Jahrzehnt. Banken, Krankenhäuser, Geschäfte und Fabriken sind die frühen Anwender.
Unternehmen integrieren diese Agenten in Kundenverwaltungssysteme, Planungstools und Sicherheitseinrichtungen, um Geld zu sparen und mehr zu erreichen. Was als optionale Technologie begann, wird zur grundlegenden Infrastruktur.
Wie Cryptopolitan berichtet, hat Alibaba gerade Qwen3.5 für den chinesischen Markt eingeführt und behauptet, die Verarbeitungskosten seien um 60% niedriger als zuvor. Das Modell kann Bildschirme betrachten und Aufgaben über Telefone und Computer hinweg erledigen. Es tritt direkt gegen ByteDances Doubao-App an, und es kommt auch ein DeepSeek-Update.
OpenAI stellte am 15. Peter Steinberger ein. Er entwickelte OpenClaw, einen Open-Source-AI Agent. CEO Sam Altman sagte, Steinberger werde die Arbeit an persönlichen Agenten der nächsten Generation leiten, und nannte ihn ein Genie mit großartigen Ideen über intelligente Assistenten, die nützliche Dinge erledigen können.
Die Talente-Krise, die niemand lösen kann
94% der Unternehmensführer sagen, dass ihnen KI-Fähigkeiten fehlen. Bis 2028 erwarten 44%, immer noch 20 bis 40% Engpässe zu haben. Workera sagt, dass diese Lücken die Weltwirtschaft 2026 5,5 Billionen Dollar durch verzögerte Produkte, Qualitätsprobleme und verlorene Verkäufe kosten könnten.
Derzeit übersteigt die Nachfrage nach KI-Talenten das Angebot weltweit im Verhältnis 3,2 zu eins. KI-Jobs zahlen 67% mehr als reguläre Software-Positionen. Dennoch lernen 85% der Büroangestellten dieses Zeug in ihrer Freizeit, und 83% sagen, sie bringen es sich hauptsächlich selbst bei, anstatt formale Schulungen zu erhalten.
Wenn Unternehmen KI-Tools von spezialisierten Anbietern kaufen, sind sie in 67% der Fälle erfolgreich. Interne Entwicklungen funktionieren nur etwa ein Drittel so oft.
Salesforce verzeichnete Anfang 2025 ein Agenten-Wachstum von 119% und überschritt 500 Millionen Dollar an wiederkehrenden Einnahmen für diese Produkte. Sie gewannen in drei Monaten 6.000 Unternehmenskunden hinzu.
Unternehmen werden wahrscheinlich Lösungen kaufen, anstatt sie zu entwickeln. Das deutet darauf hin, dass sich der Markt auf einige wenige große Anbieter konzentriert, die liefern können, was tatsächlich funktioniert.
Quelle: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/

