Die Ära des „Single Cloud“-KI-Monopols ist offiziell vorbei. Am 3. November 2025 wurde die Branche von der Ankündigung erschüttert, dass OpenAI, das langjährige Kronjuwel des Azure-Ökosystems von Microsoft, eine siebenjährige Infrastrukturpartnerschaft im Wert von 38 Milliarden US-Dollar mit Amazon Web Services (AWS) unterzeichnet hatte. Dabei handelt es sich nicht nur um eine Kapazitätserweiterung; Es handelt sich um eine grundlegende Umstrukturierung der globalen KI-Machtkarte.
Das Wachstum von OpenAI war jahrelang ein Synonym für die Rechencluster von Azure. Da sich die Nachfrage nach Grenzmodellen jedoch von Milliarden auf Billionen von Parametern verschiebt, werden die Grenzen der Azure-NVIDIA-Beziehung deutlich. Durch die Verlagerung eines erheblichen Teils seiner Trainings- und Inferenz-Workloads auf AWS leistet OpenAI mehr als nur den Kauf von Servern; Es setzt auf das kundenspezifische Silizium von AWS, insbesondere auf die Trainium- und Inferentia-Familien, um die „CUDA-Steuer“ zu brechen, die seit einem Jahrzehnt die KI-Ökonomie bestimmt.
Der Haken: Warum 38 Milliarden US-Dollar jetzt wichtig sind
Ende 2025 erreichte die KI-Branche eine „Effizienzgrenze“. Das Training der nächsten Generation von Modellen (denken Sie an GPT-6 und höher) erfordert nicht mehr nur mehr GPUs; es erfordert effizientere GPUs. Die H100- und Blackwell-Chips von NVIDIA sind legendär für ihre Leistung, aber auch legendär für ihren Stromverbrauch und ihre Preise. Bei 30.000 bis 40.000 US-Dollar pro Chip führt die Skalierung auf einen Millionen-GPU-Cluster zu einem Investitionsaufwand, den selbst die Unterstützer von OpenAI als entmutigend empfinden.
Beteiligen Sie sich am 38-Milliarden-Dollar-AWS-Deal. Dieser Vertrag gilt nicht für Standard-NVIDIA-Instanzen. Es ist ein strategischer Schritt, auf AWS Trainium2 und die kürzlich angekündigten Trainium3 (Trn3) Ultraserver zu setzen. Durch die Umstellung auf benutzerdefinierte AWS-Chips strebt OpenAI eine Verbesserung des Preis-Leistungs-Verhältnisses um 40–50 % gegenüber standardmäßigen GPU-basierten Clustern an. Dies ermöglicht es OpenAI, mehr Iterationen seiner Trainingsläufe für den gleichen Dollar durchzuführen, ein entscheidender Vorteil im Rennen gegen Anthropic und Google.
Technischer Deep Dive: Das CUDA-Monopol brechen
Um zu verstehen, warum sich OpenAI vom CUDA-Ökosystem von NVIDIA entfernen würde, muss man sich das Silizium selbst ansehen. Der Vorteil von NVIDIA lag jahrelang im Software-Stack. CUDA (Compute Unified Device Architecture) machte es Forschern leicht, Code zu schreiben, der auf GPUs schnell lief. Aber AWS hat im Stillen einen Gegenstapel aufgebaut: Neuron.
Die Architektur von Trainium2
Der AWS Trainium2-Chip, der als Rückgrat dieses Deals dient, ist für eines konzipiert: leistungsstarkes Deep-Learning-Training in großem Maßstab. Im Gegensatz zu einer Allzweck-GPU entfernt Trainium die „ältere“ Grafikhardware, die für KI nicht benötigt wird, und konzentriert sich ausschließlich auf die Tensorverarbeitung.
- Speicherbandbreite: Trainium2 verfügt über 192 GB HBM3-Speicher pro Chip. Während die rohen TOPS (Tera Operations Per Second) mit NVIDIAs H100 konkurrenzfähig sind, ist das Geheimnis die Verbindung. Der Elastic Fabric Adapter (EFA) von AWS ermöglicht es diesen Chips, miteinander zu kommunizieren, als wären sie ein einzelner, riesiger Prozessor.
- Energieeffizienz: Wärme ist der Feind des Rechenzentrums. Trainium2-Cluster berichten von einem um 25–30 % geringeren Stromverbrauch pro FLOP im Vergleich zu gleichwertigen Hopper-Clustern. Wenn Sie für einen einzelnen Trainingslauf 100 Megawatt beziehen, ist eine Leistungsreduzierung um 30 % der Unterschied zwischen einer erfolgreichen Freigabe und einem lokalen Netzausfall.
- Das Neuron SDK: Der Neuron-Compiler von AWS hat einen Reifegrad erreicht, bei dem er PyTorch- und JAX-Modelle, die von OpenAI verwendeten Frameworks, mit minimalem manuellen Tuning automatisch auf Trainium-Silizium abbilden kann. Dies reduziert die „Portierungskosten“, die Ingenieure bisher an NVIDIA gebunden haben.
Der Aufstieg von Trainium3
Im Dezember 2025 gab AWS bekannt, dass Trainium3 (Trn3) Ultraserver jetzt allgemein verfügbar sind und damit die nächste Stufe erreicht. Diese Einheiten packen 64 Trainium3-Chips in einem einzigen, vollständig flüssigkeitsgekühlten Gehäuse und bieten über 100 Petaflops FP8-Leistung. Entscheidend ist, dass Trainium3 eine 4-fache Leistungssteigerung gegenüber seinem Vorgänger bietet und gleichzeitig einen erheblichen Vorsprung bei der Energieeffizienz gegenüber GPUs der Blackwell-Klasse behält. Berichten zufolge ist OpenAI der Hauptmieter dieser Ultraserver und nutzt sie als Pionier für „Distributed Inference“ bei Modellen, die zu groß sind, um selbst in die größten Einzelserver-Speicherpools zu passen.
Kontextgeschichte: Die Spannung zwischen Azure, Microsoft und OpenAI
Um den AWS-Pivot zu verstehen, muss man die Geschichte der „Goldenen Handschellen“ verstehen. Im Jahr 2019 investierte Microsoft 1 Milliarde US-Dollar in OpenAI, gefolgt von weiteren Milliarden in den folgenden Runden. Diese Investition erfolgte größtenteils in Form von Azure-Credits. OpenAI war im Wesentlichen gezwungen, auf der Cloud von Microsoft aufzubauen.
Dies war jahrelang eine symbiotische Beziehung. Microsoft erhielt einen exklusiven Einblick in die weltbeste KI, und OpenAI erhielt eine nahezu grenzenlose Rechenleistung. Als aus dem Jahr 2024 jedoch das Jahr 2025 wurde, traten Reibungspunkte auf:
- Kapazitätsbeschränkungen: Trotz des aggressiven Ausbaus von Microsoft konkurrierte OpenAI mit den internen „Copilot“-Teams von Microsoft um H100.
- Der Trend zur souveränen KI: Als Länder und kleinere Unternehmen begannen, ihre eigenen souveränen Clouds aufzubauen, wurde die Idee, an einen einzigen Anbieter gebunden zu sein, zu einem strategischen Risiko für OpenAI.
- Der Anthropic- und Apple-Faktor: Anthropic war von Anfang an ein AWS-Partner. Darüber hinaus diente die öffentliche Nutzung von Trainium2 durch Apple für das Modelltraining Ende 2024 als massive Bestätigung für die Branche. Als OpenAI den Erfolg dieser Konkurrenten beobachtete, erkannte es, dass sie möglicherweise eine „Microsoft-Steuer“ zahlen mussten, die ihre Konkurrenten vermeiden wollten.
Dieser AWS-Deal bedeutet nicht, dass OpenAI Microsoft verlässt. Das bedeutet, dass OpenAI zur Multi-Cloud wird. In der Welt der Unternehmenstechnologie ist es ein Risiko, eine Single-Cloud zu betreiben. Analysen deuten darauf hin, dass OpenAI bis 2026 eine „Triple Cloud“-Strategie verfolgen wird: Azure als primäre Heimat für Verbraucherprodukte, AWS für Pionierforschung und groß angelegte Schulungen und möglicherweise Google Cloud oder Oracle für spezielle Edge-Inferenzaufgaben.
Vorausschauende Analyse: Die Ära der „Siliziumsouveränität“.
Die 38-Milliarden-Dollar-Wette ist der erste große Dominostein, der in der Ära der „Siliziumsouveränität“ fällt. Die Branche entfernt sich von einer Welt, in der ein Unternehmen (NVIDIA) die Chips entwickelt und drei Unternehmen (Amazon, Microsoft, Google) sie vermieten. Der Übergang erfolgt in Richtung Vertikale Integration.
Die Zukunft der „CUDA-Lücke“
NVIDIA steht nicht still und die Blackwell B200-Serie bleibt der Leistungskönig für rohe, nicht optimierte Workloads. Für Unternehmen in der Größenordnung von OpenAI schließt sich jedoch die „CUDA-Lücke“ – der Softwarevorteil von NVIDIA. Wenn Sie 2.000 Spitzeningenieure haben, lohnt es sich, sechs Monate in die Optimierung für AWS-Silizium zu investieren, wenn dadurch 10 Milliarden US-Dollar an Cloud-Kosten eingespart werden.
Was kommt als nächstes?
- Der Preiskrieg: Erwarten Sie, dass AWS anderen Tier-1-Laboren „Preise auf OpenAI-Niveau“ anbietet, um sie aggressiv von Azure wegzulocken. Wenn Anthropic und OpenAI beide auf AWS laufen, wird die gravitometrische Anziehungskraft für KI-Forscher auf AWS nahezu unwiderstehlich.
- Antwort von Microsoft: Achten Sie darauf, dass Microsoft die Einführung seiner eigenen „Maia“-KI-Chips beschleunigt. Wenn Microsoft nicht mit der Siliziumeffizienz von AWS mithalten kann, besteht die Gefahr, dass sie zu einem „Dummkopf“ werden, der NVIDIA-Hardware einfach zu einem Preis weiterverkauft, den sich die Labore nicht mehr leisten können.
- Das „Energietor“: Der nächste Engpass sind nicht Chips; Es handelt sich um Transformatoren, insbesondere um elektrische Transformatoren, nicht um KI-Transformatoren. Der AWS-Deal enthält Bestimmungen für die Beschaffung erneuerbarer Energien, eine Erkenntnis, dass die 38 Milliarden US-Dollar nur ausgegeben werden können, wenn ein Netz vorhanden ist, das die Last bewältigen kann.
Das Endergebnis für Sie
Wenn Sie ein Investor oder ein Technologieführer sind, ist die Erkenntnis klar: Computing-Diversifizierung ist die neue Überlebensstrategie. Die Ära, in der alles auf einen einzigen Hardware-Anbieter oder einen einzigen Cloud-Anbieter gesetzt wurde, ist vorbei. Der Wechsel von OpenAI zu AWS ist ein Signal dafür, dass sich der KI-Infrastrukturmarkt endlich zu einer wettbewerbsorientierten Multi-Vendor-Landschaft entwickelt.
Bei der 38-Milliarden-Dollar-Wette geht es nicht nur um die Zukunft von OpenAI; Es ist eine Blaupause dafür, wie die nächste Phase der KI-Revolution finanziert und betrieben werden soll. Die „Cloud Wars“ sind gerade in ihre nukleare Phase eingetreten.
Weitere technische Einblicke in die KI-Infrastruktur finden Sie in der Analyse von Anthropics 50-Milliarden-Dollar-AWS-Wette oder sehen Sie, wie Googles TPU-Strategie den Status Quo in Frage stellt.
🦋 Discussion on Bluesky
Discuss on Bluesky