Link kopiert!

OpenAI hat 15 Millionen Dollar pro Tag für Sora ausgegeben. Es hat 2 Millionen Dollar verdient. Insgesamt.

OpenAI hat Sora am 24. März nach sechs Monaten und 2,1 Millionen Dollar Gesamtumsatz eingestellt. Analysten schätzten die Spitzenkosten für Inferenz auf 15 Millionen Dollar pro Tag. Die Kluft zwischen dem, was Verbraucher zu zahlen bereit sind, und den Kosten für die Ausführung von KI-Videos zeigt eine strukturelle Mauer, der sich jedes KI-Produkt für Verbraucher stellen muss.

🌐
Automatische Übersetzung

Dieser Artikel wurde automatisch aus dem englischen Original übersetzt. Zum englischen Original

Ein riesiges, leuchtendes GPU-Server-Rack, das weißglühend brennt, mit einem kleinen Haufen Münzen auf dem Boden darunter, der die Kluft zwischen KI-Rechenkosten und Verbrauchereinnahmen darstellt.

Wichtige Erkenntnisse

  • Sora ist nach sechs Monaten tot: OpenAI hat seine KI-Video-App (Künstliche Intelligenz) am 24. März 2026 eingestellt, nachdem es insgesamt nur 2,1 Millionen US-Dollar an In-App-Einnahmen erzielt hatte, bei geschätzten Spitzeninferenzkosten von 15 Millionen US-Dollar pro Tag.
  • Die Inferenzkostenmauer ist strukturell: Das Generieren eines einzelnen KI-Videoclips kostet 10-50x mehr Rechenleistung als eine ChatGPT-Textkonversation. Kein Preismodell kann diese Lücke im Verbrauchermaßstab ab März 2026 schließen.
  • Das ist das Iridium-Playbook: Im Jahr 1999 kostete der Bau des Iridium-Satellitentelefonsystems von Motorola 5 Milliarden US-Dollar und funktionierte perfekt. Es ging innerhalb von neun Monaten bankrott, weil Anrufe 5 $ pro Minute kosteten, während Mobilfunk auf ein paar Cent sank. Sora starb an derselben Krankheit: perfekte Technologie, unmögliche Wirtschaftlichkeit.
  • Verbraucher-KI steht vor einer Abrechnung: Wenn OpenAI, mit Milliarden an Unterstützung, die Videoerzeugung nicht lohnenswert machen kann, ist die gesamte Kategorie rechenintensiver Verbraucher-KI-Produkte in Gefahr.

Sechs Monate, 2,1 Millionen Dollar und eine Leiche im Wert von 1 Milliarde Dollar

Am 24. März 2026 veröffentlichte OpenAI einen Abschiedsgruß auf X: „Wir verabschieden uns von der Sora-App.“

Die Aussage war höflich, dankbar und ließ völlig die Zahl außer Acht, auf die es ankam: Soras Gesamteinnahmen aus In-App-Käufen beliefen sich auf Lebenszeit auf 2,1 Millionen US-Dollar.

Advertisement

Das ist kein Tippfehler. Zwei Komma eine Million Dollar. Gesamt. Über sechs Monate. Von einer App, die innerhalb von 24 Stunden nach ihrer Einführung im September 2025 Platz 1 in der Kategorie „Foto & Video“ im App Store erreichte und im November mit 3,33 Millionen Downloads ihren Höhepunkt erreichte.

Unterdessen schätzte Cantor-Fitzgerald-Analyst Deepak Mathivanan die maximalen Inferenzkosten von Sora auf etwa 15 Millionen US-Dollar pro Tag, wobei jede Clip-Generierung etwa 1,30 US-Dollar an Rechenleistung kostete. Bei dieser Burn-Rate würde der gesamte sechsmonatige Umsatz von Sora nicht dreieinhalb Stunden Spitzenrechenleistung decken.

$\text{Hours of compute covered by total revenue} = \frac{$2.1\text{M}}{$15\text{M/day}} \times 24 \approx 3.4 \text{ hours}$

Der im Dezember 2025 unterzeichnete Disney-Vertrag über eine Milliarde US-Dollar, der die Charakterlizenzierung für Disney, Marvel, Pixar und Star Wars abdeckt, ist ebenfalls tot. Kein Geld hat jemals den Besitzer gewechselt.

Bill Peebles, OpenAIs eigener Sora-Chef, gab in den sozialen Medien zu, dass „die Wirtschaft derzeit völlig unhaltbar ist“.

Dies ist keine Geschichte über ein schlechtes Produkt. Es ist eine Geschichte über eine strukturelle Mauer, an die jedes rechenintensive KI-Produkt für Verbraucher stößt.

Die Inferenzkostenmauer: Warum Videos die Rechnung sprengen

Um zu verstehen, warum Sora gestorben ist, müssen Sie den Unterschied zwischen dem Trainieren eines Modells und dem Ausführen eines Modells verstehen.

Für die Schulung fallen einmalige Kosten an. Sie geben Hunderte Millionen Dollar aus, um dem Modell beizubringen, Videos zu verstehen, und dann amortisieren sich diese Kosten für jeden Benutzer für immer. Der Hyperscaler-Investitionszyklus, den diese Website ausführlich behandelt hat, ist größtenteils eine Schulungs- und Infrastrukturgeschichte.

Bei der Schlussfolgerung handelt es sich um Kosten pro Nutzung. Jedes Mal, wenn ein Benutzer auf „Generieren“ klickt, wird das Modell ausgeführt. Und Videoinferenz ist ein Monster. Ein einzelner hochwertiger Videoclip erfordert 10–50-mal mehr Rechenleistung als eine typische ChatGPT-Konversation. Ein Benutzer, der 20 Videos pro Monat generiert, verbraucht mehr Rechenleistung als tausend Textsitzungen.

Advertisement

Hier ist die Mathematik, die Sora getötet hat:

MetrischChatGPT (Text)Sora (Video)
Berechnung pro Interaktion1x (Grundlinie)10-50x
Abonnementpreis$20/Monat$20/Monat (gebündelt)
Umsatz pro RecheneinheitNachhaltig~2 % der Kosten
NutzerverhaltenTäglich, gewohnheitsmäßigEpisodisch, projektbasiert

ChatGPT funktioniert, weil die Textinferenz so günstig ist, dass ein Abonnement für 20 $/Monat dies abdeckt. Sora ist pleite gegangen, weil die Videoinferenz 10- bis 50-mal teurer ist, die Benutzer aber nicht bereit waren, 10- bis 50-mal mehr zu zahlen. Sie erwarteten es gebündelt oder günstig, genau wie Text.

Dies ist die Inferenzkostenmauer: die Lücke zwischen den Betriebskosten rechenintensiver KI und dem, was Verbraucher für ihre Nutzung zahlen werden. Bei der Text-KI hat sich diese Lücke geschlossen. Für Video-KI ist dies nicht der Fall.

Der Retention-Kollaps: Niemand kam zurück

Die Kosten waren nur das halbe Problem. Die andere Hälfte war, dass niemand Sora mehr als einmal brauchte.

Bis Februar 2026 kehrten weniger als 5 % der Benutzer, die sich bei Sora angemeldet hatten, monatlich zurück. Die Downloads sanken von 3,33 Millionen im November 2025 auf 1,13 Millionen im Februar 2026, ein Rückgang um 66 % in drei Monaten.

Das Muster war klar: Benutzer erstellten eine Handvoll Clips für ein bestimmtes Projekt oder eine Kuriosität und kamen dann nie wieder zurück. Die Erstellung von KI-Videos erfolgt von Natur aus eher episodisch als gewohnheitsmäßig. Sie öffnen Sora beim Frühstück nicht auf die Art und Weise, wie Sie ChatGPT öffnen. Sie verwenden es, wenn Sie einen Clip für eine Präsentation oder einen Social-Media-Beitrag benötigen, und dann sind Sie wochenlang fertig.

Das bedeutete, dass Sora schätzungsweise 15 Millionen US-Dollar pro Tag verschwendete, um eine sowohl schrumpfende als auch kaum engagierte Nutzerbasis zu bedienen. Vergleichen Sie das mit den gemeldeten 900 Millionen wöchentlichen aktiven Nutzern von ChatGPT, die eine wiederkehrende, gewohnheitsmäßige Nachfrage erzeugen, die die Infrastruktur rechtfertigt.

Und der Wettbewerbsvorteil verschwand fast sofort. Runway Gen-3 kam im Oktober 2025 auf den Markt, Kling 2.0 im November und Google Veo 2 im Januar 2026 und erreichten alle innerhalb weniger Monate eine vergleichbare oder bessere Qualität. Als OpenAI versuchte, Sora für einen breiteren Zugriff zu skalieren, verschlechterte sich die Qualität dramatisch, und die Benutzer bemerkten es. Es gab keine Umstellungskosten, keine Datenbindung und keinen Netzwerkeffekt.

Advertisement

Die Iridium-Parallele: Perfekte Technologie, unmögliche Wirtschaftlichkeit

Das ist schon einmal passiert.

Im Jahr 1998 startete Motorola Iridium, ein Satellitentelefonnetz, dessen Aufbau 5 Milliarden US-Dollar kostete. Es funktionierte genau wie angekündigt: Sie konnten von überall auf der Erde aus telefonieren, von der Mitte des Pazifischen Ozeans bis zum Gipfel des Mount Everest. Die Technologie war ein echter technischer Triumph.

Am 13. August 1999, neun Monate nach dem Start, ging das Unternehmen bankrott.

Die Technologie war nicht das Problem. Die Wirtschaft war. Iridium-Handys kosten 3.000 $ und Anrufe kosten bis zu 5 $ pro Minute. Unterdessen expandierten terrestrische Mobilfunknetze schnell und ihre Preise sanken auf wenige Cent pro Minute. Iridium prognostiziert 500.000 Abonnenten; es waren 10.000.

Nach der Insolvenz wurde Iridium für 25 Millionen US-Dollar verkauft, ein Verlust von 99,5 % für die ursprünglichen Investoren. Die Satelliten funktionierten weiter. Ein neuer Eigentümer strukturierte das Unternehmen um, zielte auf Nischenmärkte (Seefahrt, Militär, Fernindustrie) ab und baute Iridium zu einem profitablen Unternehmen mit einem Umsatz von 831 Millionen US-Dollar im Jahr 2024 aus.

Die Parallelen zu Sora sind eindeutig:

FaktorIridium (1998)Sora (2025-2026)
TechnologieHat perfekt funktioniertHat perfekt funktioniert
Infrastrukturkosten$5 MilliardenSchätzung: 500 Mio. $ bis 2 Milliarden $ an Rechenleistung
Wirtschaftlichkeit pro Nutzung$5/Minute Anrufe~$1,30/Clip-Generierung
Günstigere AlternativeMobilfunk ($0,10/Min.)Text-KI ($0,001/Abfrage)
Benutzerbindung10K vs. 500K Prognose5 % monatlicher Selbstbehalt
Zeit zum Scheitern9 Monate6 Monate
Was geschah als nächstesFür 25 Mio. $ verkauft, umgebautComputing wird an ChatGPT

Die Lehre von Iridium ist nicht, dass Satellitentelefone dumm waren. Es ist so, dass die Wirtschaftlichkeit, einen Massenmarkt mit teurer Technologie zu bedienen, nicht funktioniert, wenn eine günstigere Alternative die überwiegende Mehrheit der Anwendungsfälle abdeckt. Soras „billigere Alternative“ ist kein weiterer Videogenerator. Es ist Text.

Die Grauzone: Die Kosten sinken, nur nicht schnell genug

Hier müssen die Sora-Pessimisten auf die Bremse treten.

Die Kosten für KI-Inferenz sind stark gesunken. Der Betrieb eines GPT-4-Klasse-Modells kostete Ende 2022 etwa 20 $ pro Million Token. Bis Anfang 2026 kostete die entsprechende Leistung 0,40 $ pro Million Token, was einer 1.000-fachen Reduzierung in etwas mehr als drei Jahren entspricht.

Gartner veröffentlichte am 25. März 2026, einen Tag nach Soras Tod, eine Prognose, in der prognostiziert wird, dass die Inferenzkosten für ein Modell mit einer Billion Parameter bis 2030 um weitere 90 % sinken werden.

Vier zusammenwirkende Kräfte treiben diesen Rückgang voran: Hardware-Effizienzsteigerungen, die einen zwei- bis dreimal höheren Durchsatz pro GPU-Generation (Graphics Processing Unit) liefern, Softwareoptimierung, die die GPU-Auslastung von 30-40 % auf 70-80 % steigert, Modellarchitekturverbesserungen wie MoE (Mixture-of-Experts), die eine drei- bis fünfmal geringere Rechenleistung pro Token liefern, und Quantisierungstechniken, die den Speicherbedarf um das Zwei- bis Vierfache senken.

Die Frage ist nicht, ob KI-Video erschwinglich wird. Es ist wann. Selbst bei einer weiteren 10-fachen Verbesserung gegenüber den Kosten vom März 2026 funktioniert die Videogenerierung mit etwa 0,13 $ pro Clip immer noch nicht in dem Umfang, in dem Werbung oder günstige Abonnements dies absorbieren könnten. Das Erreichen von Erzeugungskosten unter einem Penny, bei denen die Wirtschaftlichkeit im Verbrauchermaßstab zu atmen beginnt, erfordert wahrscheinlich die zusätzliche Reduzierung um 90 %, die Gartner bis 2030 prognostiziert.

Die Fortsetzung von Iridium ist hier aufschlussreich. Die Satellitenkommunikation ist nicht ausgestorben. Es wurde billiger, fand Nischenmärkte und wurde schließlich rentabel. Iridium bedient seit 2018 über eine Million Abonnenten. Aber es dauerte 20 Jahre und eine völlige Neugestaltung des Geschäftsmodells.

Verbraucher-KI-Videos werden den gleichen Weg einschlagen. Die Technologie wird überleben. Die Ökonomie wird irgendwann funktionieren. Aber die Unternehmen, die die Lücke bis dahin finanzieren, werden bluten.

Was als nächstes stirbt: Die Verbraucher-KI-Abrechnung

Sora ist nicht das letzte Opfer. Es ist der Kanarienvogel im Kohlebergwerk.

Jedes KI-Produkt, das auf starke Schlussfolgerungen angewiesen ist, steht vor derselben Herausforderung. Wenn Sie über den Text hinausgehen, wird die Wirtschaftlichkeit schlechter:

ProduktkategorieInferenzkosten vs. TextPreissensibilität der VerbraucherLebensfähigkeit (März 2026)
Text-Chat (ChatGPT)1xNiedrig ($20/Monat funktioniert)Lebensfähig
Bilderzeugung5-10xMittelRand
Audio-/Musikgenerierung10-20xHochIn Gefahr
Videogenerierung10-50xSehr hochTot (vorerst)
Echtzeit-3D/Spiel50-100xExtremNicht lebensfähig

Je weiter man sich vom Text zu reichhaltigeren Medien bewegt, desto schlechter wird die wirtschaftliche Lage. Jeder Anstieg der Rechenintensität stößt auf die gleiche Grenze der Inferenzkosten. Und Verbraucher wurden durch zwei Jahrzehnte kostenloser Internetdienste darauf trainiert, zu erwarten, dass KI billig oder kostenlos ist.

Dies führt zu einer strukturellen Spaltung: KI wird zu einem Unternehmenstool, nicht zu einem Verbraucherprodukt. Unternehmen können höhere Kosten pro Benutzer für KI-Videotools verkraften, die ein Videoproduktionsteam ersetzen. Verbraucher können und wollen es nicht.

OpenAI scheint dies zu verstehen. In ihrer offiziellen Erklärung wurde ein Schwerpunkt auf „Weltsimulationsforschung zur Weiterentwicklung der Robotik, die Menschen bei der Lösung realer, physikalischer Aufgaben helfen wird“ genannt. Übersetzung: Unternehmens- und Industrieanwendungen, bei denen sich der Kunde die Rechenrechnung leisten kann.

Die IPO-Mathematik: Warum Sora jetzt sterben musste

Hier gibt es eine strategische Dimension, die in der Erzählung vom „Produktversagen“ außer Acht gelassen wird.

OpenAI bereitet sich auf einen Börsengang vor. Jeder Dollar an Rechenleistung, der auf Sora verbrannt wurde, war ein Dollar, der keine Einnahmen durch ChatGPT erzielte, ihr Produkt, das tatsächlich Geld verdient. Da die Investitionsbudgets in der gesamten Branche bereits überlastet sind, ist die Rechenleistungszuweisung ein Nullsummenspiel.

Sora zu töten bedeutete nicht nur, Verluste zu reduzieren. Es ging um Portfoliooptimierung. OpenAI entschied sich dafür, die GPU-Kapazität von Sora auf ChatGPT und sein API-Geschäft (Application Programming Interface) umzuleiten, wo die Einheitsökonomie funktioniert. Für ein IPO-Unternehmen ist das rational: Zeigen Sie den Anlegern einen Weg zur Rentabilität, indem Sie den Geldkessel abschalten.

Das Scheitern des Disney-Deals verstärkt dies. Eine Investition von einer Milliarde US-Dollar klingt enorm, hätte aber die Wirtschaftlichkeit der Sora-Einheit nicht verändert. Wenn die Erstellung von Clips jeweils 1,30 US-Dollar kostet und die Benutzer nicht mehr als ein paar US-Dollar pro Monat zahlen, ändert kein Betrag an Disney-IP etwas an der Rechnung.

Die Iridium-Regel für KI-Investoren

Jede Technologieblase folgt einem Muster: Infrastruktur aufbauen, feststellen, dass die Wirtschaft nicht funktioniert, abstürzen und dann auf den Trümmern wieder aufbauen. Iridiums Verlust von 5 Milliarden US-Dollar wurde zu einer Übernahme von 25 Millionen US-Dollar, die zu einem Unternehmen mit einem Jahresumsatz von 831 Millionen US-Dollar führte.

Die Infrastruktur verschwindet nicht. Die Investoren tun es.

Für alle, die derzeit KI-Unternehmen bewerten, ist die Iridium-Regel einfach: Trennen Sie die Technologiefrage von der Wirtschaftsfrage. „Funktioniert dieses KI-Modell?“ ist eine andere Frage als „Kann dieses KI-Modell mehr Umsatz generieren, als seine Ausführung kostet?“ Sora antwortete auf die erste Frage mit „Ja“ und auf die zweite Frage mit „auf keinen Fall“.

Die Unternehmen, die die Kostenschwelle für Inferenzen überleben werden, sind diejenigen, die Kunden bedienen, die sich die Rechenleistung leisten können: Unternehmen, Regierungen und spezialisierte Branchen. Die Unternehmen, die zu Abonnementpreisen auf KI-Videos, Musik und Echtzeitgenerierung für den Massenmarkt setzen, bauen Iridium-Telefone in einer Mobilfunkwelt.

Die Technologie ist real. Die Kosten sinken. Aber die Lücke zwischen dem Stand der Inferenzkosten im März 2026 und dem Stand, den sie für die Rentabilität für den Verbraucher haben müssen, wird in Jahren und nicht in Monaten gemessen. Sora kam sechs Monate zu früh zu einer Party, die erst am Ende des Jahrzehnts beginnen wird.

Quellen

Advertisement

🦋 Discussion on Bluesky

Discuss on Bluesky

Searching for posts...