Points clés à retenir
- Sora est mort après six mois : OpenAI a fermé son application vidéo d’IA (intelligence artificielle) le 24 mars 2026, après avoir gagné seulement 2,1 millions de dollars de revenus totaux dans l’application contre des coûts d’inférence maximaux estimés à 15 millions de dollars par jour.
- Le mur des coûts d’inférence est structurel : la génération d’un seul clip vidéo IA coûte 10 à 50 fois plus de calcul qu’une conversation textuelle ChatGPT. Aucun modèle de tarification ne peut combler cet écart à l’échelle du consommateur à partir de mars 2026.
- Voici le manuel de jeu Iridium : En 1999, la construction du système de téléphonie par satellite Iridium de Motorola a coûté 5 milliards de dollars et fonctionnait parfaitement. Elle a fait faillite en neuf mois parce que les appels coûtaient 5 $ la minute tandis que le cellulaire tombait à quelques centimes. Sora est mort de la même maladie : une technologie parfaite, une économie impossible.
- L’IA grand public fait face à un bilan : si OpenAI, avec des milliards de dollars de soutien, ne peut pas rentabiliser la génération vidéo, toute la catégorie des produits d’IA grand public à forte capacité de calcul est en alerte.
Six mois, 2,1 millions de dollars et un cadavre à 1 milliard de dollars
Le 24 mars 2026, OpenAI a posté un adieu sur X : « Nous disons au revoir à l’application Sora. »
La déclaration était polie, reconnaissante et complètement dénuée du chiffre qui comptait : le revenu total des achats intégrés de Sora sur toute sa durée de vie s’élevait à 2,1 millions de dollars.
Ce n’est pas une faute de frappe. Deux virgule un million de dollars. Total. Plus de six mois. D’une application qui a atteint la première place dans la catégorie Photo et vidéo de l’App Store dans les 24 heures suivant son lancement en septembre 2025 et a culminé à 3,33 millions de téléchargements en novembre.
Pendant ce temps, Deepak Mathivanan, analyste chez Cantor Fitzgerald, a estimé les coûts d’inférence maximaux de Sora à environ 15 millions de dollars par jour, fixant chaque génération de clip à environ 1,30 dollars en calcul. À ce taux d’utilisation, les six mois de revenus de Sora ne couvriraient pas trois heures et demie de calcul de pointe.
$\text{Hours of compute covered by total revenue} = \frac{$2.1\text{M}}{$15\text{M/day}} \times 24 \approx 3.4 \text{ hours}$
L’accord Disney d’un milliard de dollars signé en décembre 2025, couvrant les licences de personnages pour Disney, Marvel, Pixar et Star Wars, est également mort. Aucun argent n’a jamais changé de mains.
Bill Peebles, le propre responsable de Sora chez OpenAI, a admis sur les réseaux sociaux que “l’économie est actuellement totalement insoutenable”.
Ce n’est pas l’histoire d’un mauvais produit. C’est l’histoire d’un mur structurel que tout produit d’IA grand public à forte capacité de calcul va heurter.
Le mur des coûts d’inférence : pourquoi la vidéo brise les calculs
Pour comprendre pourquoi Sora est mort, vous devez comprendre la différence entre entraîner un modèle et en exécuter un.
La formation est un coût unique. Vous dépensez des centaines de millions de dollars pour apprendre au modèle à comprendre la vidéo, et ce coût est ensuite amorti pour toujours sur chaque utilisateur. Le cycle d’investissement hyperscaler que ce site a [couvert en détail] (/markets/the-600b-gamble-ai-capex-valley-of-death) est en grande partie une histoire de formation et d’infrastructure.
L’inférence est un coût par utilisation. Chaque fois qu’un utilisateur clique sur « générer », le modèle s’exécute. Et l’inférence vidéo est un monstre. Un seul clip vidéo de haute qualité nécessite 10 à 50 fois plus de calcul qu’une conversation ChatGPT typique. Un utilisateur générant 20 vidéos par mois consommait plus de calcul qu’un millier de sessions de texte.
Voici le calcul qui a tué Sora :
| Métrique | ChatGPT (Texte) | Sora (Vidéo) |
|---|---|---|
| Calculer par interaction | 1x (référence) | 10-50x |
| Prix de l’abonnement | \20$/mois | $20/mois (groupé) |
| Revenu par unité de calcul | Durable | ~2% du coût |
| Comportement des utilisateurs | Quotidien, habituel | Épisodique, basé sur des projets |
ChatGPT fonctionne parce que l’inférence de texte est suffisamment bon marché pour qu’un abonnement de 20 $/mois la couvre. Sora a fait faillite parce que l’inférence vidéo est 10 à 50 fois plus chère, mais les utilisateurs n’étaient pas prêts à payer 10 à 50 fois plus. Ils s’attendaient à ce qu’il soit groupé ou bon marché, tout comme le texte.
Il s’agit du mur des coûts d’inférence : l’écart entre les coûts d’exécution d’une IA gourmande en calcul et ce que les consommateurs paieront pour l’utiliser. Pour l’IA textuelle, cet écart s’est comblé. Pour l’IA vidéo, ce n’est pas le cas.
L’effondrement de la rétention : personne n’est revenu
Le coût ne représentait que la moitié du problème. L’autre moitié était que personne n’avait besoin de Sora plus d’une fois.
En février 2026, moins de 5 % des utilisateurs inscrits à Sora revenaient chaque mois. Les téléchargements sont passés de 3,33 millions en novembre 2025 à 1,13 million en février 2026, soit une baisse de 66 % en trois mois.
Le schéma était clair : les utilisateurs généraient une poignée de clips pour un projet ou une curiosité spécifique, puis ne revenaient jamais. La génération de vidéos IA est intrinsèquement épisodique plutôt qu’habituelle. Vous n’ouvrez pas Sora pendant le petit-déjeuner de la même manière que vous ouvrez ChatGPT. Vous l’utilisez lorsque vous avez besoin d’un clip pour une présentation ou une publication sociale, et vous avez ensuite terminé pendant des semaines.
Cela signifiait que Sora dépensait environ 15 millions de dollars par jour pour servir une base d’utilisateurs à la fois en diminution et à peine engagée. Comparez cela aux 900 millions d’utilisateurs actifs hebdomadaires signalés par ChatGPT, qui génèrent une demande récurrente et habituelle qui justifie l’infrastructure.
Et le fossé concurrentiel s’est évaporé presque immédiatement. Runway Gen-3 a été lancé en octobre 2025, Kling 2.0 en novembre et Google Veo 2 en janvier 2026, atteignant tous une qualité comparable ou supérieure en quelques mois. Lorsqu’OpenAI a tenté de faire évoluer Sora pour un accès plus large, la qualité s’est considérablement dégradée et les utilisateurs l’ont remarqué. Il n’y avait aucun coût de commutation, aucun verrouillage des données et aucun effet de réseau.
Le parallèle Iridium : technologie parfaite, économie impossible
Cela s’est déjà produit.
En 1998, Motorola a lancé Iridium, un réseau de téléphonie par satellite dont la construction a coûté 5 milliards de dollars. Cela a fonctionné exactement comme annoncé : vous pouviez passer un appel téléphonique depuis n’importe où sur Terre, du milieu de l’océan Pacifique jusqu’au sommet du mont Everest. La technologie était un véritable triomphe technique.
Elle a fait faillite le 13 août 1999, neuf mois après son lancement.
La technologie n’était pas le problème. L’économie l’était. Les combinés Iridium coûtent 3 000 $ et les appels durent jusqu’à 5 $ par minute. Pendant ce temps, les réseaux cellulaires terrestres se développaient rapidement et baissaient leurs prix à quelques centimes par minute. Iridium prévoit 500 000 abonnés ; il en a eu 10 000.
Après la faillite, Iridium a été vendue pour 25 millions de dollars, soit une perte de 99,5 % pour les investisseurs d’origine. Les satellites ont continué à fonctionner. Un nouveau propriétaire a restructuré l’entreprise, ciblé des marchés de niche (industrie maritime, militaire et éloignée) et a fait d’Iridium une entreprise rentable avec un chiffre d’affaires de 831 millions de dollars en 2024.
Les parallèles avec Sora sont précis :
| Facteur | Iridium (1998) | Sora (2025-2026) |
|---|---|---|
| Technologie | A parfaitement fonctionné | A parfaitement fonctionné |
| Coût des infrastructures | \5 milliards de dollars | HNE. $500M-$2B en calcul |
| Économie par utilisation | $5/minute d’appels | ~$1,30/génération de clip |
| Alternative moins chère | Cellulaire ($0,10/min) | Texte AI ($0,001/requête) |
| Fidélisation des utilisateurs | Prévisions 10K contre 500K | 5 % de rétention mensuelle |
| Il est temps d’échouer | 9 mois | 6 mois |
| Que s’est-il passé ensuite | Vendu pour 25 M$, reconstruit | Calcul redirigé vers ChatGPT |
La leçon d’Iridium n’est pas que les téléphones satellites étaient stupides. Le problème est que l’économie consistant à desservir un marché de masse avec une technologie coûteuse ne fonctionne pas lorsqu’une alternative moins chère couvre la grande majorité des cas d’utilisation. “l’alternative moins chère” de Sora n’est pas un autre générateur vidéo. C’est du texte.
La zone grise : les coûts diminuent, mais pas assez rapidement
C’est ici que les pessimistes de Sora doivent freiner.
Les coûts d’inférence de l’IA ont chuté. L’exécution d’un modèle de classe GPT-4 coûtait environ 20 $ par million de jetons fin 2022. Début 2026, des performances équivalentes coûteraient 0,40 $ par million de jetons, soit une réduction de 1 000 fois en un peu plus de trois ans.
Gartner a publié une prévision le 25 mars 2026, un jour après la mort de Sora, prévoyant que les coûts d’inférence pour un modèle comportant un billion de paramètres diminueront de 90 % supplémentaires d’ici 2030.
Quatre forces combinées sont à l’origine de ce déclin : les gains d’efficacité matérielle offrant un débit 2 à 3 fois plus élevé par génération de GPU (Graphics Processing Unit), l’optimisation logicielle poussant l’utilisation du GPU de 30 à 40 % à 70 à 80 %, les améliorations de l’architecture des modèles telles que MoE (Mixture-of-Experts) offrant un calcul par jeton 3 à 5 fois inférieur et les techniques de quantification réduisant les besoins en mémoire de 2 à 4 fois.
La question n’est pas de savoir si la vidéo IA deviendra abordable. C’est quand. Même avec une nouvelle amélioration de 10 fois par rapport aux coûts de mars 2026, la génération de vidéos à environ 0,13 $ par clip ne fonctionne toujours pas à l’échelle où la publicité ou les abonnements bon marché peuvent l’absorber. Atteindre des coûts de production inférieurs à un centime, là où l’économie à l’échelle du consommateur commence à respirer, nécessitera probablement les 90 % de réduction supplémentaires projetés par Gartner d’ici 2030.
La suite d’Iridium est ici instructive. La communication par satellite n’est pas morte. Il est devenu moins cher, a trouvé des marchés de niche et est finalement devenu viable. Iridium compte plus d’un million d’abonnés en 2018. Mais il a fallu 20 ans et une réinvention complète du modèle économique.
La vidéo IA grand public suivra la même trajectoire. La technologie survivra. Les aspects économiques finiront par fonctionner. Mais les entreprises qui financent le déficit d’ici là vont saigner.
Ce qui meurt ensuite : le bilan de l’IA grand public
Sora n’est pas la dernière victime. C’est le canari dans la mine de charbon.
Chaque produit d’IA qui dépend d’inférences lourdes se trouve face au même mur. À mesure que vous dépassez le texte, la situation économique se détériore :
| Catégorie de produit | Coût d’inférence par rapport au texte | Sensibilité aux prix à la consommation | Viabilité (mars 2026) |
|---|---|---|---|
| Chat textuel (ChatGPT) | 1x | Faible ($20/mois de travail) | Viable |
| Génération d’images | 5-10x | Moyen | Marginal |
| Génération audio/musique | 10-20x | Élevé | À risque |
| Génération vidéo | 10-50x | Très élevé | Mort (pour l’instant) |
| 3D/Jeu en temps réel | 50-100x | Extrême | Non viable |
Plus on s’éloigne du texte vers des médias plus riches, plus la situation économique se détériore. Chaque augmentation de l’intensité de calcul atteint le même mur de coûts d’inférence. Et les consommateurs ont été formés par deux décennies de services Internet gratuits à s’attendre à ce que l’IA soit bon marché ou gratuite.
Cela conduit à une division structurelle : L’IA devient un outil d’entreprise, et non un produit de consommation. Les entreprises peuvent absorber des coûts par utilisateur plus élevés pour les outils vidéo d’IA qui remplacent une équipe de production vidéo. Les consommateurs ne le peuvent pas et ne le feront pas.
OpenAI semble comprendre cela. Leur déclaration officielle citait un pivot vers « la recherche mondiale sur la simulation pour faire progresser la robotique qui aidera les gens à résoudre des tâches physiques du monde réel ». Traduction : applications d’entreprise et industrielles où le client peut payer la facture de calcul.
Les mathématiques de l’introduction en bourse : pourquoi Sora devait mourir maintenant
Il y a ici une dimension stratégique qui échappe au récit de « l’échec du produit ».
OpenAI se prépare à une introduction en bourse. Chaque dollar de calcul brûlé sur Sora était un dollar qui ne rapportait pas de revenus via ChatGPT, leur produit qui rapporte réellement de l’argent. Les budgets de dépenses en capital étant déjà répartis dans l’ensemble du secteur, l’allocation de calcul est un jeu à somme nulle.
Tuer Sora ne signifiait pas seulement réduire les pertes. Il s’agissait d’une optimisation du portefeuille. OpenAI a choisi de rediriger la capacité GPU de Sora vers ChatGPT et son activité API (Application Programming Interface), où fonctionne l’économie de l’unité. Pour une entreprise en voie d’introduction en bourse, c’est rationnel : montrer aux investisseurs un chemin vers la rentabilité en fermant le fourneau de l’argent.
L’échec de l’accord Disney renforce ce constat. Un investissement d’un milliard de dollars semble énorme, mais cela n’aurait pas changé l’économie de l’unité de Sora. Si la génération de clips coûte 1,30 $ chacun et que les utilisateurs ne paieront pas plus de quelques dollars par mois, aucun montant d’IP Disney ne change le calcul.
La règle de l’Iridium pour les investisseurs en IA
Chaque bulle technologique suit un modèle : construire l’infrastructure, découvrir que l’économie ne fonctionne pas, s’effondrer, puis reconstruire sur les décombres. La perte de 5 milliards de dollars d’Iridium s’est transformée en une acquisition de 25 millions de dollars qui est devenue une société générant un chiffre d’affaires annuel de 831 millions de dollars.
L’infrastructure ne disparaît pas. Les investisseurs le font.
Pour tous ceux qui évaluent actuellement les entreprises d’IA, la règle d’Iridium est simple : séparez la question technologique de la question économique. “Ce modèle d’IA fonctionne-t-il ?” est une question différente de « Ce modèle d’IA peut-il générer plus de revenus qu’il n’en coûte pour fonctionner ? » Sora a répondu « oui » à la première et « absolument pas » à la seconde.
Les entreprises qui survivront au mur des coûts d’inférence sont celles qui servent des clients qui peuvent se permettre le calcul : entreprises, gouvernements et industries spécialisées. Les entreprises qui parient sur la vidéo, la musique et la génération en temps réel d’IA grand public à des prix d’abonnement construisent des téléphones Iridium dans un monde cellulaire.
La technologie est réelle. Les coûts baissent. Mais l’écart entre le niveau des coûts d’inférence en mars 2026 et celui où ils devraient se situer pour la viabilité du consommateur se mesure en années et non en mois. Sora était en avance de six mois pour une fête qui ne commencerait pas avant la fin de la décennie.
Nos sources
- Deeper Insights - OpenAI Shuts Down Sora AI
- Digital Applied - Why OpenAI Killed Sora Analysis
- CNBC - OpenAI Shutters Sora Short-Form Video App
- AI Certs - Sora Daily Inference Cost Estimate
- Gartner - Inference Cost Projections to 2030
- GPUnex - AI Inference Economics 1000x Cost Collapse
- Iridium Communications - Wikipedia
- HPC Wire - OpenAI Shutters Sora Shifts Strategy Ahead of IPO
- Variety - OpenAI Shutting Down Sora Video Platform
🦋 Discussion on Bluesky
Discuss on Bluesky