Link copiado!

OpenAI gastou $15 milhões/dia em Sora. Ganhou $2 milhões. Total.

OpenAI matou o Sora em 24 de março após seis meses e $2,1 milhões em receita total. Analistas estimaram os custos máximos de inferência em $15 milhões por dia. A lacuna entre o que os consumidores pagarão e o que custa executar o vídeo de IA revela uma barreira estrutural que todo produto de IA para o consumidor deve enfrentar.

🌐
Tradução automática

Este artigo foi traduzido automaticamente do original em inglês. Ler o original em inglês

Um enorme rack de servidores GPU brilhante queimando em branco, com uma pequena pilha de moedas no chão abaixo, representando a lacuna entre os custos de computação de IA e a receita do consumidor.

Principais conclusões

  • Sora está morto após seis meses: OpenAI encerrou seu aplicativo de vídeo de IA (Inteligência Artificial) em 24 de março de 2026, depois de ganhar apenas $ 2,1 milhões em receita total no aplicativo contra custos de inferência de pico estimados de $ 15 milhões por dia.
  • O limite de custos de inferência é estrutural: gerar um único videoclipe de IA custa de 10 a 50 vezes mais computação do que uma conversa de texto ChatGPT. Nenhum modelo de preços pode preencher essa lacuna na escala do consumidor em março de 2026.
  • Este é o manual do Iridium: Em 1999, o sistema de telefonia via satélite Iridium da Motorola custou US$ 5 bilhões para ser construído e funcionou perfeitamente. Ela faliu em nove meses porque as ligações custavam 5 dólares por minuto, enquanto o celular caiu para centavos. Sora morreu da mesma doença: tecnologia perfeita, economia impossível.
  • A IA do consumidor enfrenta um acerto de contas: se a OpenAI, com bilhões em apoio, não conseguir fazer com que a geração de vídeo valha a pena, toda a categoria de produtos de IA de consumo com uso pesado de computação estará alerta.

Seis meses, US$ 2,1 milhões e um cadáver de US$ 1 bilhão

Em 24 de março de 2026, OpenAI postou uma despedida no X: “Estamos nos despedindo do aplicativo Sora”.

Advertisement

A declaração foi educada, grata e completamente desprovida do número que importava: a receita total vitalícia de compras no aplicativo de Sora foi de 2,1 milhões de dólares.

Isso não é um erro de digitação. Dois vírgula um milhão de dólares. Total. Mais de seis meses. De um aplicativo que alcançou o primeiro lugar na categoria Foto e Vídeo da App Store 24 horas após seu lançamento em setembro de 2025 e atingiu o pico de 3,33 milhões de downloads em novembro.

Enquanto isso, Deepak Mathivanan, analista da Cantor Fitzgerald, estimou os custos máximos de inferência de Sora em aproximadamente US$ 15 milhões por dia, fixando cada geração de clipe em aproximadamente US$ 1,30 em computação. Com essa taxa de consumo, os seis meses inteiros de receita de Sora não cobririam três horas e meia de pico de computação.

$\text{Hours of compute covered by total revenue} = \frac{$2.1\text{M}}{$15\text{M/day}} \times 24 \approx 3.4 \text{ hours}$

O acordo de US$ 1 bilhão com a Disney assinado em dezembro de 2025, cobrindo o licenciamento de personagens da Disney, Marvel, Pixar e Star Wars, também morreu. Nenhum dinheiro jamais mudou de mãos.

Bill Peebles, chefe da Sora da OpenAI, admitiu nas redes sociais que “a economia é atualmente completamente insustentável”.

Esta não é uma história sobre um produto ruim. É uma história sobre uma parede estrutural que todo produto de IA de consumo com uso intensivo de computação atingirá.

O muro de custos de inferência: por que o vídeo quebra a matemática

Para entender por que Sora morreu, você precisa entender a diferença entre treinar um modelo e administrar um.

O treinamento é um custo único. Você gasta centenas de milhões de dólares ensinando o modelo a entender o vídeo, e então esse custo é amortizado para cada usuário para sempre. O ciclo de investimentos do hiperescalador que este site tem coberto extensivamente é em grande parte uma história de treinamento e infraestrutura.

Advertisement

A inferência é um custo por uso. Cada vez que um usuário clica em “gerar”, o modelo é executado. E a videoinferência é um monstro. Um único videoclipe de alta qualidade requer de 10 a 50 vezes mais computação do que uma conversa típica do ChatGPT. Um usuário gerando 20 vídeos por mês consumiu mais computação do que mil sessões de texto.

Aqui está a matemática que matou Sora:

MétricaChatGPT (Texto)Sora (Vídeo)
Cálculo por interação1x (linha de base)10-50x
Preço da assinatura$20/mês$20/mês (pacote)
Receita por unidade de computaçãoSustentável~2% do custo
Comportamento do usuárioDiariamente, habitualEpisódico, baseado em projeto

ChatGPT funciona porque a inferência de texto é barata o suficiente para que uma assinatura de $20/mês a cubra. Sora quebrou porque a inferência de vídeo é 10 a 50 vezes mais cara, mas os usuários não estavam dispostos a pagar 10 a 50 vezes mais. Eles esperavam que fosse empacotado ou barato, assim como o texto.

Esta é a parede de custos de inferência: a lacuna entre os custos de execução da IA ​​de computação pesada e o que os consumidores pagarão para usá-la. Para a IA de texto, essa lacuna foi eliminada. Para vídeo AI, isso não aconteceu.

O colapso da retenção: ninguém voltou

O custo era apenas metade do problema. A outra metade era que ninguém precisava de Sora mais de uma vez.

Em fevereiro de 2026, menos de 5% dos usuários que se inscreveram no Sora retornavam mensalmente. Os downloads caíram de 3,33 milhões em novembro de 2025 para 1,13 milhão em fevereiro de 2026, um declínio de 66% em três meses.

O padrão era claro: os usuários geravam alguns clipes para um projeto ou curiosidade específica e nunca mais voltavam. A geração de vídeo por IA é inerentemente episódica, e não habitual. Você não abre o Sora no café da manhã da mesma forma que abre o ChatGPT. Você o usa quando precisa de um clipe para uma apresentação ou postagem social e depois fica pronto por semanas.

Advertisement

Isso significava que Sora estava gastando cerca de US$ 15 milhões por dia para atender uma base de usuários que estava diminuindo e pouco engajada. Compare isso com os 900 milhões de usuários ativos semanais relatados pelo ChatGPT, que geram uma demanda recorrente e habitual que justifica a infraestrutura.

E o fosso competitivo evaporou quase imediatamente. Runway Gen-3 foi lançado em outubro de 2025, Kling 2.0 em novembro e Google Veo 2 em janeiro de 2026, todos alcançando qualidade comparável ou superior em poucos meses. Quando a OpenAI tentou dimensionar o Sora para um acesso mais amplo, a qualidade degradou drasticamente e os usuários perceberam. Não houve custo de mudança, nenhum bloqueio de dados e nenhum efeito de rede.

O Paralelo Iridium: Tecnologia Perfeita, Economia Impossível

Isso já aconteceu antes.

Em 1998, a Motorola lançou a Iridium, uma rede de telefonia via satélite cuja construção custou US$ 5 bilhões. Funcionou exatamente como anunciado: você poderia fazer uma ligação de qualquer lugar da Terra, do meio do Oceano Pacífico ao topo do Monte Everest. A tecnologia foi um verdadeiro triunfo da engenharia.

Faliu em 13 de agosto de 1999, nove meses após o lançamento.

A tecnologia não era o problema. A economia era. Os aparelhos Iridium custavam US$ 3.000 e as chamadas chegavam a US$ 5 por minuto. Enquanto isso, as redes celulares terrestres estavam se expandindo rapidamente e reduzindo seus preços para centavos por minuto. A Iridium prevê 500.000 assinantes; obteve 10.000.

Após a falência, a Iridium foi vendida por US$ 25 milhões, uma perda de 99,5% para os investidores originais. Os satélites continuaram funcionando. Um novo proprietário reestruturou o negócio, mirou em nichos de mercado (marítimo, militar, indústria remota) e transformou a Iridium em uma empresa lucrativa com receita de US$ 831 milhões em 2024.

Os paralelos com Sora são precisos:

FatorIrídio (1998)Sora (2025-2026)
TecnologiaFuncionou perfeitamenteFuncionou perfeitamente
Custo da infraestrutura$5 bilhõesHusa. $500M-$2B em computação
Economia por utilização$5/minuto chamadas~$1,30/geração de clipe
Alternativa mais barataCelular ($0,10/min)Texto AI ($0,001/consulta)
Retenção de usuáriosPrevisão de 10K vs 500K5% de retenção mensal
Hora do fracasso9 meses6 meses
O que aconteceu a seguirVendido por $ 25 milhões, reconstruídoComputação redirecionada para ChatGPT

A lição do Iridium não é que os telefones via satélite fossem estúpidos. É que a economia de servir um mercado de massa com tecnologia cara não funciona quando uma alternativa mais barata cobre a grande maioria dos casos de utilização. A “alternativa mais barata” de Sora não é outro gerador de vídeo. É um texto.

A área cinzenta: os custos estão caindo, mas não com rapidez suficiente

É aqui que os pessimistas de Sora precisam pisar no freio.

Os custos de inferência de IA têm despencado. A execução de um modelo de classe GPT-4 custava aproximadamente US$ 20 por milhão de tokens no final de 2022. No início de 2026, o desempenho equivalente custaria US$ 0,40 por milhão de tokens, uma redução de 1.000 vezes em pouco mais de três anos.

O Gartner publicou uma previsão em 25 de março de 2026, um dia após a morte de Sora, projetando que os custos de inferência para um modelo de um trilhão de parâmetros cairão mais 90% até 2030.

Quatro forças combinadas estão impulsionando esse declínio: ganhos de eficiência de hardware, proporcionando 2 a 3 vezes mais rendimento por geração de GPU (Unidade de Processamento Gráfico), otimização de software que aumenta a utilização da GPU de 30 a 40% para 70 a 80%, melhorias na arquitetura do modelo, como MoE (Mixture-of-Experts), proporcionando computação 3 a 5 vezes menor por token, e técnicas de quantização que reduzem os requisitos de memória em 2 a 4 vezes.

A questão não é se o vídeo de IA se tornará acessível. É quando. Mesmo com outra melhoria de 10 vezes em relação aos custos de março de 2026, a geração de vídeo a cerca de US$ 0,13 por clipe ainda não funciona na escala em que a publicidade ou as assinaturas baratas podem absorvê-la. Alcançar custos de geração inferiores a um centavo, onde a economia em escala de consumo começa a respirar, provavelmente exigirá a redução adicional de 90% projetada pelo Gartner até 2030.

A sequência de Iridium é instrutiva aqui. A comunicação via satélite não morreu. Ficou mais barato, encontrou nichos de mercado e acabou se tornando viável. A Iridium atendeu mais de um milhão de assinantes em 2018. Mas foram necessários 20 anos e uma reformulação completa do modelo de negócios.

O vídeo de IA do consumidor seguirá a mesma trajetória. A tecnologia sobreviverá. A economia acabará por funcionar. Mas as empresas que financiam a lacuna entre agora e então irão sangrar.

O que morre a seguir: o cálculo da IA do consumidor

Sora não é a última vítima. É o canário na mina de carvão.

Todo produto de IA que depende de inferências pesadas enfrenta a mesma parede. À medida que você vai além do texto, a economia piora:

Categoria de produtoCusto de inferência vs. textoSensibilidade ao Preço ao ConsumidorViabilidade (março de 2026)
Bate-papo de texto (ChatGPT)1xBaixo ($20/mês funciona)Viável
Geração de imagens5-10xMédioMarginais
Geração de áudio/música10-20xAltoEm risco
Geração de vídeo10-50xMuito altoMorto (por enquanto)
3D/jogo em tempo real50-100xExtremoNão viável

Quanto mais se avança do texto para os meios de comunicação mais ricos, pior fica a economia. Cada aumento na intensidade da computação atinge o mesmo limite de custo de inferência. E os consumidores foram treinados por duas décadas de serviços gratuitos de Internet para esperar que a IA seja barata ou gratuita.

Isto leva a uma divisão estrutural: A IA torna-se uma ferramenta empresarial, não um produto de consumo. As empresas podem absorver custos mais elevados por utilizador para ferramentas de vídeo de IA que substituem uma equipa de produção de vídeo. Os consumidores não podem e não irão.

OpenAI parece entender isso. Sua declaração oficial citou um pivô em direção à “pesquisa de simulação mundial para o avanço da robótica que ajudará as pessoas a resolver tarefas físicas do mundo real”. Tradução: aplicações empresariais e industriais onde o cliente pode pagar a conta de computação.

A matemática do IPO: Por que Sora teve que morrer agora

Há aqui uma dimensão estratégica que a narrativa da “falha do produto” ignora.

OpenAI está se preparando para um IPO. Cada dólar de computação queimado no Sora era um dólar que não gerava receita por meio do ChatGPT, seu produto que realmente gera dinheiro. Com os orçamentos de despesas de capital já estendidos a todo o setor, a alocação de computação é um jogo de soma zero.

Matar Sora não foi apenas reduzir perdas. Foi otimização de portfólio. A OpenAI optou por redirecionar a capacidade da GPU da Sora para o ChatGPT e seu negócio de API (Application Programming Interface), onde funciona a economia da unidade. Para uma empresa com tendência para IPO, isso é racional: mostrar aos investidores um caminho para a rentabilidade, desligando a fornalha do dinheiro.

O colapso do acordo com a Disney reforça isso. Um investimento de US$ 1 bilhão parece enorme, mas não teria mudado a economia unitária de Sora. Se a geração de clipes custa US$ 1,30 cada e os usuários não pagam mais do que alguns dólares por mês, nenhuma quantidade de propriedade intelectual da Disney muda a matemática.

A regra Iridium para investidores em IA

Cada bolha tecnológica segue um padrão: construir a infra-estrutura, descobrir que a economia não funciona, quebrar e depois reconstruir sobre os destroços. O prejuízo de US$ 5 bilhões da Iridium tornou-se uma aquisição de US$ 25 milhões que se tornou uma empresa que gerou US$ 831 milhões em receita anual.

A infraestrutura não desaparece. Os investidores sim.

Para qualquer pessoa que esteja avaliando empresas de IA neste momento, a Regra Iridium é simples: separe a questão tecnológica da questão econômica. “Este modelo de IA funciona?” é uma pergunta diferente de “Este modelo de IA pode gerar mais receita do que custa para ser executado?” Sora respondeu “sim” à primeira e “absolutamente não” à segunda.

As empresas que sobreviverão ao muro de custos de inferência serão aquelas que atendem aos clientes que podem pagar pela computação: empresas, governos e indústrias especializadas. As empresas que apostam em vídeo, música e geração em tempo real de IA para o mercado de massa, a preços de assinatura, estão construindo telefones Iridium em um mundo celular.

A tecnologia é real. Os custos estão caindo. Mas a diferença entre onde se situam os custos de inferência em Março de 2026 e onde devem estar para a viabilidade do consumidor é medida em anos, não em meses. Sora chegou seis meses adiantado para uma festa que só começará no final da década.

Fontes

Advertisement

🦋 Discussion on Bluesky

Discuss on Bluesky

Searching for posts...