Lien copié !

La guerre des profits de l'IA : les puces Nvidia contre les watts des services publics

Alors que Nvidia construit le cerveau de la révolution de l'IA, un secteur discret accapare le marché de sa force vitale. Qui possède réellement l'avenir des bénéfices de l'IA ?

🌐
Traduction automatique

Cet article a été traduit automatiquement depuis l’original en anglais. Lire l’original en anglais

Écran partagé montrant des puces Nvidia contre des pylônes de transport d'électricité.

La ruée vers l’or en Californie de 1849 a enseigné aux investisseurs une leçon qui a résonné pendant près de deux siècles : ne cherchez pas d’or ; vendre les pelles. Dans le boom de l’intelligence artificielle des années 2020, la « médaille d’or » est la promesse de l’AGI et de la productivité automatisée. Mais la définition de la « pelle » fait actuellement l’objet de débats en bourse.

Durant la première moitié de cette décennie, la réponse semblait évidente. Nvidia, le concepteur des GPU H100 et Blackwell, était le faiseur de rois incontesté. Si une entreprise souhaitait former un mannequin, elle payait la « taxe Jensen ». Mais à l’approche de 2025, une nouvelle réalité s’installe. Les puces sont disponibles, mais l’électricité pour les faire fonctionner ne l’est pas.

Alors que Nvidia a fait la une des journaux avec sa valorisation de 3 000 milliards de dollars, un secteur centenaire plus calme a commencé à surperformer le géant de la technologie dans des fenêtres annualisées spécifiques : le service public d’électricité ennuyeux, réglementé et versant des dividendes.

Ce changement signale un changement fondamental dans l’économie de l’IA. Le marché passe d’un monde limité en calcul à un monde limité en énergie. Pour les investisseurs et les observateurs du secteur, la question n’est plus seulement de savoir qui conçoit la meilleure puce, mais aussi de savoir qui peut maintenir l’éclairage allumé sans faire fondre le réseau.

Advertisement

La première pelle : le monopole de Nvidia

Pour comprendre l’ampleur du problème énergétique, il est nécessaire de comprendre la densité même du calcul déployé. Nvidia ne vend pas seulement une puce. Ils vendent une nouvelle méthode informatique très gourmande en énergie.

Le roi des marges

Le fossé financier de Nvidia est sans doute le plus large de l’histoire du matériel. Au troisième trimestre 2025, la société a déclaré un chiffre d’affaires de 57 milliards de dollars, soit une augmentation de 62 % d’une année sur l’autre. Plus choquant encore, ils ont maintenu des marges brutes au-dessus de 73 %. Dans le secteur du matériel informatique, où 40 % est considéré comme excellent, c’est presque du jamais vu.

Cette rentabilité découle de leur verrouillage complet de l’écosystème. Leur plate-forme logicielle CUDA fait office de système d’exploitation de l’IA. Alors que des concurrents comme AMD ont fait des progrès avec leur série MI300, offrant une efficacité énergétique jusqu’à 25 % supérieure pour certaines charges de travail, les coûts de commutation pour les grands laboratoires restent prohibitifs.

La physique du H100

La domination est physique. Un seul GPU H100 peut consommer jusqu’à 700 watts. Un rack de serveur standard dans un centre de données traditionnel a été conçu pour gérer 5 à 10 kilowatts (kW). Un rack Nvidia NVL72, abritant 72 GPU Blackwell, pousse la puissance thermique de conception (TDP) vers 120 kW. Ce n’est pas seulement un ordinateur plus chaud. Il s’agit d’une rupture fondamentale de la thermodynamique héritée.

L’énigme du refroidissement

Les centres de données traditionnels refroidissent les serveurs avec la climatisation. Les ventilateurs soufflent de l’air froid sur les dissipateurs de chaleur. Cela fonctionne bien pour 10 kW. À 100 kW, l’air est insuffisant. La capacité thermique spécifique de l’air est d’environ 1,006 J/g°C. L’eau est à 4,186 J/g°C. C’est quatre fois plus efficace pour évacuer la chaleur.

Advertisement

Pour exécuter un cluster Nvidia Blackwell, les opérateurs de centres de données doivent retirer leurs systèmes de traitement d’air et installer des boucles de refroidissement liquide dirigé (DLC). Cette tuyauterie amène le liquide froid directement vers la plaque froide de la puce. C’est complexe, coûteux et lourd. Le défi technique de Nvidia est passé de « réduire la taille des puces » à « gérer la densité thermique d’une étoile ». Cette réalité physique impose un cycle d’investissements massifs dans les centres de données, qui fait directement le jeu des fournisseurs d’énergie.

La deuxième pelle : le goulot d’étranglement énergétique

Si Nvidia fournit le moteur, les services publics fournissent le carburant. En ce moment, la pompe à essence tourne à sec.

Goldman Sachs projects that data center power demand will grow 160% by 2030. For context, United States electricity demand has been effectively flat for two decades, growing at roughly 0.5% a year due to efficiency gains in appliances and lighting neutralizing population growth. L’IA a brisé cet équilibre.

La renaissance des utilitaires

Historiquement, les actions de services publics comme Duke Energy, Southern Company ou Vistra étaient des actions « veuves et orphelines » : sûres, lentes et défensives. En 2025, elles sont devenues des valeurs de croissance.

Vistra (VST) et Constellation Energy (CEG) ont enregistré des gains à trois chiffres, dépassant largement Nvidia dans certains trimestres. Pourquoi? Parce qu’ils possèdent le seul actif qui ne peut pas être fabriqué dans une usine de fabrication : des gigawatts de base fiables.

Le marché s’est rendu compte qu’un GPU peut être expédié de Taïwan au Texas en 12 heures. Construire une nouvelle ligne de transmission aux États-Unis prend 7 à 10 ans. Cette inadéquation a transféré le pouvoir de fixation des prix de l’acheteur de puces au vendeur d’électrons.

Le problème 30 MW contre 300 MW

Un centre de données cloud standard construit en 2015 consommait environ 30 mégawatts (MW) d’énergie. Les « usines IA » autorisées aujourd’hui demandent 300 MW à 500 MW.

Advertisement

Pour mettre cela en perspective, 500 MW représentent à peu près la production d’un petit réacteur nucléaire ou d’une grande centrale au charbon. C’est suffisant pour alimenter 400 000 foyers. Lorsqu’un géant de la technologie demande ce type de connexion à un service public local, la réponse est de plus en plus souvent : « Faites la queue ».

Le fossé réglementaire : la file d’attente de l’enfer

La principale contrainte de Nvidia est la capacité de packaging CoWoS (Chip-on-Wafer-on-Substrate) de TSMC. Il s’agit d’un goulot d’étranglement dans le secteur manufacturier qui peut être résolu avec de l’argent et de nouvelles usines.

Les services publics sont confrontés à un goulot d’étranglement réglementaire que l’argent ne peut pas facilement résoudre. Aux États-Unis, la « file d’attente d’interconnexion » (la liste d’attente pour qu’une nouvelle production d’électricité soit connectée au réseau) est actuellement en retard avec plus de 2 000 gigawatts de capacité, principalement solaire et éolienne. Le temps d’attente moyen a explosé, passant de <2 ans en 2010 à >5 ans en 2024.

Ce fossé réglementaire protège les services publics historiques. Une startup ne peut pas simplement construire une centrale électrique et vendre de l’électricité à un centre de données. Ils ont besoin de l’approbation PJM, ERCOT ou CAISO. Cela renforce le rôle des grands acteurs existants qui disposent déjà des droits de transmission. Pour les hyperscalers de l’IA (Microsoft, Google, Amazon), cela signifie qu’ils doivent s’associer aux opérateurs historiques. Ils n’ont d’autre choix que de payer la prime.

L’économie de la rareté

La comparaison entre Nvidia et les Utilities révèle deux types différents de fossés d’investissement.

Les douves de Nvidia : innovation et écosystème Nvidia gagne parce qu’ils fonctionnent plus vite. Leur cadence de publication de 12 mois (Hopper, Blackwell, Rubin) oblige les clients à effectuer une mise à niveau ou à prendre du retard. Cependant, cela est intrinsèquement risqué. Si un modèle d’inférence nécessitant 90 % de calcul en moins est développé, ou si un ASIC (Application Specific Integrated Circuit) dédié prend le dessus, les marges de Nvidia pourraient se comprimer rapidement. Leur « pelle » est susceptible d’être réinventée.

Les douves utilitaires : régulation et physique Les services publics gagnent parce qu’ils sont protégés par les lois de la physique et par le gouvernement. L’interconnexion est obligatoire. Même les entreprises qui construisent des centrales de production hors compteur (comme l’achat par Amazon d’un centre de données adjacent au nucléaire auprès de Talen Energy) s’appuient en fin de compte sur l’interconnexion du réseau pour leur sauvegarde.

La rareté ici est absolue. Il n’y a qu’un nombre limité de sites ayant accès à l’eau (pour le refroidissement) et aux lignes de transport à haute tension. Cette rareté physique a conduit à la signature de « contrats d’achat d’électricité » (PPA) moyennant des primes substantielles. Les services publics sont en réalité des monopoles non réglementés sur leur territoire, et ils disposent désormais d’une clientèle aux poches infinies.

Profit=Demand×Scarcity\text{Profit} = \text{Demand} \times \text{Scarcity}

Pour Nvidia, la demande est infinie, mais la rareté est entretenue par la complexité de la chaîne d’approvisionnement. Pour les services publics, la demande augmente, mais la rareté est imposée par le décalage réglementaire et les délais de construction.

L’option nucléaire : SMR et porte-documents

La contrainte énergétique est si forte qu’elle impose un pivot technologique vers l’énergie nucléaire.

Les petits réacteurs modulaires (SMR) sont présentés comme la solution. Des entreprises comme Oklo et NuScale promettent de déployer des mini-réacteurs directement sur les sites des centres de données. Cela contourne efficacement le goulot d’étranglement du réseau.

Cependant, le calendrier des SMR se situe au mieux à la fin des années 2020. Entre-temps, et plus particulièrement au cours des 3 à 5 prochaines années, le fardeau incombe à la génération existante. C’est pourquoi le secteur assiste au « retrait de la mise hors service » des centrales à charbon et à la prolongation de la durée de vie des installations nucléaires vieillissantes. Le désir de l’IA d’énergie propre se heurte à la réalité d’une énergie fiable. Quand le choix est de « retarder la formation du modèle » ou de « brûler du gaz naturel », les géants de la technologie choisissent le gaz.

L’accord conclu par Microsoft avec Constellation Energy pour redémarrer l’unité 1 de Three Mile Island est le moment déterminant de cette tendance. Microsoft paie effectivement une prime de 100 % par rapport aux tarifs du marché pendant 20 ans simplement pour garantir 835 MW d’énergie de base propre. Cet accord prouve que pour les hyperscalers, le coût de l’électricité n’a pas d’importance par rapport au coût de ne pas avoir d’électricité.

Analyse prospective : qui gagnera en 2030 ?

Vers la fin de la décennie, l’équilibre des pouvoirs entre les fabricants de puces et les services publics va probablement à nouveau changer.

Scénario A : Le mur de l’efficacité Si l’efficacité du matériel (performance par watt) dépasse la croissance de la taille des modèles, la crise énergétique pourrait être surestimée. Le Blackwell de Nvidia offre déjà une efficacité nettement meilleure que Hopper. Si cette tendance s’accélère, la thèse de croissance des services publics pourrait s’affaiblir.

Scénario B : Le paradoxe de Jevons Le résultat le plus probable est le paradoxe de Jevon : à mesure que l’efficacité augmente, la consommation augmente encore plus parce que la ressource devient moins chère à utiliser. Si l’inférence devient bon marché, les ingénieurs l’intégreront dans tout, ce qui fera exploser la demande totale d’énergie.

Dans ce scénario, les services publics constituent le pari le plus sûr à long terme. Nvidia fait face à la concurrence de Google (TPU), Amazon (Trainium) et AMD. Le service public n’est confronté à aucune concurrence pour la livraison d’électrons.

La « pelle » de 2024 était la H100. La « pelle » de 2026 est l’interconnexion du gigawatt.

Pour l’investisseur avisé, l’enjeu n’est peut-être pas de choisir entre eux, mais de comprendre la rotation. Nvidia assure la croissance lors de la construction des modèles. Les utilitaires fournissent le rendement lorsque les modèles sont en cours d’exécution. Dans la ruée vers l’or de l’IA, l’industrie a besoin à la fois de la pioche pour creuser et de l’eau pour survivre. Mais à l’heure actuelle, l’eau coûte bien plus cher que prévu.

Nos sources

Advertisement

🦋 Discussion on Bluesky

Discuss on Bluesky

Searching for posts...