L'industrie de l'IA a aussi son propre Satoshi Nakamoto — Huang Renxun

PANews

2026-03-19 05:45:46

BTC-4,09%

Auteur : Luo Yihang, Position Silicon

La token que je croyais voir parce que je croyais en elle, je peux maintenant la voir sans y croire. Elle est la suivante après Watt, Ampère, et Bit.

En janvier 2009, un anonymes a inventé quelque chose appelé “token”. Vous investissez en puissance de calcul, obtenez un token, qui circule, est évalué et échangé dans un réseau de consensus. Toute l’économie cryptographique est née de cela. Plus de dix ans plus tard, les gens débattent encore de la valeur réelle de ce token.

En mars 2025, un homme en cuir redéfinit une autre chose appelée token. Vous investissez en puissance de calcul, produisez un token, qui est immédiatement consommé lors d’un processus d’inférence et de raisonnement en IA : réflexion, déduction, écriture de code, prise de décision. L’économie de l’IA s’accélère ainsi. Personne ne débat de la valeur de ce token, car ce matin-là, vous en avez utilisé plusieurs millions.

Deux types de tokens, même nom, même structure sous-jacente : puissance de calcul investie, valeur produite.

En mars 2026, je suis dans la salle de la NVIDIA GTC, écoutant un discours presque sans promotion de Jensen Huang. Oui, il a présenté Vera Rubin, un produit combinant CPU et GPU. Mais cette fois, il n’a pas parlé de paramètres de puces ni de processus de fabrication, il a présenté une économie complète de la production, de l’évaluation et de la consommation de tokens —

Quel modèle correspond à quelle vitesse de token ; quelle vitesse de token correspond à quelle fourchette de prix ; pour cette fourchette, quel matériel est nécessaire.

Il a même préparé pour les PDG et décideurs, qui tiennent les chèques des entreprises, un plan de répartition de la puissance de calcul des centres de données : 25 % pour le niveau gratuit, 25 % pour le milieu de gamme, 25 % pour le haut de gamme, 25 % pour le niveau premium.

Oui, cette fois, il ne vend pas une seule carte GPU, comme avec Blackwell il y a deux ans. Mais il vend quelque chose de plus grand. Après deux heures, je pense que sa phrase la plus importante était : Welcome to consume tokens, and only Nvidia’s factory could produce.

À cet instant, j’ai compris que cet homme, et l’anonyme d’il y a 17 ans qui a extrait le premier token, font la même chose, structurellement.

La même règle de transformation

L’anonyme nommé “Satoshi Nakamoto” a écrit en 2008 un livre blanc de neuf pages, élaborant un ensemble de règles : investir en puissance de calcul, prouver un travail (Proof of Work), obtenir un crypto token en récompense.

Ce qui est brillant dans cette règle, c’est qu’elle ne nécessite la confiance de personne — tant que vous acceptez ces règles, vous devenez automatiquement participant à cette économie. La règle est juste, car elle rassemble tant de personnes malhonnêtes et rusées.

Et Jensen Huang, sur la scène de GTC 2026, a fait exactement la même chose, structurellement.

Il a montré un graphique illustrant la relation entre efficacité de raisonnement et consommation de tokens : l’axe Y est le débit (combien de tokens produits par mégawatt), l’axe X est l’interactivité (la vitesse perçue par chaque utilisateur). Sous l’axe X, il a marqué cinq niveaux de prix : Free avec Qwen 3, 0$/million de tokens ; Medium avec Kimi K2.5, 3$/million ; High avec GPT MoE, 6$/million ; Premium avec GPT MoE 400K contexte, 45$/million ; Ultra, 150$/million.

Ce graphique pourrait presque faire la couverture du livre blanc de l’économie des tokens de Huang.

Satoshi Nakamoto a défini “ce qu’est un calcul de valeur” — réaliser une collision SHA-256 est précieux. Et Huang Huang a défini “ce qu’est une inférence de valeur” — produire un token à une vitesse spécifique dans un contexte donné, sous une contrainte de consommation d’énergie, est précieux.

Ni Satoshi ni Huang ne produisent directement des tokens. Ils définissent tous deux les règles de production et de tarification des tokens.

Une phrase prononcée par Huang sur scène pourrait presque résumer le livre blanc de l’économie des tokens —

Les tokens sont la nouvelle marchandise, et comme toutes les marchandises, une fois qu’elles atteignent un point d’inflexion, une fois qu’elles mûrissent, elles se segmentent en différentes parties.

Le token est une nouvelle matière première. Lorsqu’elle devient mature, elle se stratifiera naturellement. Il ne décrit pas la situation actuelle, mais anticipe une structure de marché, et aligne sa gamme de produits matériels précisément sur chaque couche de cette structure.

Les processus de production de ces deux tokens ont même une symétrie sémantique : le minage s’appelle mining, l’inférence s’appelle inference.

L’essence du minage et de l’inférence est la même : transformer l’électricité en argent. Les mineurs dépensent de l’électricité pour extraire des crypto tokens, puis les vendent ; les modèles d’inférence et agents IA dépensent de l’électricité pour produire des tokens IA, qu’ils vendent à des développeurs à des prix au million. La différence réside dans la étape intermédiaire, mais les deux extrémités sont identiques : à gauche, le compteur électrique, à droite, le revenu.

Deux façons d’écrire la rareté

La décision de conception la plus importante faite par Satoshi Nakamoto n’est pas la preuve de travail, mais la limite totale de 21 millions de bitcoins. Il a créé une rareté artificielle par code — peu importe le nombre de mineurs qui entrent, la quantité totale de bitcoins ne dépassera jamais 21 millions. Cette rareté est l’ancre de valeur de toute l’économie cryptographique.

Huang Huang, lui, a créé une rareté naturelle selon les lois physiques. Il dit :

“Vous devez toujours construire un centre de données d’un gigawatt. Vous devez toujours construire une usine d’un gigawatt, et cette usine amortie sur 15 ans… coûte environ 40 milliards de dollars même sans y mettre de matériel. C’est 40 milliards. Vous feriez mieux de vous assurer d’y mettre le meilleur système informatique pour avoir le meilleur coût par token.”

Un centre de données de 1 GW ne deviendra jamais 2 GW. Ce n’est pas une limite de code, mais une loi physique.

Terre, électricité, refroidissement — chaque limite physique existe. Le coût de construction de cette usine, à 400 dollars par mètre carré, sur 15 ans, dépend entièrement de l’architecture de calcul que vous y mettez.

La rareté de Satoshi peut être forkée. Si vous n’aimez pas la limite de 21 millions, vous pouvez forker une nouvelle chaîne, la changer en 200 millions, l’appeler Ether ou autre, et publier un nouveau livre blanc. Et c’est ce que certains ont fait, avec enthousiasme.

Mais la rareté créée par Huang ne peut pas être forkée. Vous ne pouvez pas forker la deuxième loi de la thermodynamique, ni la capacité du réseau électrique d’une ville, ni la superficie physique d’un terrain.

Mais, que ce soit Satoshi ou Huang, leur création de rareté mène au même résultat : la course à l’armement hardware.

L’histoire du minage est : CPU → GPU → FPGA → ASIC. Chaque génération de matériel spécialisé remplace la précédente. Et l’histoire de l’entraînement et de l’inférence en IA se répète : Hopper → Blackwell → Vera Rubin → Groq LPU. Le matériel généraliste commence, puis le matériel spécialisé s’impose. Le Groq LPU présenté par Huang cette année à GTC, après l’acquisition de Groq, est un processeur de flux de données déterministe. Compilation statique, planification par compilateur, absence de planification dynamique, 500MB de SRAM sur puce — sa philosophie architecturale est celle d’un ASIC pour l’inférence. Il ne fait qu’une chose, mais de façon extrême.

Ce qui est intéressant, c’est que : le GPU a joué un rôle clé dans deux vagues successives.

Avant 2013, les mineurs ont découvert que le GPU était plus adapté que le CPU pour miner des crypto tokens, et les cartes Nvidia ont été en rupture de stock. Dix ans plus tard, les chercheurs ont découvert que le GPU était l’outil optimal pour entraîner et inférer des modèles d’IA, et les cartes Nvidia pour centres de données ont de nouveau été en rupture. Le GPU, en tant que catégorie de processeurs, a servi deux générations d’économie de tokens.

La différence, c’est qu’à la première vague, Nvidia a été un bénéficiaire passif, et il n’y a pas eu de suite. Mais à la seconde, lorsque la consommation de puissance de calcul IA est passée de l’entraînement à l’inférence, Nvidia a rapidement saisi l’opportunité, a conçu tout le jeu, et est devenu le rédacteur des règles du jeu IA.

La pioche la plus rentable au monde

Dans la ruée vers l’or, ce n’est pas le chercheur d’or qui gagne le plus, mais le vendeur de pelles, Levi Strauss. Dans la ruée minière, ce n’est pas le mineur, mais Bitmain et Wu Jihan, qui gagnent le plus. Dans la vague IA d’entraînement et d’inférence, ce ne sont pas les grands modèles ou agents, mais Nvidia qui fait le plus de profit.

Mais sérieusement, le rôle de Bitmain et Nvidia dans leurs industries respectives ne peut plus être comparé.

Bitmain ne vend que des mineurs, Nvidia a été fournisseur de Bitmain. Acheter un mineur, miner quelle crypto, dans quelle pool, à quel prix, n’a rien à voir avec Bitmain. C’est un fournisseur hardware pur, qui gagne sur la vente unique d’équipements.
Nvidia, lui, ne se limite pas au hardware. Depuis 2025, avec l’explosion de l’IA en inférence, il a profondément défini ce qu’il faut utiliser pour miner, comment tarifer les tokens, à qui les vendre, comment répartir la puissance dans les centres de données… Tout cela est dans la présentation de Huang : il divise le marché en cinq niveaux, chaque niveau correspondant à un modèle, une longueur de contexte, une vitesse d’interaction, un prix… Nvidia a standardisé et formaté le marché de l’IA inférence qui va tout driver à l’avenir.

Vers 2018, la puissance de calcul mondiale était concentrée dans quelques grands pools — F2Pool, Antpool, BTC.com — qui se faisaient concurrence pour la part de marché, mais la source des mineurs était très concentrée chez Bitmain.

Comme aujourd’hui Nvidia, 60 % des revenus proviennent de “hyperscalers” concurrents comme AWS, Azure, GCP, Oracle, CoreWeave, et 40 % de clients dispersés : IA natives, projets souverains, entreprises. Les grands “pools” apportent la majorité des revenus, les “petits mineurs” apportent résilience et diversification.

Les deux écosystèmes ont une structure identique. Mais Bitmain a rencontré ses concurrents — Shima Miner, Canaan, Innosilicon — qui grignotent ses parts. Les ASIC de minage sont relativement simples, et les concurrents ont une chance de rattraper. Mais faire vaciller Nvidia semble de plus en plus difficile : 20 ans d’écosystème CUDA, des centaines de millions de GPU installés, la technologie NVLink de sixième génération, l’architecture dé-couplée de inference de Groq après acquisition — la complexité technologique et les barrières écologiques de Nvidia rendent la plupart des outils concurrents inefficaces.

Cela pourrait durer encore 20 ans.

La bifurcation fondamentale entre deux types de tokens

Ce qui différencie fondamentalement la cryptomonnaie et les tokens d’entraînement et d’inférence IA, c’est la motivation et la psychologie des utilisateurs.

La demande de crypto tokens est spéculative. Personne n’a “besoin” de Bitcoin pour faire du travail. Toutes les white papers affirmant que la blockchain peut résoudre des problèmes sont des escroqueries. Vous détenez des crypto parce que vous croyez qu’à l’avenir, quelqu’un vous l’achètera à un prix plus élevé. La valeur du Bitcoin repose sur une prophétie auto-réalisatrice : si suffisamment de gens croient en sa valeur, il en aura. C’est une économie de la foi.

En revanche, la demande d’AI tokens est liée à la productivité. Nestlé a besoin de tokens pour la gestion de sa chaîne d’approvisionnement — ses données de supply chain, qui se rafraîchissent toutes les 15 minutes, passent à 3 minutes, réduisant les coûts de 83 %, cette valeur peut être directement intégrée dans le P&L. Nvidia, à 100 %, a ses ingénieurs qui écrivent du code avec des tokens, pas à la main ; les équipes de recherche utilisent des tokens pour faire de la recherche. Vous n’avez pas besoin de croire en la valeur du token, vous l’utilisez, et sa valeur se prouve dans l’usage.

C’est la différence essentielle entre ces deux tokens. Le crypto token est produit pour être détenu et échangé — sa valeur réside dans le fait de ne pas l’utiliser. Le token IA est produit pour être consommé immédiatement — sa valeur réside dans son usage instantané.

L’un est de l’or numérique, plus on en accumule, plus ça vaut ; l’autre est de l’électricité numérique, qui se consume dès sa production.

Cette différence explique pourquoi l’économie des tokens IA ne sera pas sujette à la même bulle que celle des crypto tokens. Le Bitcoin connaît des montagnes russes parce que la valeur d’un actif spéculatif est pilotée par l’émotion. Mais le prix des tokens est déterminé par l’usage et le coût de production : tant que l’IA reste utile — tant que les gens utilisent Claude Code pour coder, ChatGPT pour rédiger, ou Agent pour gérer des processus — la demande de tokens ne s’effondrera pas. Elle ne repose pas sur la foi, mais sur l’indispensabilité.

En 2008, le livre blanc de Bitcoin expliquait pourquoi un système de paiement électronique décentralisé avait de la valeur. 17 ans plus tard, la controverse persiste.
En 2026, l’économie des tokens n’a pas suscité de débat, elle est même devenue un consensus sans besoin de justification. Quand Huang Huang, sur la scène de GTC, a dit “tokens are the new commodity”, personne n’a contesté. Parce que tous ceux dans la salle, ce matin, ont consommé des millions de tokens avec Claude Code ou ChatGPT. Ils n’ont pas besoin d’être convaincus de leur valeur — leur facture de carte de crédit le prouve déjà.

Dans ce sens, Huang Huang est vraiment le clone de Satoshi Nakamoto, celui qui a laissé la production de matériel minier en monopole, défini les scénarios et règles d’utilisation des tokens, et organise chaque année un spectacle au SAP Center de San José pour montrer la puissance de la “machine de minage” supportant la prochaine génération d’IA.

Satoshi Nakamoto a une fascination prudente pour le désir : il conçoit des règles, les confie au code, puis disparaît. C’est le romantisme du cypherpunk. Huang Huang, lui, ressemble à un homme d’affaires plus qu’à un scientifique : il conçoit, maintient, améliore, et construit sa propre forteresse.

Le token que vous voyiez autrefois parce que vous y croyiez, vous pouvez maintenant le voir sans y croire. Il est la prochaine étape après Watt, Ampère, et Bit.

Voir l'original

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Commentaire

0/400

Aucun commentaire