insights23 juin 20266 min

Même un modèle infiniment rapide ne vous donnerait que 2x

Note exécutive TokenShift

La prochaine fois qu'un fournisseur vous promet un modèle « deux fois plus rapide », posez-lui la question de Jeff Dean.

Le directeur scientifique de Google l'a formulée à la conférence NVIDIA GTC 2026, face à Bill Dally : si vous rendez votre modèle infiniment rapide, vous ne gagnez qu'un facteur deux ou trois — dès lors que les outils qu'il manipule représentent une part significative du travail. Pas dix. Pas cent. Deux ou trois.

C'est la loi d'Amdahl appliquée à votre entreprise. Et elle dit une chose dérangeante : le modèle n'est probablement plus votre contrainte.

Le goulot s'est déplacé en aval

Pendant trois ans, la course s'est jouée sur l'intelligence et la vitesse du modèle. Cette course est en train de devenir secondaire — non parce qu'elle est gagnée, mais parce que le point de blocage a changé de place.

Un agent peut désormais produire, analyser ou décider à 10, 50, parfois 100 fois la cadence humaine. Mais tout ce qui se trouve après lui — la vérification, l'approbation, la correction, l'intégration dans un système réel — reste calé sur des horloges humaines et des process conçus pour des humains.

Nous appelons cette limite le plafond d'absorption : le débit maximal auquel votre organisation peut vérifier, valider et agir sur ce que l'IA produit. En dessous de ce plafond, chaque gain de vitesse du modèle est gaspillé. C'est la métrique que personne ne mesure et qui décide pourtant de votre ROI.

La preuve la plus nette vient de la cybersécurité

Si vous voulez voir le plafond d'absorption à nu, regardez la sécurité applicative.

En août 2025, l'agent Big Sleep de Google a découvert de façon autonome une vingtaine de failles inconnues dans des logiciels open source massivement utilisés (FFmpeg, entre autres), et a même identifié une vulnérabilité critique de SQLite (CVE-2025-6965) avant qu'elle ne soit exploitée. Anthropic, de son côté, a lancé en avril 2026 son initiative Project Glasswing, où le CTO de CrowdStrike résume la bascule en une phrase : « la fenêtre entre la découverte d'une vulnérabilité et son exploitation s'est effondrée — ce qui prenait des mois se joue désormais en minutes ».

Trouver les failles explose. Et les corriger ?

D'après le rapport 2025 d'Edgescan, 45,4 % des vulnérabilités détectées dans les grandes entreprises ne sont toujours pas corrigées après douze mois — dont près d'un cinquième de criticité haute ou critique. Le délai moyen de remédiation d'une faille critique se compte encore en mois (de l'ordre de 130 à 160 jours selon les sources), et deux tiers des organisations traînent un arriéré de plus de 100 000 vulnérabilités.

La capacité à trouver est passée à la vitesse machine. La capacité à corriger est restée à la vitesse humaine. L'écart entre les deux n'est pas un détail technique : c'est précisément le plafond d'absorption, et il s'élargit.

Ce n'est pas qu'un problème de sécurité

Le même schéma se rejoue dans chaque fonction qui adopte des agents. Le commentateur Nate B. Jones le formule crûment : un agent peut produire à 100x, mais si votre organisation ne révise qu'à 3x, vous n'avez pas résolu un problème — vous avez créé un goulot.

Et c'est là que se cache le vrai danger pour un COMEX. Quand la production explose et que la révision ne suit pas, la tentation est de relâcher la révision. On approuve plus vite, on contrôle moins, on fait confiance au « self-reporting » de l'agent. On automatise par-dessus un processus qu'on n'a jamais cartographié.

Automatiser un workflow cassé produit simplement un workflow cassé plus rapide.

Pour une banque, un assureur ou un opérateur d'infrastructure régulé, ce relâchement n'est pas une dette technique. C'est une exposition juridique et prudentielle. L'AI Act impose déjà une supervision humaine effective sur les usages à haut risque — pas une case cochée, une capacité réelle à comprendre, contester et corriger une sortie de modèle. Un plafond d'absorption trop bas, c'est une conformité de théâtre.

L'erreur d'investissement à éviter

La conséquence stratégique est contre-intuitive, donc précieuse.

Investir dans un modèle plus rapide ou plus intelligent quand votre contrainte est en aval, c'est élargir un tuyau d'arrivée alors que c'est l'évacuation qui est bouchée. Vous payez plus cher pour produire davantage de ce que vous ne pouvez déjà pas absorber. La loi d'Amdahl vous garantit le plafonnement à 2-3x — et la facture, elle, ne plafonne pas.

Le levier n'est pas le modèle. C'est le redesign de la couche de vérification et de décision : qui valide, sur quels critères, avec quelle traçabilité, à quelle cadence. C'est exactement le terrain de la production gouvernée — propriété explicite, garde-fous, observabilité indépendante du modèle, rythme de gouvernance. Le travail des humains ne disparaît pas ; il remonte d'un cran, du « faire » vers le « vérifier et arbitrer ce que les agents font ».

4 questions pour votre prochain COMEX

Avant de financer le prochain pilote ou le prochain upgrade de modèle, mesurez votre plafond d'absorption :

Débit de révision. Pour chaque usage agentique en cours, combien de sorties par jour pouvons-nous réellement vérifier et approuver — et qui le fait ?
Observabilité indépendante. Saurions-nous qu'un agent a mal exécuté une tâche sans nous reposer sur son propre rapport ? Par quel mécanisme tiers ?
Propriété de la correction. Quand une sortie est fausse, qui est nommément responsable de la corriger, et en combien de temps ? (Notre arriéré grandit-il ou diminue-t-il ?)
Périmètre d'autorité. Qu'est-ce qu'un agent peut faire seul, et qu'est-ce qui exige une escalade humaine — par écrit, pas par habitude ?

Si vous ne pouvez pas répondre, votre contrainte n'est pas la puissance de l'IA. C'est vous. Et la bonne nouvelle, c'est que c'est la seule variable que vous contrôlez entièrement.

Quelle est, honnêtement, la fonction où votre production a déjà dépassé votre capacité à la vérifier ?

Suivez la Page TokenShift — nous préparons la campagne COMEX de septembre 2026 sur le passage du pilote à la production gouvernée.

Sources : Jeff Dean (Google), NVIDIA GTC 2026 — OfficeChai, 2026 · Google Big Sleep / CVE-2025-6965 — Google Security Blog & SecurityWeek, août 2025 · Project Glasswing (citation CrowdStrike) — Anthropic, 7 avr. 2026 · Vulnerability Statistics Report 2025 — Edgescan · Nate B. Jones, AI News & Strategy Daily (commentaire).

#GouvernanceIA #IAEntreprise #COMEX #AIAct #MiseEnProduction

Continuer la lecture

Voir toutes les analyses