insights30 juin 20267 min

Pourquoi seules 7 % des entreprises font passer l'IA à l'échelle (et ce n'est pas le modèle)

Note exécutive TokenShift

Quand un programme IA déçoit, le réflexe est de chercher un modèle plus puissant. C'est presque toujours la mauvaise piste. Le 19 juin 2026, McKinsey a publié une enquête menée auprès de 1 000 dirigeants qui met un chiffre sur l'écart : près de 90 % des organisations expérimentent l'IA, mais seules 7 % l'ont réellement passée à l'échelle dans l'entreprise. Entre ces deux nombres, ce n'est pas la qualité du modèle qui tranche. C'est le système de gestion.

Le capital est là ; la valeur ne suit pas

Commençons par enterrer un faux débat. Non, l'IA n'est pas une bulle vide d'usage réel. Sur l'exercice fiscal 2026 clos en mai, Nvidia a déclaré 215,9 milliards de dollars de chiffre d'affaires, en hausse de 65 %, dont 193,7 milliards pour le seul segment datacenter (+68 %). Cette demande est tirée par l'inférence, c'est à dire l'usage des modèles en production, pas par la spéculation. Le commentateur Nate B. Jones résume la mécanique d'une formule : « inference equals revenues ». La capacité de calcul se loue parce qu'on s'en sert.

Le problème n'est donc pas la disponibilité de la technologie. Elle est abondante, capitalisée, et accessible à tous au même prix d'abonnement. Le problème est la captation de valeur. McKinsey constate que les entreprises avancées dans l'usage de l'IA affichent une productivité et une rentabilité nettement supérieures à leurs pairs, mais que cet écart vient de l'intégration de l'IA dans les processus de gestion, pas de la sophistication des outils. Le BCG aboutissait au même verdict en septembre 2025 : environ 5 % d'entreprises « leaders » captent l'essentiel de la valeur, pendant que près de 60 % n'en tirent aucune matérielle.

Autrement dit : tout le monde a accès au même moteur. Très peu ont la boîte de vitesses qui transmet sa puissance aux roues.

Le multiplicateur opérationnel

Appelons cette boîte de vitesses le multiplicateur opérationnel : l'ensemble des pratiques de gestion qui convertissent une capacité de modèle, identique pour tous, en résultat dans le compte de résultat. McKinsey en identifie trois composantes concrètes, et c'est sur ces trois que se joue le passage à l'échelle.

1. Des KPI reliés au P&L, pas à l'usage

Les 7 % qui réussissent ne mesurent pas le nombre d'utilisateurs ni le volume de requêtes. Ils mesurent un effet économique : coût par dossier traité, marge par contrat, délai de cycle. Tant qu'un comité de direction suit l'adoption au lieu de la valeur, il pilote du théâtre.

2. La réallocation des ressources en temps réel

McKinsey insiste sur un marqueur précis : réaffecter budgets et talents en fonction de la donnée, en continu. Les entreprises à l'échelle redéploient l'argent d'un usage qui ne rend pas vers un usage qui rend, en semaines. Les autres reconduisent leurs enveloppes une fois par an, quoi qu'il arrive.

3. Une cadence de gestion explicite

Principes opératoires clairs, rituels de pilotage, comportements attendus. C'est l'infrastructure invisible : la régularité avec laquelle on revoit, on arbitre, on escalade. C'est elle qui transforme un pilote isolé en routine d'entreprise.

Le même mardi matin, deux assureurs

Deux assureurs européens, le même mardi matin de juin 2026. Les deux ont accès aux mêmes modèles frontière. Le premier a déployé un assistant pour ses gestionnaires sinistres : 1 200 utilisateurs actifs, un tableau de bord d'adoption flatteur, aucun propriétaire nommé, aucun indicateur de coût par sinistre. Au bout de six mois, l'outil est « adopté » et le ratio de gestion n'a pas bougé d'un point.

Le second a choisi une décision, pas un cas d'usage : réduire le délai d'instruction des sinistres habitation de 30 %. Un seul workflow en production, un directeur métier responsable, un KPI relié à la marge, et une revue mensuelle qui réalloue le budget vers les segments où le gain se confirme. Même technologie. L'un a acheté un moteur, l'autre a installé la transmission.

Une démarche en cinq étapes pour votre COMEX

Le multiplicateur opérationnel se construit, il ne s'achète pas. La séquence importe.

Choisir une décision, pas un cas d'usage. Formuler ce qui change si ça marche, en euros ou en délai. Sans réponse à cette question, ne pas financer.
Définir l'indicateur P&L avant de lancer. Le KPI se fixe à froid, jamais après coup pour justifier la dépense.
Mettre un seul workflow en production. Un, avec un propriétaire nommé et une traçabilité des sorties. Pas dix pilotes parallèles.
Installer la cadence de réallocation. Un rituel mensuel qui déplace réellement de l'argent et des gens selon la donnée observée.
Mesurer le multiplicateur, pas l'activité. Comparer le résultat économique au point de départ, et couper ce qui ne multiplie rien.

Erreurs à éviter

Mesurer l'adoption. Compter les utilisateurs et les requêtes donne un sentiment de progrès sans aucune corrélation avec la valeur captée.
Acheter de la puissance pour régler un problème d'organisation. Un modèle plus performant ne corrige pas une absence de propriété ni une cadence de gestion défaillante.
Multiplier les pilotes sans réallouer un euro. Gartner prévoyait dès 2024 qu'au moins 30 % des projets d'IA générative seraient abandonnés après le stade de la preuve de concept. Lancer dix expérimentations sans déplacer de ressources produit dix abandons.
Confondre l'enthousiasme et la production. Une démonstration qui impressionne le comité n'est pas un workflow gouverné. C'est du théâtre, et il coûte cher.

Ce que vous devez pouvoir observer

Quatre marqueurs disent, sans débat, si votre multiplicateur opérationnel existe :

Le COMEX sait nommer l'indicateur P&L de chaque initiative IA financée.
Le délai entre une décision et le redéploiement du budget se compte en semaines, pas en cycles annuels.
Au moins un workflow tourne en production, avec un propriétaire identifié et une traçabilité de ses sorties.
Une part non nulle du budget IA a été réaffectée d'un projet à un autre au dernier trimestre.

Si vous cochez ces quatre cases, vous êtes en train de rejoindre les 7 %. Si vous n'en cochez aucune, le problème n'est pas votre fournisseur de modèle.

Un modèle plus puissant ne corrige pas un système de gestion défaillant ; il le rend juste plus rapide.

Le passage à l'échelle de l'IA est une discipline d'exécution avant d'être un sujet technologique. Le capital de calcul est commun à tous vos concurrents ; ce qui vous distinguera, c'est la rigueur avec laquelle vous reliez chaque usage à un résultat, et la vitesse à laquelle vous déplacez vos ressources vers ce qui rend.

Chez TokenShift, c'est exactement le travail de notre offre Decision Clarity : transformer un portefeuille de pilotes en décisions financées, mesurées et gouvernées. RegRadar by TokenShift en est une brique, pour relier conformité AI Act et production. Aucune dépense de modèle ne remplace cette discipline.

Continuer la lecture

Voir toutes les analyses