« Restez agnostique au modèle » : le conseil IA le plus coûteux de 2026.
Note exécutive TokenShift

C'est devenu un réflexe de COMEX : « surtout, restons agnostiques — on branchera n'importe quel modèle, on changera quand un meilleur sort. » Rassurant. Et techniquement faux.
Les analyses récentes de Cursor et d'Anthropic disent l'inverse : un harnais générique, agnostique au modèle, sous-performe. Et c'est précisément là — dans le harnais, pas dans le modèle — que vivent à la fois votre avantage et vos coûts.
Le harnais, c'est l'usine autour du moteur
Le « harnais », c'est tout l'échafaudage qui entoure le modèle : l'orchestration, le format des outils, la gestion du contexte et du cache, les garde-fous, l'observabilité. Le modèle est un moteur de commodité — interchangeable, au coude-à-coude, à un clic. Le harnais, lui, est une usine que vous concevez, réglez et possédez.
Et une usine ne se commande pas « agnostique ». Cursor le montre noir sur blanc : les modèles sont optimisés pour des formats d'outils différents — ceux d'OpenAI pour des éditions de type git-diff, ceux d'Anthropic pour du remplacement de chaîne. Forcer un modèle à utiliser le mauvais format gaspille des tokens de raisonnement et fait grimper le taux d'erreur. Les plateformes sérieuses construisent des abstractions d'outils sur mesure, fournisseur par fournisseur.
Le coût caché du « on changera en cours de route »
Le pattern séduisant — un gros modèle pour planifier, un petit pour exécuter — est un piège. Changer de modèle en pleine session, c'est : une dégradation du contexte (le nouveau modèle hérite d'un historique produit par un autre, hors de sa distribution) et des pertes de cache (le cache de contexte est spécifique au fournisseur) — donc plus lent et plus cher. La recommandation technique est claire : un seul modèle par session, avec un harnais réglé pour lui.
Attention à ne pas confondre deux niveaux : garder la capacité stratégique de changer de fournisseur (pour ne pas être captif) est sain ; basculer de modèle en plein vol au niveau runtime coûte cher. L'abstraction se pense en amont, pas en cours d'exécution.
Le harnais s'étend jusqu'à l'infrastructure
Un harnais de production ne se résume pas à du « collage de prompts ». Comme le rappellent les analyses sur l'infrastructure de l'IA, la mise en production se joue sur des points de contrôle : le runtime (où l'agent vit et garde son état), l'identité (autorité déléguée, jetons à périmètre restreint), la gouvernance des données, le budget, et l'observabilité. Le harnais, c'est ça — pas le modèle.
Pourquoi c'est l'actif de votre entreprise
Le modèle se réinitialise tous les trimestres. Le harnais, lui, capitalise : vos outils, votre contexte, vos garde-fous, vos contrôles s'accumulent. McKinsey le confirme indirectement — les \~6 % d'entreprises qui captent une vraie valeur ne se distinguent pas par leur modèle, mais par la refonte des workflows autour de lui. L'ingénierie du harnais devient une capacité d'entreprise à construire et à posséder.
4 questions sur votre harnais (pour votre COMEX)
- Nos abstractions d'outils sont-elles réglées par fournisseur, ou génériques ?
- Tournons-nous sur un seul modèle par session, ou bascule-t-on en plein vol ?
- Maîtrisons-nous notre couche contexte/cache (ou la subissons-nous) ?
- Nos points de contrôle (runtime, identité, données, budget, observabilité) sont-ils explicites — et possédés par nous ?
Le modèle est un moteur de commodité. Le harnais est votre usine — et une usine ne s'achète pas « agnostique ».
Votre « stratégie IA » décrit-elle un modèle… ou un harnais ?