insights16 juin 20267 min

ROI de l'IA : les cinq lignes que votre CFO devrait exiger avant le premier euro de déploiement

Note exécutive TokenShift

L'idée reçue est confortable : on déploie d'abord, on mesure ensuite. Le ROI viendra « avec l'usage ».

Les chiffres disent l'inverse. Selon S&P Global Market Intelligence (2025), la part des entreprises qui abandonnent la majorité de leurs initiatives IA est passée de 17 % à 42 % en un an. En moyenne, 46 % des proof-of-concept sont enterrés avant la production.

Ce n'est pas un problème de technologie. C'est un problème de mesure. Et la mesure, c'est le métier du CFO.

Le vrai sujet : le ROI n'est pas un constat, c'est une condition d'entrée

La plupart des programmes IA n'échouent pas parce que le modèle est faible. Ils échouent parce que personne n'a répondu à une question plus simple : qu'est-ce qui change si ça marche ?

McKinsey (The State of AI, 2025) le montre : 88 % des organisations utilisent l'IA dans au moins une fonction, mais seules 39 % déclarent un impact sur l'EBIT — et environ 6 % seulement atteignent le statut de « high performer », avec un impact EBIT attribuable d'au moins 5 %. L'adoption est devenue universelle. La valeur, elle, reste rare.

Gartner avait prévenu dès juillet 2024 : au moins 30 % des projets d'IA générative seraient abandonnés après le proof-of-concept d'ici fin 2025 — pour quatre raisons qui n'ont rien d'algorithmique : qualité des données, contrôle des risques, coûts, et valeur business floue.

Notre conviction : le ROI de l'IA ne se constate pas a posteriori. Il se contractualise a priori. Nous appelons cela la Preuve à Cinq Lignes : cinq indicateurs, chacun tenant sur une ligne d'un mémo, exigibles avant tout déploiement. Si une ligne manque, le projet n'est pas prêt pour la production. Il est prêt pour le théâtre.

La Preuve à Cinq Lignes

1. La baseline chiffrée

Combien coûte le workflow aujourd'hui, sans IA ? Durée de traitement, taux d'erreur, coût unitaire, volume mensuel. Mesuré, daté, signé par le métier — pas estimé en réunion.

C'est la ligne la plus souvent absente. Sans baseline, tout gain annoncé est invérifiable par construction. Un ROI sans point de départ n'est pas un ROI : c'est une opinion.

2. Le delta attribuable

Quel gain est imputable à l'IA — et à elle seule ? Pas à la réorganisation qui l'accompagne, pas au nettoyage des données fait au passage, pas au simple effet d'attention porté au processus.

L'étude du MIT (initiative NANDA, The GenAI Divide, août 2025) a fait grand bruit en affirmant qu'environ 5 % seulement des pilotes d'IA générative produisent une accélération mesurable de revenus. La nuance s'impose : la mesure porte sur l'impact P&L à court terme, pas sur l'échec technique, et la méthodologie a été débattue. Mais le signal de fond est solide : la majorité des pilotes ne savent tout simplement pas démontrer leur delta. Exiger l'attribution, c'est se donner les moyens d'être dans les 5 % — ou d'arrêter à temps.

3. Le coût complet de production

Le coût d'un pilote n'est pas le coût d'une production. La facture réelle inclut l'intégration aux systèmes existants, la consommation d'inférence à l'échelle, la supervision humaine, le monitoring, la documentation de conformité — l'AI Act européen impose ses propres exigences de transparence et de traçabilité — et la maintenance quand les modèles évoluent.

Un CFO qui ne voit que la ligne « licences » ne voit qu'une fraction du coût. C'est précisément l'« escalade des coûts » que Gartner identifiait comme cause d'abandon.

4. Le taux d'escalade

Quelle part des cas le système renvoie-t-il à un humain ? Ce chiffre dit deux choses à la fois : la qualité réelle du système et le coût humain résiduel.

Un taux d'escalade qui n'est pas suivi est un risque qui n'est pas géré. Un taux d'escalade à zéro est encore plus inquiétant : il signifie que personne ne regarde. La bonne question n'est pas « combien de cas l'IA traite-t-elle ? » mais « qui traite ceux qu'elle ne traite pas, et que coûtent-ils ? ».

5. Le délai de récupération

À quelle date le delta cumulé dépasse-t-il le coût complet ? Une date, pas un horizon. « D'ici 18 à 24 mois » n'est pas une réponse de production gouvernée ; c'est une réponse de pitch.

Si la date dépasse la durée de vie probable de la solution — dans un marché où les modèles changent tous les six mois — le projet ne finance pas une transformation. Il finance une expérience.

Le même mardi matin, deux entreprises

Deux assureurs lancent le même pilote : tri automatisé des réclamations.

Le premier déploie vite. Six mois plus tard, l'équipe « sent » un gain, le métier conteste, le CFO tranche : abandon. Le projet rejoint les 42 % de S&P Global.

Le second a exigé la Preuve à Cinq Lignes avant le premier euro. Baseline : 11 minutes par dossier, mesurées sur trois mois. Delta cible, coût complet, taux d'escalade plafonné, date de payback. Six mois plus tard, le débat au COMEX ne porte pas sur « est-ce que ça marche ? » mais sur « à quel rythme on étend ? ».

Même technologie. Même budget. La différence n'est pas dans le modèle — elle est dans le contrat de mesure passé avant de commencer.

Ce que cela change pour votre COMEX

La Preuve à Cinq Lignes n'est pas un outil de reporting. C'est un outil de décision, avec trois effets immédiats :

Elle filtre avant de dépenser. Un projet incapable de produire ses cinq lignes n'est pas pénalisé — il est renvoyé en cadrage. C'est moins coûteux que de le découvrir en production.
Elle crée la propriété. Chaque ligne a un owner : la baseline appartient au métier, le coût complet à la DSI et au CFO, le taux d'escalade au responsable du workflow. La carte de propriété précède le déploiement.
Elle prépare la conformité. Les obligations de transparence et de documentation de l'AI Act supposent exactement ce que ces indicateurs produisent : une traçabilité de ce que fait le système et de ce qu'on en attend. La discipline de ROI et la discipline réglementaire sont la même discipline.

Un ROI qu'on ne sait pas calculer avant le déploiement ne deviendra pas calculable après.

Les cinq questions pour votre prochain COMEX

Avons-nous une baseline mesurée — pas estimée — pour chaque workflow candidat à l'IA ?
Notre méthode d'attribution distingue-t-elle le gain de l'IA du gain de la réorganisation ?
Notre coût complet inclut-il supervision humaine, conformité et maintenance — ou seulement les licences ?
Qui suit le taux d'escalade, et à quel seuil déclenche-t-il une alerte ?
Chaque projet IA a-t-il une date de payback écrite — et que fait-on si elle glisse ?

Si trois réponses sur cinq manquent, le sujet de votre prochain COMEX n'est pas un nouveau pilote. C'est la mise en place de l'instrument de mesure.

Et chez vous : votre CFO a-t-il aujourd'hui le droit de bloquer un déploiement IA faute de baseline ?

Suivez TokenShift pour la suite de cette série sur le passage du pilote à la production gouvernée.

Sources :

S&P Global Market Intelligence, Voice of the Enterprise: AI & Machine Learning (2025) — spglobal.com
McKinsey & Company, The State of AI (2025) — mckinsey.com
Gartner, communiqué du 29 juillet 2024 — gartner.com
MIT NANDA, The GenAI Divide (août 2025), via Fortune, 18/08/2025

#GouvernanceIA #IAEntreprise #COMEX #MiseEnProduction

Continuer la lecture

Voir toutes les analyses