Blog
Empreinte carbone des LLM, AI Act 2026, cartographie IA en entreprise, CSRD ESRS E1. Pour les DG, DSI et DPO qui veulent adopter l'IA avec leurs équipes, et les RSE qui défendent la ligne IA de leur rapport.
Newsletter · tous les 15 jours
CSRD, AI Act, cartographie IA. L'essentiel de la régulation IA
Un email tous les 15 jours sur l'évolution de l'usage IA en entreprise. Pas de spam, désinscription en 1 clic.
Déjà installé l'extension ? Voir votre tableau de bord →
- ·11 min de lectureBai et al. (arXiv 2604.22750v2, avril 2026, Stanford / Michigan / AllHands AI / Google DeepMind / Microsoft / MIT) publient la première étude empirique grande échelle sur la consommation de tokens des agents IA. 500 tâches SWE-bench Verified, 8 modèles frontières : 4,17 M tokens par tâche agentique (vs 3,4 k pour un chat), variance 30× sur la même tâche, et les modèles eux-mêmes ne savent pas prédire leur conso (r ≤ 0,39, sous-estimation systématique). La référence pair-reviewée à citer pour défendre la mesure ex-post sur métadonnée dans votre ESRS E1.
- ·11 min de lectureVos meilleurs collaborateurs utilisent ChatGPT, Claude, Gemini en compte personnel, pas par défiance, par gain de temps. Bloquer au niveau réseau coûte 18 % de productivité par employé sur 6 mois (McKinsey 2025) et n'empêche pas l'usage sur smartphone perso. La stratégie qui marche : sensibilisation contextuelle au moment du clic (Adams & Sasse 1999, Kävrestad 2022). Ce que vous pouvez mesurer sans lire les prompts, et les limites assumées.
- ·9 min de lectureLe 21 mai 2026, l'Arcep a publié son rapport « IA générative : quels défis environnementaux ? » (co-rédigé avec le PEReN). Première étude française in situ sur 22 modèles open-weights sur Jean Zay : MoE −45 %, quantification −39 %, mode raisonnement jusqu'à +849 % sur du code. Cadre 4 axes, Recommandation 5 (transparence environnementale aux utilisateurs), 9 études citées à intégrer dans vos méthodologies. Synthèse opérable pour équipes RSE, juridique et achats — avant l'étiquette européenne en consultation depuis avril 2026.
- ·12 min de lectureMoins de onze semaines avant l'entrée en application de l'essentiel du règlement (UE) 2024/1689. Article 50 (transparence), article 55 (GPAI à risque systémique, divulgation énergétique), 10²⁵ FLOPs, Digital Omnibus du 7 mai 2026, amendes 7,5 M€ ou 1,5 %. Check-list opérationnelle des 60 jours qui restent — et pourquoi CSRD, AI Act et SB 253 convergent sur la même ligne LLM.
- ·10 min de lectureGoogle Gemini affiche 0,03 gCO₂e par prompt médian. Mistral Large 2 publie 1,14 gCO₂e. ChatGPT GPT-4 atteint 4,32 gCO₂e selon Piktochart. Facteur 140 entre les extrêmes — légitime parce que les périmètres diffèrent. Lecture méthodo des trois rapports, harmonisation au facteur 5-7, et règles d'écriture du chiffre dans CSRD.
- ·11 min de lectureSB 253 a été adoptée en février 2026 par CARB ; premier dépôt Scope 1+2 le 10 août 2026, Scope 3 en 2027. Le seuil « 1 Md$ + doing business in California » attrape de nombreux groupes européens. Mapping Catégorie 1 vs 11 pour l'usage LLM, convergence avec CSRD/AI Act, et plan d'action 60 jours.
- ·9 min de lectureOpenAI o3, Claude Opus 4.7 extended thinking, DeepSeek R1, Gemini Deep Research, Grok 4. La même question consomme 5 à 50× plus d'énergie qu'en 2024. Le RSE doit tracker reasoning_tokens, fixer un max_thinking_tokens par défaut, et router Haiku→Sonnet→Opus. Pourquoi le suivi FinOps et GreenOps fusionnent.
- ·10 min de lectureAucune donnée vendeur d'Anthropic à ce jour. Pourtant CarbonCredits estime Claude 3 Opus à 4,05 Wh / 1,80 gCO₂e par requête vs 0,30 Wh pour GPT-4o. Lecture complète : chiffres connus par modèle, impact du datacenter AWS Indiana 1 200 acres, pourquoi Anthropic ne publie pas encore (et ce que change l'article 55 AI Act), comment mesurer votre usage réel.
- ·10 min de lectureUn abonnement à 20 €/mois ne dit pas tout. En 2026 le vrai coût d'un power user IA est 5,5 à 8,5× plus élevé que le prix affiché : équivalent API (90-150 €/mois), carbone, exposition compliance, et le piège du « AI shrinkflation » qui a fait monter Claude Opus 4.7 de +20 % effectifs en avril. Démontage chiffré.
- ·9 min de lectureStack Overflow 2025 : 70 % des devs préfèrent Claude pour le code. Claude Code = 2,5 Md$ ARR estimé. Une session Claude Code consomme 10-50× plus de tokens qu'une conversation ChatGPT. Une équipe de 30 devs passée à Claude Code = 25 000 à 40 000 €/mois de facture + ligne Scope 3 à intégrer d'un facteur 5 plus élevé dans votre rapport CSRD.
- ·9 min de lectureAnthropic l'a chiffré : la durée 99,9p d'une session Claude Code a doublé en 3 mois (oct 2025 → jan 2026). 40 %+ des utilisateurs expérimentés tournent en auto-approve overnight. Une session de 45 min = équivalent CO₂e de 500 requêtes ChatGPT. 30 devs intensifs = 25 t CO₂e/an = 12 vols Paris-NYC. Comment capturer cette ligne avant clôture CSRD.
- ·8 min de lectureSignups Sora 2 fermés le 28 avril 2026, extinction API au 24 septembre 2026. Officiellement remplacé par ChatGPT Images V2. Officieusement : ~1 kWh + 466 g CO₂e par vidéo de 6 secondes, ~2 000× une requête texte. Quand le modèle frontière est retiré pour des raisons d'économie compute, c'est la première fois que la math climat est aussi claire. Décodage.
- ·10 min de lectureLes centres de données représentent 1 à 1,5 % de l'électricité mondiale selon l'AIE (projection de doublement d'ici 2026). McKinsey documente -80 % d'énergie en migrant on-premise vers le cloud. Et Strubell et al. (2019) ont mis 283 t CO₂e sur la table pour un entraînement avec NAS. Trois repères macro pour cadrer votre inventaire Scope 3 IA.
- ·11 min de lectureStanford HAI a publié son AI Index 2026 (avril) avec un chapitre dédié à l'empreinte environnementale de l'IA. Grok 4 = 72 816 t CO₂e, DeepSeek v3 = 597 t (efficacité), 29,6 GW de puissance datacenter (= New York), 1,3-1,6 M m³ d'eau pour GPT-4o. Ce qu'un RSE doit en retenir avant Wave 2 FY 2027.
- ·7 min de lectureCopilot M365 tourne sur GPT-4o — 0,34 Wh par requête, jusqu'à ×5 avec RAG SharePoint/Teams. La plupart des plans numériques des collectivités n'ont pas encore de ligne pour ces usages.
- ·9 min de lectureAlias de colonnes (OpenAI, noms de déploiement Azure, CSV point-virgule), mise en garde sur total_tokens seul, et pourquoi M365 Copilot ne suit pas le même chemin de données qu'un export d'usage API.
- ·8 min de lectureLa loi REEN intègre le numérique dans le PCAET depuis 2021. La consommation électrique des data centers devrait doubler d'ici 2026. La plupart des plans climat territoriaux n'ont pas encore de ligne pour l'IA générative — voici comment combler ce gap avant la prochaine révision.
- ·10 min de lectureLLaMA-3.2-1B consomme 0,07 Wh par requête. DeepSeek-R1 en consomme 23,8 Wh. L'écart d'efficacité entre les modèles frontier dépasse 200× — choisir le bon modèle pour chaque tâche peut réduire votre empreinte carbone de 60 à 80 % sans perte de qualité.
- ·10 min de lectureLes factures OpenAI et Anthropic relèvent de l'ESRS E1 Scope 3 Catégorie 1. Pour l'exercice 2025, les grandes entreprises européennes doivent documenter ces émissions. Voici la méthode basée sur l'activité que votre auditeur acceptera.
- ·9 min de lectureo3 et DeepSeek-R1 émettent 30 à 50× plus de CO₂ par appel que les modèles standards. Voici comment simuler l'impact carbone d'une migration de modèle avant de déployer.
- ·7 min de lectureComment nous utilisons Cursor MCP Linkup (linkup-search) pour actualiser le contexte réglementaire, vérifier le calendrier de l'AI Act de la Commission, et relier les preuves au niveau des tokens à la gouvernance IA et la divulgation climatique.
- ·9 min de lectureAu-delà des tokens de complétion : embeddings, recherche vectorielle et modèles de vérification consomment chacun de l'énergie — pourquoi la conception du workflow domine l'empreinte carbone de la génération augmentée par récupération.
- ·8 min de lectureLa mise en cache du préfixe KV évite 60 à 90 % du calcul de prefill sur les prompts répétés. Claude Code atteint 92 % de taux de cache hit et 81 % de réduction de coûts. Comment cela se traduit en économies CO₂e — et comment le mesurer par appel API.
- ·9 min de lectureEcoServe (2025) démontre une réduction carbone de 47 % pour le service LLM via l'ordonnancement carbone-conscient. L'intensité du réseau varie de plus de 40 % par heure. Comment décaler l'inférence différable vers une électricité plus propre sans casser les SLO.
- ·9 min de lectureQuand le fine-tuning supervisé est rentable sur le plan environnemental : usage GPU en phase d'entraînement contre économies de tokens à long terme, comparé aux approches RAG et prompt-first.
- ·9 min de lectureLa fabrication et l'assemblage des accélérateurs et serveurs génèrent du CO₂e avant même que l'inférence commence — comment les ACV distinguent carbone incorporé et opérationnel, et pourquoi le taux d'utilisation est crucial pour l'amortissement.
- ·8 min de lectureDe 0,03g à 4g de CO₂ par requête IA : pourquoi les estimations varient de 100× — et comment les lireGoogle a officiellement divulgué 0,03g CO₂e par requête texte Gemini en 2025. D'autres estimations atteignent 4g. Voici pourquoi cet écart de 100× existe — périmètres d'inférence, amortissement de l'entraînement — et comment documenter votre propre méthodologie.
- ·8 min de lecturePartir de la matérialité, collecter les données d'activité au niveau des tokens et aligner les émissions d'IA générative avec ESRS E1 et les périmètres GES — avant de débattre des grammes en titre.
- ·7 min de lectureBoucles plus courtes, modèles adaptés à la taille et moins de contexte dupliqué — plus comment voir le CO₂e indicatif par réponse sans envoyer le texte du prompt à un serveur.
- ·11 min de lectureSimplification, consultation EFRAG, guides non contraignants vs exigences, et implications pour les données d'émissions — sans confondre projet et droit contraignant.
- ·10 min de lectureTrajectoires de référence (AIE, SBTi), justifications en cas de non-alignement, cibles intermédiaires — et comment intégrer l'usage de l'IA générative dans le narratif climatique.
- ·9 min de lectureÀ quoi servent les points de données, comment lire une granularité accrue, et pourquoi la matérialité et la gouvernance des données importent plus qu'un simple décompte des exigences.
- ·10 min de lectureESRS E1-6 exige la divulgation Scope 3 des « services de cloud computing et de centres de données achetés » lorsqu'ils sont matériels. La révision Phase 1 du GHG Protocol Scope 3 (mars 2026) ajoute une nouvelle Catégorie 16. Ce qui change pour les dépenses API LLM.
- ·9 min de lectureProjets EFRAG, actes délégués, consultations publiques : où en sont les ESRS climatiques révisés, et comment planifier sans confondre projet de loi et texte contraignant.
- ·7 min de lectureComment parler d'« IA bas carbone » sans surestimer la précision : périmètres, étiquettes de confiance, et que dire quand votre empreinte est modélisée, pas mesurée.
- ·9 min de lectureCoefficients par 1k tokens vs durée × puissance × intensité réseau — compromis, incertitude, et comment garder les deux comparables dans votre note méthodologique.
- ·8 min de lectureUn guide champ par champ des métadonnées d'usage : quoi journaliser après chaque appel LLM, comment ça s'associe à /track, et pourquoi les estimations du tokenizer sont un dernier recours en production.
- ·10 min de lecturePourquoi les chiffres « grammes par requête » de ChatGPT et Gemini divergent — Epoch AI, méthodologie publiée, facteurs réseau — et ce qu'il faut journaliser pour ESRS E1 / Scope 3 plutôt que de courir après un titre.
- ·9 min de lectureUn schéma directeur pour attribuer l'usage des tokens aux tenants, séparer test et production, gérer le trafic partagé et produire des totaux par tenant cohérents.
- ·12 min de lectureCe qu'un auditeur demande généralement : données d'activité, cartographie des modèles, versionnage des coefficients, hypothèses, limites et périmètre de reporting clair — adapté aux empreintes d'inférence LLM.
- ·10 min de lectureQuand les émissions IA relèvent des services achetés (cat. 1) vs utilisation des produits vendus (cat. 11) — et comment décider selon le contrôle financier, la matérialité et les périmètres.
- ·11 min de lectureUne méthode pratique et adaptée à l'audit : convertir les tokens de prompt et de complétion en CO₂e à l'aide de coefficients documentés, puis maintenir la traçabilité pour les discussions ESRS E1 / Scope 3.
- ·9 min de lectureÉchéances d'août 2026, règles de transparence, codes de durabilité volontaires et divulgations d'énergie GPAI — cartographiés sur ce dont les équipes CSRD ont encore besoin : données d'activité tokens et périmètres GES.
- ·12 min de lectureComment le reporting de durabilité européen transforme l'IA générative d'une note de bas de page narrative en données Scope 3 auditables — et quoi mesurer maintenant.
- ·14 min de lectureEntraînement BLOOM (14,6t CO₂e), modélisation de l'inférence GPT-3, le cadre de bout en bout LLMCarbon, et la première divulgation officielle par requête de Google (0,03g CO₂e, août 2025). Ce sur quoi la recherche évaluée par les pairs 2024–2025 s'accorde.
Prêt(e) à mesurer votre usage IA ?
Extension Chrome / Firefox, rapport hebdo J+7. Gratuit, sans compte. Aucun prompt n'est lu.