Anthropic l'a chiffré officiellement en janvier 2026 : la durée 99,9p d'une session Claude Code a doublé en 3 mois, passant de <25 min en octobre 2025 à >45 min en janvier 2026. Et 40 %+ des utilisateurs expérimentés utilisent maintenant l'auto-approve total — agents qui tournent overnight sans supervision. Une session de 45 minutes émet l'équivalent CO₂e de ~500 conversations ChatGPT classiques. C'est une ligne Scope 3 nouvelle, que la plupart des inventaires CSRD wave 2 vont rater.
Suivre ce poste en production →
Envoyez les volumes de tokens vers notre API — mêmes coefficients que cet article. Offre gratuite, sans carte bancaire.
Pourquoi un agent consomme tant plus qu'une chat
Trois multiplicateurs cumulatifs :
- Reasoning models = 30-50× plus d'énergie qu'un modèle standard. Claude Opus 4.7 avec « xhigh » thinking effort peut générer 600+ reasoning tokens avant 2 tokens visibles (Toolpod 2026).
- Tool calls multiples par tour: Read, Grep, Bash, Edit, WebFetch — chaque outil ramène du contexte qui s'empile dans l'input du tour suivant. Un agent Claude Code à 45 min = 30-60 tours de boucle.
- Context windows extrêmes: Claude Opus 4.7 contexte 1 M tokens chargé à chaque tour. Le caching aide (-50 à -90 % sur les tokens répétés) mais ne compense pas l'explosion totale.
Mesure concrète de Simon P. Couch (janvier 2026) : une requête Claude Code medium-context (7 500 mots) = ~2,5 Wh, soit ~8× une requête ChatGPT vanilla. Multiplier par 30-60 tours = 75 à 150 Wh par session, ou 35 à 70 g CO₂e (mix UE 470 g/kWh). C'est l'équivalent énergie de 10 à 20 charges de smartphone par session.
Le multiplicateur « auto-approve »
Anthropic publie maintenant une métrique appelée « autonomy share »— le pourcentage d'actions Claude prend sans demander confirmation à l'humain. En janvier 2026, sur les utilisateurs expérimentés, cette part dépasse 40 %. Concrètement : un développeur lance claude --dangerously-skip-permissions avant de dîner, l'agent tourne pendant 2 h, fait 100 tours, modifie 30 fichiers, lance des tests, corrige les erreurs, recommence. Quand le développeur revient, la session a produit du résultat utile etémis l'équivalent CO₂e d'un trajet en train Paris-Lyon (~3-5 kg).
Et c'est encore plus marqué côté long-running Claude on HPC : Anthropic documente des exemples de jobs SLURM tournant 48 heures sur H100. Une H100 consomme ~700 W en charge → 48 h × 700 W = 33,6 kWh = ~16 kg CO₂e en mix UE, par session, par dev.
Le tableau de bord que ton DSI n'a pas
| Usage IA | Énergie | CO₂e | Équivalent |
|---|---|---|---|
| 1 requête ChatGPT texte | ~0,3 Wh | ~0,14 g | 1 LED 5 min |
| 1 requête Claude Opus 4.7 (reasoning xhigh) | ~9 Wh | ~4,2 g | 30 LED 5 min |
| 1 session Claude Code 45 min | ~75-150 Wh | ~35-70 g | 10-20 charges smartphone |
| 1 dev × 8 h × 20 jours Claude Code | ~150 kWh / mois | ~70 kg / mois | ~300 km voiture thermique |
| Équipe 30 devs intensifs sur 1 an | ~54 MWh | ~25 t CO₂e | ~12 vols Paris-NYC |
Estimations triangulées Anthropic, Simon P. Couch (jan. 2026), Mistral LCA, mix UE 470 g/kWh. L'intervalle d'incertitude est de ±30 % — c'est délibérément bas pour les agents reasoning car les providers n'exposent pas les compteurs reasoning_tokens complets.
Et côté ChatGPT Agent Mode / Atlas Health
OpenAI a lancé en avril 2026 trois fonctionnalités agents : ChatGPT Agent (browsing autonome + actions), Atlas Health (interprétation continue de données médicales personnelles), et o3-pro autonomous research(recherche scientifique multi-heures). Les empreintes sont du même ordre que Claude Code : sessions de 20 à 60 minutes, dizaines de tool calls, reasoning tokens élevés. Le cas Atlas Health est particulier car l'agent tourne en continu en arrière-plan, ajoutant une consommation passive non-mesurée par les outils traditionnels.
Anthropic vise un facteur 10 d'autonomie d'ici fin 2026 — sessions de 4 à 8 heures sans intervention humaine. La consommation par dev pourrait atteindre 500 kWh / mois (~230 kg CO₂e / mois) par développeur à ce rythme.
Pour le RSE / sustainability lead : nouvelle ligne d'inventaire
Trois actions concrètes à mettre en place avant la clôture comptable 2026 :
- Créer une sous-ligne Scope 3 « agents IA » à côté de « LLM chat usage ». Les deux ont des facteurs très différents — confondre les deux sous-déclare de 5 à 10×.
- Capturer les compteurs reasoning_tokens (Anthropic et OpenAI les exposent depuis fin 2025). Sans ça, la mesure est inutile pour les modèles avec extended thinking.
- Demander aux providers leur empreinte par token. Anthropic n'a pas publié de bilan Scope 1/2/3 fin mars 2026 — l'AI Act article 55 va l'y obliger pour les GPAI risque systémique à partir d'août 2026.
Comment carbon-llm capture l'agentique
Trois canaux complémentaires :
- Intégration MCP Claude Code qui ajoute une status line live avec coût + carbone, et capture les
reasoning_tokensen plus des tokens visibles. Voir /claude-code-carbon. - Connecteur Anthropic Admin API pour Claude Enterprise — agrégation tenant-wide des sessions agent, séparation par projet / business unit. Voir documentation.
- Extension navigateur pour le mode ChatGPT Agent / Claude.ai web (incluant Atlas Health), capture les tokens client-side. Voir /extension.
Aucun prompt n'est lu — uniquement les compteurs de tokens (incluant reasoning_tokens et cached_tokens). L'output est un PDF type ESRS E1 avec ligne Scope 3 catégorie 1 dédiée « agents IA » prête à intégrer dans ton rapport CSRD.
Sources et lectures complémentaires
- Anthropic — Measuring Agent Autonomy (jan. 2026)
- Simon P. Couch — Electricity Use of AI Coding Agents (jan. 2026)
- Toolpod — AI Energy Consumption & Environmental Impact (2026)
- Anthropic — Long-Running Claude on HPC (SLURM 48h H100 examples)
- Earth911 — Your AI Carbon Footprint (mars 2026, Anthropic Scope 3 disclosure gap)
Les pages externes sont indépendantes ; carbon-llm n’approuve pas et ne contrôle pas le contenu tiers.