Anthropic l'a chiffré officiellement en janvier 2026 : la durée 99,9p d'une session Claude Code a doublé en 3 mois, passant de <25 min en octobre 2025 à >45 min en janvier 2026. Et 40 %+ des utilisateurs expérimentés utilisent maintenant l'auto-approve total — agents qui tournent overnight sans supervision. Une session de 45 minutes émet l'équivalent CO₂e de ~500 conversations ChatGPT classiques. C'est une ligne Scope 3 nouvelle, que la plupart des inventaires CSRD wave 2 vont rater.

Suivre ce poste en production →

Envoyez les volumes de tokens vers notre API — mêmes coefficients que cet article. Offre gratuite, sans carte bancaire.

Essayer le calculateur Voir l'API

Pourquoi un agent consomme tant plus qu'une chat

Trois multiplicateurs cumulatifs :

Reasoning models = 30-50× plus d'énergie qu'un modèle standard. Claude Opus 4.7 avec « xhigh » thinking effort peut générer 600+ reasoning tokens avant 2 tokens visibles (Toolpod 2026).
Tool calls multiples par tour: Read, Grep, Bash, Edit, WebFetch — chaque outil ramène du contexte qui s'empile dans l'input du tour suivant. Un agent Claude Code à 45 min = 30-60 tours de boucle.
Context windows extrêmes: Claude Opus 4.7 contexte 1 M tokens chargé à chaque tour. Le caching aide (-50 à -90 % sur les tokens répétés) mais ne compense pas l'explosion totale.

Mesure concrète de Simon P. Couch (janvier 2026) : une requête Claude Code medium-context (7 500 mots) = ~2,5 Wh, soit ~8× une requête ChatGPT vanilla. Multiplier par 30-60 tours = 75 à 150 Wh par session, ou 35 à 70 g CO₂e (mix UE 470 g/kWh). C'est l'équivalent énergie de 10 à 20 charges de smartphone par session.

Le multiplicateur « auto-approve »

Anthropic publie maintenant une métrique appelée « autonomy share »— le pourcentage d'actions Claude prend sans demander confirmation à l'humain. En janvier 2026, sur les utilisateurs expérimentés, cette part dépasse 40 %. Concrètement : un développeur lance claude --dangerously-skip-permissions avant de dîner, l'agent tourne pendant 2 h, fait 100 tours, modifie 30 fichiers, lance des tests, corrige les erreurs, recommence. Quand le développeur revient, la session a produit du résultat utile etémis l'équivalent CO₂e d'un trajet en train Paris-Lyon (~3-5 kg).

Et c'est encore plus marqué côté long-running Claude on HPC : Anthropic documente des exemples de jobs SLURM tournant 48 heures sur H100. Une H100 consomme ~700 W en charge → 48 h × 700 W = 33,6 kWh = ~16 kg CO₂e en mix UE, par session, par dev.

Le tableau de bord que ton DSI n'a pas

Usage IA	Énergie	CO₂e	Équivalent
1 requête ChatGPT texte	~0,3 Wh	~0,14 g	1 LED 5 min
1 requête Claude Opus 4.7 (reasoning xhigh)	~9 Wh	~4,2 g	30 LED 5 min
1 session Claude Code 45 min	~75-150 Wh	~35-70 g	10-20 charges smartphone
1 dev × 8 h × 20 jours Claude Code	~150 kWh / mois	~70 kg / mois	~300 km voiture thermique
Équipe 30 devs intensifs sur 1 an	~54 MWh	~25 t CO₂e	~12 vols Paris-NYC

Estimations triangulées Anthropic, Simon P. Couch (jan. 2026), Mistral LCA, mix UE 470 g/kWh. L'intervalle d'incertitude est de ±30 % — c'est délibérément bas pour les agents reasoning car les providers n'exposent pas les compteurs reasoning_tokens complets.

Et côté ChatGPT Agent Mode / Atlas Health

OpenAI a lancé en avril 2026 trois fonctionnalités agents : ChatGPT Agent (browsing autonome + actions), Atlas Health (interprétation continue de données médicales personnelles), et o3-pro autonomous research(recherche scientifique multi-heures). Les empreintes sont du même ordre que Claude Code : sessions de 20 à 60 minutes, dizaines de tool calls, reasoning tokens élevés. Le cas Atlas Health est particulier car l'agent tourne en continu en arrière-plan, ajoutant une consommation passive non-mesurée par les outils traditionnels.

Anthropic vise un facteur 10 d'autonomie d'ici fin 2026 — sessions de 4 à 8 heures sans intervention humaine. La consommation par dev pourrait atteindre 500 kWh / mois (~230 kg CO₂e / mois) par développeur à ce rythme.

Pour le RSE / sustainability lead : nouvelle ligne d'inventaire

Trois actions concrètes à mettre en place avant la clôture comptable 2026 :

Créer une sous-ligne Scope 3 « agents IA » à côté de « LLM chat usage ». Les deux ont des facteurs très différents — confondre les deux sous-déclare de 5 à 10×.
Capturer les compteurs reasoning_tokens (Anthropic et OpenAI les exposent depuis fin 2025). Sans ça, la mesure est inutile pour les modèles avec extended thinking.
Demander aux providers leur empreinte par token. Anthropic n'a pas publié de bilan Scope 1/2/3 fin mars 2026 — l'AI Act article 55 va l'y obliger pour les GPAI risque systémique à partir d'août 2026.

Comment carbon-llm capture l'agentique

Trois canaux complémentaires :

Intégration MCP Claude Code qui ajoute une status line live avec coût + carbone, et capture les reasoning_tokens en plus des tokens visibles. Voir /claude-code-carbon.
Connecteur Anthropic Admin API pour Claude Enterprise — agrégation tenant-wide des sessions agent, séparation par projet / business unit. Voir documentation.
Extension navigateur pour le mode ChatGPT Agent / Claude.ai web (incluant Atlas Health), capture les tokens client-side. Voir /extension.

Aucun prompt n'est lu — uniquement les compteurs de tokens (incluant reasoning_tokens et cached_tokens). L'output est un PDF type ESRS E1 avec ligne Scope 3 catégorie 1 dédiée « agents IA » prête à intégrer dans ton rapport CSRD.

Sources et lectures complémentaires

Les pages externes sont indépendantes ; carbon-llm n’approuve pas et ne contrôle pas le contenu tiers.