Claude 3.5 Sonnet, Claude 4 Opus, Claude Code, extended thinking : Anthropic est devenu le second fournisseur LLM pour l'enterprise mais n'a publié aucune méthodologie environnementale détaillée à ce jour. Le rapport CarbonCredits du 14 novembre 2026 estime Claude 3 Opus à 4,05 Wh / 1,80 gCO₂e par requête (vs 0,30 Wh / 0,13 gCO₂e pour GPT-4o). Cet écart, le contrat AWS Indiana 1 200 acres et la question des disclosures AI Act expliquent pourquoi ce sujet est devenu chaud. Voici la lecture complète.

Suivre ce poste en production →

Envoyez les volumes de tokens vers notre API — mêmes coefficients que cet article. Offre gratuite, sans carte bancaire.

Essayer le calculateur Voir l'API

Combien consomme une requête Claude ? Les chiffres connus en 2026

Aucune donnée vendeur. Toutes les estimations viennent de chercheurs tiers. Voici les chiffres les plus crédibles disponibles aujourd'hui.

Modèle	Énergie / requête	CO₂e / requête	Source
Claude 3 Haiku	~0,1 Wh	~0,04 gCO₂e	Estimation classe Jegham 2025, AWS US-East
Claude 3.5 Sonnet	~0,8 Wh	~0,21 gCO₂e	Devera 2025 + Jegham 2025
Claude 3 Opus	4,05 Wh	1,80 gCO₂e	CarbonCredits 2026, méthodologie Cnaught
Claude 4 Sonnet	~1,2 Wh	~0,34 gCO₂e	Carbonlog v0.4 (PUE AWS 1.14, CIF 0.287 kg/kWh)
Claude 4 Opus + extended thinking	5 à 30× Sonnet selon thinking budget	1 à 8 gCO₂e / requête	Voir analyse reasoning models

Pour un développeur utilisant Claude Code 8h/jour avec extended thinking activé sur Opus, on parle de ~100-200 Wh/jourimputables à l'inférence, soit l'équivalent de 1 à 2 charges de smartphone complètes.

Pourquoi Anthropic ne publie pas

Trois raisons croisées, aucune n'étant satisfaisante d'un point de vue compliance EU :

Hébergement AWS pour la majorité de l'inférence : Anthropic ne contrôle pas directement les datacenters et dépend des disclosures AWS, qui sont agrégées au niveau région et ne distinguent pas les workloads Claude des autres.
Pas encore d'obligation: l'AI Act article 55 entre en application le 2 août 2026, voir notre analyse. Avant cette date, aucune base légale ne contraint à publier.
Considérations concurrentielles: publier le training cost (énergie + compute) revient à révéler des informations techniques sensibles que les concurrents pourraient exploiter pour comprendre l'architecture du modèle.

L'effet pratique : si vous êtes une entreprise CSRD-soumise qui appelle l'API Anthropic, vous n'avez pas de source vendeurà citer dans votre annexe ESRS E1-6. Vous devez soit utiliser un coefficient tiers (Jegham, Carbonlog, carbon-llm), soit attendre le rapport AI Office d'Anthropic dont la première publication est attendue après le 2 août 2026.

Le datacenter AWS Indiana : 1 200 acres dédiés à Anthropic

Amazon construit actuellement aux États-Unis (Indiana, comté de Jefferson) un complexe de 30 bâtiments sur 1 200 acres (~485 ha) dédié à l'infrastructure d'inférence et de training Anthropic. Ce site a déclenché un débat public local en raison de sa consommation électrique attendue : trois quarts des nouvelles centrales d'appoint sont au gaz naturel, et la moyenne grid Indiana est ~48 % plus carbonée que la moyenne américaine.

Implication pour le coefficient carbone d'une requête Claude : si l'inférence bascule progressivement vers Indiana, le coefficient effectif pourrait augmenter de 30 à 50 %par rapport au coefficient US-East (Virginia, plus propre). Les estimations Cnaught et carbon-llm sont aujourd'hui calculées sur AWS US-East à 0,287 kgCO₂e/kWh ; elles devront évoluer.

Comparaison rapide : Sonnet vs Opus vs Haiku

Le choix du modèle dans la famille Claude est le levier principal de réduction pour un usage donné. Ordre de grandeur typique :

Haiku → Sonnet : facteur ~5-7× sur l'énergie ;
Sonnet → Opus : facteur ~3-5× sur l'énergie ;
Opus → Opus + extended thinking : facteur ~5-30× selon thinking budget ;
au total : Haiku vs Opus extended thinking peut atteindre un facteur 100×.

Pour une équipe qui utilise massivement Claude Code, le pattern recommandé est documenté dans notre article sur le choix de modèle : Haiku par défaut, Sonnet par exception justifiée, Opus + extended thinking uniquement pour les ~5 % de tâches qui en bénéficient réellement.

Comment mesurer votre usage Claude réellement

Trois canaux distincts à instrumenter pour avoir une vue complète :

API serveur : appelez /api/v1/track de carbon-llm depuis votre backend avec le model id Anthropic, les prompt_tokens, completion_tokens et reasoning_tokens. Voir la doc API.
Claude Code en local : utilisez l'intégration Claude Code Carbon (MCP + status line) pour capter chaque tour de prompt avec le modèle utilisé et le détail thinking.
claude.ai navigateur: installez l'extension Chrome/Firefox : elle mesure côté client sans toucher au prompt.

Les trois canaux alimentent le même dashboard avec attribution par développeur, projet et tenant client.

FAQ rapide

Anthropic compense-t-il ses émissions ?Le site Anthropic mentionne un partenariat avec des cloud providers « renouvelables ». Pas de chiffre précis publié sur volume d'offsets ou méthodologie. C'est une posture, pas une donnée.
Faut-il privilégier Claude vs ChatGPT vs Gemini en fonction du carbone ?Sur la base des estimations actuelles, Gemini Flash est le plus sobre, Claude Sonnet et GPT-4o sont équivalents, Opus extended thinking est le plus gourmand. Mais les écarts entre cas d'usage (taille de prompt, qualité requise) dominent souvent ces écarts inter-vendeur.
Anthropic publiera-t-il après le 2 août 2026 ? Pour les modèles dépassant 10²⁵ FLOPs de training (Claude 3 Opus, Claude 4 Opus, sans doute Sonnet récents), l'article 55 AI Act impose une déclaration énergétique. La publication devrait suivre, sous une forme à définir par l'AI Office.
L'extended thinking est-il facturé en tokens séparés ? Oui, dans la réponse API usage, le champ cache_read_input_tokenset un champ thinking dédié permettent de distinguer la part raisonnement. Anthropic facture l'output total (visible + thinking).

Sources et lectures complémentaires

Les pages externes sont indépendantes ; carbon-llm n’approuve pas et ne contrôle pas le contenu tiers.