/
Blog
·10 min de lecture

Empreinte carbone Claude : guide complet 2026 (Sonnet, Opus, extended thinking, AWS Indiana)

Aucune donnée vendeur d'Anthropic à ce jour. Pourtant CarbonCredits estime Claude 3 Opus à 4,05 Wh / 1,80 gCO₂e par requête vs 0,30 Wh pour GPT-4o. Lecture complète : chiffres connus par modèle, impact du datacenter AWS Indiana 1 200 acres, pourquoi Anthropic ne publie pas encore (et ce que change l'article 55 AI Act), comment mesurer votre usage réel.

Claude 3.5 Sonnet, Claude 4 Opus, Claude Code, extended thinking : Anthropic est devenu le second fournisseur LLM pour l'enterprise mais n'a publié aucune méthodologie environnementale détaillée à ce jour. Le rapport CarbonCredits du 14 novembre 2026 estime Claude 3 Opus à 4,05 Wh / 1,80 gCO₂e par requête (vs 0,30 Wh / 0,13 gCO₂e pour GPT-4o). Cet écart, le contrat AWS Indiana 1 200 acres et la question des disclosures AI Act expliquent pourquoi ce sujet est devenu chaud. Voici la lecture complète.

Suivre ce poste en production →

Envoyez les volumes de tokens vers notre API — mêmes coefficients que cet article. Offre gratuite, sans carte bancaire.

Combien consomme une requête Claude ? Les chiffres connus en 2026

Aucune donnée vendeur. Toutes les estimations viennent de chercheurs tiers. Voici les chiffres les plus crédibles disponibles aujourd'hui.

ModèleÉnergie / requêteCO₂e / requêteSource
Claude 3 Haiku~0,1 Wh~0,04 gCO₂eEstimation classe Jegham 2025, AWS US-East
Claude 3.5 Sonnet~0,8 Wh~0,21 gCO₂eDevera 2025 + Jegham 2025
Claude 3 Opus4,05 Wh1,80 gCO₂eCarbonCredits 2026, méthodologie Cnaught
Claude 4 Sonnet~1,2 Wh~0,34 gCO₂eCarbonlog v0.4 (PUE AWS 1.14, CIF 0.287 kg/kWh)
Claude 4 Opus + extended thinking5 à 30× Sonnet selon thinking budget1 à 8 gCO₂e / requêteVoir analyse reasoning models

Pour un développeur utilisant Claude Code 8h/jour avec extended thinking activé sur Opus, on parle de ~100-200 Wh/jourimputables à l'inférence, soit l'équivalent de 1 à 2 charges de smartphone complètes.

Pourquoi Anthropic ne publie pas

Trois raisons croisées, aucune n'étant satisfaisante d'un point de vue compliance EU :

  • Hébergement AWS pour la majorité de l'inférence : Anthropic ne contrôle pas directement les datacenters et dépend des disclosures AWS, qui sont agrégées au niveau région et ne distinguent pas les workloads Claude des autres.
  • Pas encore d'obligation: l'AI Act article 55 entre en application le 2 août 2026, voir notre analyse. Avant cette date, aucune base légale ne contraint à publier.
  • Considérations concurrentielles: publier le training cost (énergie + compute) revient à révéler des informations techniques sensibles que les concurrents pourraient exploiter pour comprendre l'architecture du modèle.

L'effet pratique : si vous êtes une entreprise CSRD-soumise qui appelle l'API Anthropic, vous n'avez pas de source vendeurà citer dans votre annexe ESRS E1-6. Vous devez soit utiliser un coefficient tiers (Jegham, Carbonlog, carbon-llm), soit attendre le rapport AI Office d'Anthropic dont la première publication est attendue après le 2 août 2026.

Le datacenter AWS Indiana : 1 200 acres dédiés à Anthropic

Amazon construit actuellement aux États-Unis (Indiana, comté de Jefferson) un complexe de 30 bâtiments sur 1 200 acres (~485 ha) dédié à l'infrastructure d'inférence et de training Anthropic. Ce site a déclenché un débat public local en raison de sa consommation électrique attendue : trois quarts des nouvelles centrales d'appoint sont au gaz naturel, et la moyenne grid Indiana est ~48 % plus carbonée que la moyenne américaine.

Implication pour le coefficient carbone d'une requête Claude : si l'inférence bascule progressivement vers Indiana, le coefficient effectif pourrait augmenter de 30 à 50 %par rapport au coefficient US-East (Virginia, plus propre). Les estimations Cnaught et carbon-llm sont aujourd'hui calculées sur AWS US-East à 0,287 kgCO₂e/kWh ; elles devront évoluer.

Comparaison rapide : Sonnet vs Opus vs Haiku

Le choix du modèle dans la famille Claude est le levier principal de réduction pour un usage donné. Ordre de grandeur typique :

  • Haiku → Sonnet : facteur ~5-7× sur l'énergie ;
  • Sonnet → Opus : facteur ~3-5× sur l'énergie ;
  • Opus → Opus + extended thinking : facteur ~5-30× selon thinking budget ;
  • au total : Haiku vs Opus extended thinking peut atteindre un facteur 100×.

Pour une équipe qui utilise massivement Claude Code, le pattern recommandé est documenté dans notre article sur le choix de modèle : Haiku par défaut, Sonnet par exception justifiée, Opus + extended thinking uniquement pour les ~5 % de tâches qui en bénéficient réellement.

Comment mesurer votre usage Claude réellement

Trois canaux distincts à instrumenter pour avoir une vue complète :

  1. API serveur : appelez /api/v1/track de carbon-llm depuis votre backend avec le model id Anthropic, les prompt_tokens, completion_tokens et reasoning_tokens. Voir la doc API.
  2. Claude Code en local : utilisez l'intégration Claude Code Carbon (MCP + status line) pour capter chaque tour de prompt avec le modèle utilisé et le détail thinking.
  3. claude.ai navigateur: installez l'extension Chrome/Firefox : elle mesure côté client sans toucher au prompt.

Les trois canaux alimentent le même dashboard avec attribution par développeur, projet et tenant client.

FAQ rapide

  • Anthropic compense-t-il ses émissions ?Le site Anthropic mentionne un partenariat avec des cloud providers « renouvelables ». Pas de chiffre précis publié sur volume d'offsets ou méthodologie. C'est une posture, pas une donnée.
  • Faut-il privilégier Claude vs ChatGPT vs Gemini en fonction du carbone ?Sur la base des estimations actuelles, Gemini Flash est le plus sobre, Claude Sonnet et GPT-4o sont équivalents, Opus extended thinking est le plus gourmand. Mais les écarts entre cas d'usage (taille de prompt, qualité requise) dominent souvent ces écarts inter-vendeur.
  • Anthropic publiera-t-il après le 2 août 2026 ? Pour les modèles dépassant 10²⁵ FLOPs de training (Claude 3 Opus, Claude 4 Opus, sans doute Sonnet récents), l'article 55 AI Act impose une déclaration énergétique. La publication devrait suivre, sous une forme à définir par l'AI Office.
  • L'extended thinking est-il facturé en tokens séparés ? Oui, dans la réponse API usage, le champ cache_read_input_tokenset un champ thinking dédié permettent de distinguer la part raisonnement. Anthropic facture l'output total (visible + thinking).

Sources et lectures complémentaires

Les pages externes sont indépendantes ; carbon-llm n’approuve pas et ne contrôle pas le contenu tiers.

Quelle IA tourne dans votre boîte ?

Installez l'extension carbon-llm. Tableau de bord perso pour chaque collaborateur, vue d'ensemble pour la direction.

Gratuit pendant la phase d'accès anticipé. Aucun prompt n'est lu, uniquement les compteurs de tokens et le modèle. Désinstallable en un clic.