Si vous recherchez « grammes de CO₂ par requête ChatGPT », vous trouverez des réponses qui semblent incompatibles — de moins d'un dixième de gramme à plusieurs grammes pour un seul échange. Cette confusion n'est pas que du bruit sur les réseaux sociaux : différentes études mesurent des périmètres différents (inférence seule vs entraînement amorti), des charges de travail différentes (chat court vs long contexte + outils), et des réseaux électriques différents. Pour les équipes de développement durable et de finance, la bonne décision n'est pas de choisir le titre le plus accrocheur ; c'est d'adopter un jeu de données d'activité reproductible (tokens, modèle, environnement) que votre narratif CSRD pourra défendre.
Suivre ce poste en production →
Envoyez les volumes de tokens vers notre API — mêmes coefficients que cet article. Offre gratuite, sans carte bancaire.
Ce que disent réellement les estimations récentes des fournisseurs et de la recherche
Des groupes de modélisation indépendants ont mis à jour leurs estimations ascendantes au fur et à mesure de l'amélioration des modèles et du matériel. Epoch AI, en revisitant l'usage de type ChatGPT avec des hypothèses plus claires, constate qu'une requête GPT-4o typique peut avoisiner ~0,3 watt-heure d'électricité — sensiblement plus bas que certaines estimations approximatives du début 2023, principalement en raison des gains d'efficacité et d'hypothèses de tokens plus réalistes. Dans ses commentaires publics, OpenAI a pointé un ordre de grandeur similaire pour une interaction ChatGPT « moyenne » (de l'ordre de quelques dixièmes de watt-heure par requête).
Google a publié une méthodologie indiquant qu'un prompt texte médian à Gemini peut être de l'ordre de ~0,24 Wh avec un faible chiffre de CO₂e associé pour ce scénario divulgué — un point de données inhabituellement transparent, mais qui reste un produit et une définition du « prompt médian », et non un coefficient universel pour chaque appel LLM de votre entreprise.
Les commentaires et analyses secondaires qui convertissent les watt-heures en grammes appliquent souvent un facteur d'émission du réseau électrique. C'est à cette étape que deux calculateurs honnêtes divergent : les mêmes 0,3 Wh paraissent différents dans une région à dominante hydraulique que dans une à dominante charbon. Tout chiffre unique de « grammes par requête » sans indiquer le facteur utilisé est incomplet.
Pourquoi certains titres disent « quelques grammes » et d'autres « négligeable »
- Inférence vs tout le reste. L'entraînement, le matériel incorporé, le surprovisionnement et le refroidissement peuvent être inclus ou exclus. Le reporting d'entreprise commence généralement par l'électricité opérationnelle pour l'inférence et documente ce qui est hors périmètre.
- Forme de la charge de travail. Une courte paire question-réponse n'est pas comparable à une session d'agent de codage avec de nombreux appels d'outils, ou à un préchargement de long document où le calcul s'adapte aux tokens et à l'architecture du modèle. Des articles de praticiens notent des écarts de plusieurs ordres de grandeur entre le « chat médian » et les workflows « agentiques ».
- Modèles de raisonnement. Les nouvelles stacks de « raisonnement » peuvent dépenser bien plus de tokens (et de temps) par réponse visible par l'utilisateur que le chat classique, ce qui pousse l'énergie par tâche vers des catégories plus lourdes — plus proche de la façon dont les gens pensent déjà au streaming ou aux traitements par lots qu'à une simple recherche web.
CSRD, ESRS E1, et où l'utilisation de LLM apparaît
Dans le cadre du reporting de durabilité des entreprises de l'UE, ESRS E1 (Changement climatique) attend une image structurée des gaz à effet de serre : Scopes 1–3, objectifs et narratif de transition là où c'est matériel. Les services cloud et d'IA achetés poussent généralement les équipes vers des discussions sur le Scope 3 — notamment les catégories liées aux biens et services achetés — plutôt que de prétendre que l'IA générative est immatérielle parce que « c'est du logiciel ».
L'exigence de reporting n'est pas de deviner un mème CO₂ viral ; c'est de montrer comment vous savez ce que vous affirmez : données d'activité, hypothèses et limitations. C'est pourquoi les responsables finance et développement durable demandent de plus en plus à l'ingénierie des données d'utilisation au niveau des tokens liées aux centres de coûts ou aux produits — la même colonne vertébrale que vous utiliseriez pour l'économie unitaire, avec un facteur d'émission documenté par-dessus.
Pour une cartographie interne plus approfondie, commencez par nos articles sur les premières étapes du Scope 3 pour l'utilisation LLM, pourquoi les estimations par requête divergent, et les coefficients tokens → CO₂e.
Une liste de contrôle de journalisation pratique (meilleure que débattre des moyennes)
- Capturez les tokens de prompt et de complétion (et l'identifiant du modèle) depuis les API fournisseurs — ces champs existent précisément pour que l'usage soit auditable.
- Séparez les environnements (prod vs sandbox) et les principaux produits afin que les allocations Scope 3 ne s'effondrent pas dans un seul panier.
- Versionnez vos coefficients et indiquez s'ils couvrent uniquement l'inférence ; recalculez lorsque vous changez de région ou de fournisseur.
- Étiquetez l'incertitude lorsque la localisation du réseau électrique d'une requête spécifique est inconnue — une lacune courante relevée dans les méthodologies de comptabilité tierces.
Visualisez l'impact pendant que vous travaillez
Pour les individus et les équipes qui souhaitent un retour indicatif au moment de l'utilisation — sans nous envoyer le texte du prompt — l' extension Chrome carbon-llm convertit l'utilisation rapportée par le fournisseur en CO₂e approximatif, et Mon empreinte agrège les tendances dans le temps. Associez cela à notre méthodologie pour savoir ce qui est inclus ou non dans l'estimation.
Sources et lectures complémentaires
- Epoch AI — How much energy does ChatGPT use?
- Earth911 — synthesis of vendor figures (incl. Gemini methodology, grid factors)
- ArXiv — How Hungry is AI? (energy, water, carbon footprint of LLM inference)
- Cnaught — ranges, comparators, and why disclosure is uneven across vendors
- Gravity Climate — enterprise emissions accounting methodology for AI usage
- Senken — CSRD / ESRS E1 practical guide (GHG & Scope 3 framing)
Les pages externes sont indépendantes ; carbon-llm n’approuve pas et ne contrôle pas le contenu tiers.
Avertissement. Cet article résume des recherches publiques et des déclarations de fournisseurs à des fins éducatives ; il ne constitue pas un conseil juridique. L'applicabilité du CSRD dépend de votre entité et de votre calendrier — vérifiez avec vos conseillers.