Si vous souhaitez une empreinte carbone LLM capable de résister à une revue (et plus tard à une assurance), vous avez besoin de plus qu'un titre « grammes par réponse ». La voie la plus défendable est basée sur les coefficients : convertissez les données d'activité (tokens en entrée + tokens en sortie) en CO₂e à l'aide d'un facteur d'émission documenté, puis conservez la traçabilité autour des hypothèses, des versions et des périmètres.
Suivre ce poste en production →
Envoyez les volumes de tokens vers notre API — mêmes coefficients que cet article. Offre gratuite, sans carte bancaire.
1) Collecter les tokens comme données d'activité
Votre point de départ est les métadonnées d'utilisation renvoyées par votre fournisseur LLM (ou passerelle). Pour chaque événement d'inférence pertinent, capturez :
- tokens_total = prompt_tokens + completion_tokens
- identité du modèle (clé stable pour la correspondance avec une table de coefficients)
- fenêtre temporelle (ex. le mois que vous déclarez)
- environnement (test vs production, si votre périmètre de reporting diffère)
2) Utiliser des coefficients avec une provenance claire
Les coefficients sont là où les praticiens se retrouvent souvent bloqués : différents fournisseurs publient des documents différents, et la littérature peut varier selon les hypothèses. La solution pratique est de maintenir une table de coefficients qui comporte, pour chaque modèle :
- valeur (ex. grammes CO₂e pour 1 000 tokens)
- label de confiance (mesuré / benchmarké / estimé)
- lien ou référence de la source
- historique des révisions (ce qui a changé, quand et pourquoi)
3) Calculer le CO₂e à partir des tokens
Le calcul basé sur les coefficients est volontairement simple :
CO₂e (g) = (tokens_total / 1 000) × coefficient_modèle (gCO₂e pour 1 000 tokens)
En pratique, vous agrégez par modèle puis faites la somme des modèles pour la période que vous déclarez. Cela rend le calcul rapide, reproductible et facile à auditer.
4) Ajouter du contexte : limites et incertitudes
Un article SEO robuste ne se termine pas avec la formule — un article prêt pour l'audit, si. Votre note méthodologique doit explicitement aborder ce que vous ne modélisez pas ligne par ligne :
- la variabilité au niveau du centre de données (mix réseau, localisation et mix de charges de travail)
- les changements de versions de modèles et de paramètres opérationnels dans le temps
- les effets réseau / la granularité du PUE lorsque vous n'avez que des facteurs agrégés
5) Le relier au cadre de reporting (style Scope 3)
Pour de nombreuses organisations consommant des services LLM tiers, ce calcul soutient les discussions de type Scope 3, catégorie 1 : biens et services achetés. Cependant, la « bonne catégorie » est une décision de périmètre. Lorsque vous intégrez l'IA dans les biens/services que vous vendez, certaines organisations discutent également des considérations de catégorie 11 (utilisation des produits vendus). Voir : Scope 3 catégorie 1 vs 11 pour les services IA / LLM.
6) Liste de contrôle opérationnelle (ce qu'il faut documenter)
Si vous souhaitez quelque chose que vous pouvez intégrer dans votre workflow ESRS E1 / audit interne, documentez :
- Quelle fenêtre temporelle a été incluse (et les exclusions)
- Quelles clés de modèle ont été mappées à quelles lignes de coefficients
- Quelle révision de coefficient a été utilisée pour chaque période de reporting
- Comment le test vs la production a été traité (le cas échéant)
- Comment vous gérez les champs d'utilisation manquants ou les changements de fournisseur
Avertissement. Cet article est pédagogique et ne constitue pas un conseil juridique. Les exigences CSRD/ESRS et les attentes en matière d'assurance évoluent. Faites-vous accompagner par des conseillers qualifiés et alignez les informations publiées sur l'évaluation de double matérialité de votre entreprise et les recommandations de votre auditeur.