Il existe deux grandes approches pour estimer les émissions liées à l'inférence : tokens × coefficient (activité × facteur) ou proxies matériels (durée, consommation électrique, intensité carbone du réseau). Aucune n'est « la vérité » ; les deux sont des modèles. Le bon choix dépend des données dont vous disposez réellement et de ce que vous devez défendre dans une note méthodologique.

Suivre ce poste en production →

Envoyez les volumes de tokens vers notre API — mêmes coefficients que cet article. Offre gratuite, sans carte bancaire.

Essayer le calculateur Voir l'API

Estimations basées sur les tokens

Vous multipliez les comptages de tokens normalisés par un facteur grammes de CO₂e par 1k tokens, idéalement issu d'ACV fournisseurs, de déclarations cloud ou de benchmarks évalués par des pairs, avec des labels de confiance explicites. Avantage : facile à intégrer, contrat d'API stable, agrégation aisée par client. Limite : les facteurs englobent le matériel, la région et le mix de flotte à moins de les décomposer dans votre propre modèle.

Estimations basées sur le matériel

Lorsque vous pouvez observer la durée d'inférence et supposer une enveloppe de puissance serveur ainsi qu'une intensité carbone du réseau (par exemple par pays), vous pouvez construire une approche énergie × intensité carbone. Avantage : parle le langage des équipes infrastructure. Limite : sensible aux hypothèses (modèle de GPU, utilisation, PUE) et souvent plus difficile à standardiser entre clients.

Maintenir l'honnêteté des comparaisons

Si vous exposez les deux méthodes, présentez-les côte à côte avec des niveaux de confiance différents — et non comme des totaux « officiels » en double. De nombreuses équipes utilisent les tokens pour les totaux récurrents de type Scope 3 et le matériel pour l'analyse de sensibilité ou la planification interne des capacités.

Avertissement. Le choix de la méthode interagit avec votre périmètre de reporting et votre matérialité. Impliquez les parties prenantes en charge du développement durable et du juridique pour les narratifs destinés au CSRD.

Méthodologie →API : /v1/estimate →