Question 1

Le AI Energy Score couvre-t-il GPT-4o, Claude Sonnet ou Gemini ?

Accepted Answer

Non — le AI Energy Score (Salesforce + Hugging Face) ne couvre que les modèles open source hébergés sur Hugging Face. Les modèles dominants en enterprise (GPT-4o, Claude Sonnet, Gemini 2.5) ne sont pas notables sur la même échelle car Hugging Face ne peut pas les exécuter en conditions normalisées. carbon-llm couvre OpenAI, Anthropic, Mistral, Google et Cohere via méthodologie publique.

Question 2

Que mesure exactement le score 1-5 étoiles du AI Energy Score ?

Accepted Answer

L'énergie consommée par inférence d'un modèle open source sur 10 tâches standardisées (résumé, code, QA, génération…) exécutées sur du hardware standardisé Hugging Face. C'est un score normatif a priori — pas ce que VOUS consommez en production avec vos requêtes réelles. Utile pour comparer plusieurs modèles avant déploiement.

Question 3

Le AI Energy Score est-il suffisant pour un rapport CSRD ESRS E1-6 ?

Accepted Answer

Non. C'est un benchmark, pas un suivi. Vous ne pouvez pas dire à votre commissaire aux comptes « notre consommation 2026 = X kgCO2e » sur la base du AI Energy Score seul — il faut des mesures agrégées sur la période de reporting, une méthodologie datée et des limites explicites. carbon-llm fournit la base de mesure et la documentation méthodologique.

Question 4

Quelle différence entre score normatif (a priori) et mesure réelle (a posteriori) ?

Accepted Answer

A priori (AI Energy Score) : « ce modèle, sur tâches standardisées, consomme X étoiles d'énergie ». A posteriori (carbon-llm) : « VOS appels API en production sur cette période ont émis Y gCO2e, par projet, par tenant ». Les deux sont complémentaires : a priori pour choisir, a posteriori pour rendre des comptes.

Question 5

Peut-on combiner AI Energy Score (choix modèle) et carbon-llm (suivi production) ?

Accepted Answer

Oui — c'est même l'usage recommandé. Vous utilisez le AI Energy Score pour benchmarker plusieurs modèles open source avant de choisir (« Llama 70B est-il plus efficace que Mixtral 8x22B ? »), puis vous suivez la consommation réelle avec carbon-llm dès le premier appel API en production. Vous avez les deux flux : a priori normalisé pour comparer, réel agrégé pour la CSRD.

Question 6

Le AI Energy Score est-il mis à jour automatiquement quand un nouveau modèle sort ?

Accepted Answer

Non — la mise à jour dépend de contributions communautaires. Certains modèles populaires manquent ou ont du retard. La cadence de mise à jour est très inférieure à la fréquence de sortie des modèles enterprise. carbon-llm intègre les nouveaux modèles dès qu'un coefficient public est disponible (LCA constructeur ou Jegham 2025 pour les API closed-source).

Critère	AI Energy Score	carbon-llm
Type de mesure	Score normatif a priori (1-5 étoiles)	Mesure agrégée a posteriori par token réel
Modèles couverts	Modèles ouverts hébergés sur Hugging Face	OpenAI, Anthropic, Mistral, Google, Cohere, open source self-hosted
Granularité	Par modèle, sur jeu standardisé	Par appel API, par projet, par tenant, par jour
Méthodologie	Inférence en conditions normalisées (10 tâches, hardware standardisé)	Coefficient × tokens, ajusté par modèle (LCA Mistral, Google, Jegham 2025)
Mise à jour	Manuelle, au gré de la communauté	Continue (chaque appel ajoute une mesure)
Action commerciale	Choix entre modèles avant déploiement	Reporting CSRD + optimisation FinOps + GreenOps continu
Couverture closed-source (GPT, Claude, Gemini)		yes (via méthodologie publique)
Multi-tenant
Méthodologie de reporting
Traçabilité des coefficients
Reasoning tokens / extended thinking
Prix	Gratuit (consultation publique)	Phase d'accès anticipé, tout est gratuit

AI Energy Score (HF) ou carbon-llm ?

Comparatif détaillé

Pourquoi les deux ensemble

Phase 1 — Choix du modèle

Phase 2 — Déploiement et mesure réelle

Phase 3 — Déclaration ESRS / SB 253

Limites du AI Energy Score à connaître

Questions fréquentes

Choisir vite, mesurer dans la durée