Le AI Energy Score, lancé par Salesforce avec Hugging Face en février 2025, note l'énergie d'inférence des modèles open source sur un benchmark standardisé. carbon-llm mesure ce que votredéploiement consomme dans la vraie vie. C'est deux questions complémentaires — pas concurrentes.
TL;DR : AI Energy Score pour comparer des modèles avant choix (procurement, sélection technique). carbon-llmpour mesurer l'empreinte réelle après déploiement, en multi-fournisseur, et le déclarer dans votre rapport ESRS.
Sources : AI Energy Score Leaderboard (HF), méthodologie Salesforce 2025. Mis à jour mai 2026.
| Critère | AI Energy Score | carbon-llm |
|---|---|---|
| Type de mesure | Score normatif a priori (1-5 étoiles) | Mesure agrégée a posteriori par token réel |
| Modèles couverts | Modèles ouverts hébergés sur Hugging Face | OpenAI, Anthropic, Mistral, Google, Cohere, open source self-hosted |
| Granularité | Par modèle, sur jeu standardisé | Par appel API, par projet, par tenant, par jour |
| Méthodologie | Inférence en conditions normalisées (10 tâches, hardware standardisé) | Coefficient × tokens, ajusté par modèle (LCA Mistral, Google, Jegham 2025) |
| Mise à jour | Manuelle, au gré de la communauté | Continue (chaque appel ajoute une mesure) |
| Action commerciale | Choix entre modèles avant déploiement | Reporting CSRD + optimisation FinOps + GreenOps continu |
| Couverture closed-source (GPT, Claude, Gemini) | yes (via méthodologie publique) | |
| Multi-tenant | ||
| Méthodologie de reporting | ||
| Traçabilité des coefficients | ||
| Reasoning tokens / extended thinking | ||
| Prix | Gratuit (consultation publique) | Phase d'accès anticipé, tout est gratuit |
Le AI Energy Score répond à « quel modèle choisir » ; carbon-llmrépond à « combien j'ai consommé » et « comment je le déclare ». Workflow recommandé :
Avant de déployer une fonctionnalité IA, consultez le AI Energy Score pour le top 3 des modèles candidats. Cela élimine déjà les options manifestement gourmandes pour des gains modestes d'accuracy. Les notes 4-5 étoiles vous mettent dans la zone frugale du marché.
Une fois en production, branchez l'API /api/v1/track ou l'extension pour capter les vrais volumes. Le AI Energy Score donne 0,3 Wh par requête sur 100 tokens ; vos utilisateurs réels font des requêtes 800 tokens. Le delta est essentiel pour le reporting.
Le AI Energy Score est un classement de modèles, pas un suivi de votre usage réel. carbon-llmmesure le CO₂ de chaque réponse et exporte l'usage en CSV. Vous citez la méthodologie publique sur /methodology et joignez votre annexe de période, coefficients et limites.
Les 6 questions qu'on nous pose le plus souvent au sujet du choix AI Energy Score vs carbon-llm.
Utilisez le AI Energy Score pour vos choix initiaux, et démarrez le tracking carbon-llm dès le premier appel API en production. Vous aurez les deux flux : a priori normalisé pour comparer, réel agrégé pour rendre des comptes.