Toutes les charges de travail LLM n'ont pas besoin d'une réponse en quelques millisecondes. Le scoring par lots, le retraitement, la génération de données synthétiques et les évaluations hors ligne peuvent souvent être décalés dans le temps ou l'espace. Lorsque l'électricité provient d'un réseau dont l'intensité carbone varie selon l'heure et la région, planifier le calcul flexible sur une énergie plus propre est l'un des rares leviers qui réduit les émissions opérationnelles sans modifier le modèle.
Suivre ce poste en production →
Envoyez les volumes de tokens vers notre API — mêmes coefficients que cet article. Offre gratuite, sans carte bancaire.
Intensité moyenne vs. marginale
L'intensité carbone du réseau peut être exprimée comme moyenne (mix typique du réseau) ou marginale (émissions du prochain kWh incrémental). Les signaux marginaux sont souvent utilisés dans la recherche sur l'ordonnancement carbone-conscient car ils correspondent à la répartition à court terme des centrales. En pratique, les équipes produit ne disposent souvent que de moyennes régionales horaires provenant de données ouvertes ou d'outils cloud—documentez celle que vous utilisez et évitez de mélanger les méthodes au sein d'un même KPI.
Ce que la littérature 2025 quantifie désormais
La recherche est passée de plages théoriques à des résultats de production mesurés :
- EcoServe (fév. 2025, arXiv 2502.05043) — un cadre d'approvisionnement en ressources et d'ordonnancement carbone-conscient pour le service LLM, basé sur un principe 4R (Réduire, Réutiliser, Redimensionner, Recycler). Des traces de production d'un grand fournisseur cloud montrent jusqu'à 47 % de réduction carbone par rapport aux références optimisées pour la performance, tout en maintenant les SLO.
- Potentiel de compensation par les renouvelables jusqu'à 69,2 % — un cadre basé sur des simulations (arXiv 2507.11417, 2025) couplant des simulateurs d'inférence LLM avec des modèles carbone du réseau montre que l'ordonnancement carbone-conscient de l'inférence peut compenser jusqu'à 69,2 % des émissions dans des scénarios de déploiement illustratifs riches en énergies renouvelables.
- Le carbone de l'inférence LLM pourrait croître de 2,8× d'ici 2035 — même en tenant compte des gains d'efficacité matérielle liés à la loi de Moore (10×) et de la décarbonation du réseau (réduction de 2× de l'intensité carbone), l'augmentation projetée de 55× des charges de travail d'inférence signifie que les émissions nettes d'inférence LLM pourraient plus que doubler sans interventions actives d'ordonnancement (MDPI Sustainability, 2025).
- Fluctuations horaires de l'intensité du réseau supérieures à 40 % — la Californie, l'Allemagne et certaines parties de l'Asie connaissent de grandes fluctuations intra-journalières alors que l'éolien culmine la nuit et le solaire à midi. Décaler un travail par lots de 14 h à 2 h du matin peut réduire l'intensité carbone du réseau de 40 % dans ces régions.
L'enseignement pour les équipes LLM : les API par lots et les files d'attente asynchrones sont des outils climatiques, pas seulement des outils de coût. EcoServe démontre que c'est viable en production, pas seulement académique.
Comment mettre en œuvre sans briser les SLA
- Classer les tâches en interactives vs. différables ; seules ces dernières sont candidates au décalage.
- Limiter le délai avec des SLO explicites (par ex. « dans les 6 heures ») afin que les responsables produit gardent le contrôle.
- Privilégier les régions avec à la fois une faible intensité carbone et une résidence des données acceptable.
- Journaliser la consommation d'énergie ou de tokens avec la fenêtre de planification afin que la finance et la durabilité puissent réconcilier les chiffres—en cohérence avec le suivi de qualité API.
Périmètres de reporting
Pour les divulgations de type CSRD, l'ordonnancement carbone-conscient modifie les narratifs Scope 2 opérationnel / marché lorsqu'il est associé à des PPA ou à des choix de localisation—mais seulement si votre chaîne de preuves correspond à la règle de reporting que vous appliquez. En cas de doute, associez les métriques opérationnelles à la discipline des périmètres GHG Protocol.
Sources et lectures complémentaires
- arXiv — Calcul carbone-conscient pour les centres de données (Google, discussion marginal vs. moyen)
- arXiv — Demande d'électricité et impacts réseaux des centres de données IA (références sur le décalage de charge)
- MDPI Sustainability — Décalage spatio-temporel carbone-conscient des charges de travail (revue)
Les pages externes sont indépendantes ; carbon-llm n’approuve pas et ne contrôle pas le contenu tiers.
Avertissement. Les signaux du réseau et les capacités des fournisseurs varient ; validez les contraintes réglementaires et contractuelles avant de déplacer des données ou des charges de travail entre régions.