Modèle MoE chinois — efficience training notable (597 t CO₂e selon AI Index 2026).
Ordre de grandeur uniquement. Pour une équipe de 30 développeurs sur 22 jours ouvrés à 200k tokens/jour, on obtient ~59.40 kgCO₂e/mois. Pour une mesure auditable, branchez l' API /track ou l' extension.
Derived: MoE architecture (671B total / 37B active params) on CN grid 555 gCO₂/kWh (IEA 2023). DeepSeek-V3 technical report (arXiv:2412.19437) — 2,788 MWh training; inference efficiency higher than dense models. No vendor inference PCF published. Estimate conservative vs GPT-4o-class on CN grid.
Niveau de confiance affiché : Estimé. Mesuré = LCA vendeur ou divulgation infra ; Benchmarké = mesure académique (peer-reviewed ou preprint) ; Estimé = facteur classe / extrapolation publique. Pour la méthodologie complète, voir /methodology.
| Modèle | Vendeur | gCO₂e / 1k tokens |
|---|---|---|
| Llama 3 8B | Meta | 0.05 |
| Gemini 1.5 Flash | 0.075 | |
| Gemini 2.0 Flash | 0.08 | |
| GPT-4o mini | OpenAI | 0.1 |
| Claude 3 Haiku | Anthropic | 0.1 |
| Gemini 1.5 Pro | 0.12 |
Les chiffres ci-dessus sont des coefficients moyens. Votre déploiement réel peut varier de ±50 % selon le mix énergétique, la longueur des prompts et la part de cache. Branchez l' API /api/v1/track ou l' extension navigateur pour mesurer ce qui se passe vraiment chez vous.