/
Tous les modèles
MetaBenchmarkéSortie 2024open-weights

Empreinte carbone de Llama 3 8B

Variante compacte Llama 3 — déploiement edge ou GPU consumer.

Coefficient
0.05
gCO₂e / 1 000 tokens
Énergie
0.143
Wh / 1 000 tokens (≈ 0,35 kgCO₂e/kWh)
Requête typique
0.040
gCO₂e pour 800 tokens
Journée dev
10.0
gCO₂e pour 200k tokens / jour

Ordre de grandeur uniquement. Pour une équipe de 30 développeurs sur 22 jours ouvrés à 200k tokens/jour, on obtient ~6.60 kgCO₂e/mois. Pour une mesure auditable, branchez l' API /track ou l' extension.

Méthodologie et source

Hugging Face leaderboard emissions analysis + small-model inference literature — order-of-magnitude benchmark

Niveau de confiance affiché : Benchmarké. Mesuré = LCA vendeur ou divulgation infra ; Benchmarké = mesure académique (peer-reviewed ou preprint) ; Estimé = facteur classe / extrapolation publique. Pour la méthodologie complète, voir /methodology.

Cas d'usage typiques pour Llama 3 8B

edgeresearchPOC self-host

Top 6 des modèles les plus sobres

ModèleVendeurgCO₂e / 1k tokens
Llama 3 8BMeta0.05
Gemini 1.5 FlashGoogle0.075
Gemini 2.0 FlashGoogle0.08
GPT-4o miniOpenAI0.1
Claude 3 HaikuAnthropic0.1
Gemini 1.5 ProGoogle0.12

Mesurer votre usage réel de Llama 3 8B

Les chiffres ci-dessus sont des coefficients moyens. Votre déploiement réel peut varier de ±50 % selon le mix énergétique, la longueur des prompts et la part de cache. Branchez l' API /api/v1/track ou l' extension navigateur pour mesurer ce qui se passe vraiment chez vous.