Meta Llama 3.1 8B Instruct

Code Multilingual Tool Calls

Meta Llama 3.1 8B Instruct est un transformeur dense de 8 milliards de parametres de Meta, concu pour le suivi d'instructions, la generation de code et les taches multilingues. Il offre un excellent equilibre entre qualite et efficacite dans la categorie des petits modeles, surpassant de nombreuses alternatives de classe 7B sur les benchmarks standards. Le modele prend en charge le "tool calling" et huit langues dont l'anglais, l'allemand et le francais. Avec une fenetre de contexte de 128K et le support "flash attention", il fonctionne confortablement sur un seul GPU grand public aux niveaux de quantification Q4.

Configuration matérielle

Fabricant

Produit

Plateforme

Famille

Modèle

VRAM

RAM système (Go) Facultatif — pour des recommandations de déploiement précises

Quantification	Qualité	Taille	Adéquation
FP32	Pleine précision	29.92 GB	—
Q8_0	Élevée	7.95 GB	—
Q6_K	Élevée	6.14 GB	—
Q5_K_M	Moyenne	5.34 GB	—
Q5_K_S	Moyenne	5.21 GB	—
Q4_K_M	Moyenne	4.58 GB	—
Q4_K_S	Moyenne	4.37 GB	—
Q3_K_M	Basse	3.74 GB	—
Q3_K_S	Basse	3.41 GB	—
Q3_K_XL	Basse	4.45 GB	—
Q2_K	Basse	2.96 GB	—
Q2_K_L	Basse	3.44 GB	—
Q3_K_L	Basse	4.03 GB	—
Q4_0_4_4	Basse	4.34 GB	—
Q4_0_4_8	Basse	4.34 GB	—
Q4_0_8_8	Basse	4.34 GB	—
Q4_K_L	Basse	4.95 GB	—
Q5_K_L	Basse	5.64 GB	—
Q6_K_L	Basse	6.38 GB	—

Dernière mise à jour : 24 mars 2026