Aller au contenu

Meta Llama 3.1 8B Instruct

Meta
Code Multilingual Tool Calls

Meta Llama 3.1 8B Instruct est un transformeur dense de 8 milliards de parametres de Meta, concu pour le suivi d'instructions, la generation de code et les taches multilingues. Il offre un excellent equilibre entre qualite et efficacite dans la categorie des petits modeles, surpassant de nombreuses alternatives de classe 7B sur les benchmarks standards. Le modele prend en charge le "tool calling" et huit langues dont l'anglais, l'allemand et le francais. Avec une fenetre de contexte de 128K et le support "flash attention", il fonctionne confortablement sur un seul GPU grand public aux niveaux de quantification Q4.

Configuration matérielle

Facultatif — pour des recommandations de déploiement précises
Quantification Qualité Taille Adéquation
FP32 Pleine précision 29.92 GB
Q8_0 Élevée 7.95 GB
Q6_K Élevée 6.14 GB
Q5_K_M Moyenne 5.34 GB
Q5_K_S Moyenne 5.21 GB
Q4_K_M Moyenne 4.58 GB
Q4_K_S Moyenne 4.37 GB
Q3_K_M Basse 3.74 GB
Q3_K_S Basse 3.41 GB
Q3_K_XL Basse 4.45 GB
Q2_K Basse 2.96 GB
Q2_K_L Basse 3.44 GB
Q3_K_L Basse 4.03 GB
Q4_0_4_4 Basse 4.34 GB
Q4_0_4_8 Basse 4.34 GB
Q4_0_8_8 Basse 4.34 GB
Q4_K_L Basse 4.95 GB
Q5_K_L Basse 5.64 GB
Q6_K_L Basse 6.38 GB
Dernière mise à jour : 5 mars 2026