Meta Llama 3.1 8B Instruct
Meta
Code Multilingual Tool Calls
Meta Llama 3.1 8B Instruct est un transformeur dense de 8 milliards de parametres de Meta, concu pour le suivi d'instructions, la generation de code et les taches multilingues. Il offre un excellent equilibre entre qualite et efficacite dans la categorie des petits modeles, surpassant de nombreuses alternatives de classe 7B sur les benchmarks standards. Le modele prend en charge le "tool calling" et huit langues dont l'anglais, l'allemand et le francais. Avec une fenetre de contexte de 128K et le support "flash attention", il fonctionne confortablement sur un seul GPU grand public aux niveaux de quantification Q4.
Configuration matérielle
Facultatif — pour des recommandations de déploiement précises
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| FP32 | Pleine précision | 29.92 GB | — |
| Q8_0 | Élevée | 7.95 GB | — |
| Q6_K | Élevée | 6.14 GB | — |
| Q5_K_M | Moyenne | 5.34 GB | — |
| Q5_K_S | Moyenne | 5.21 GB | — |
| Q4_K_M | Moyenne | 4.58 GB | — |
| Q4_K_S | Moyenne | 4.37 GB | — |
| Q3_K_M | Basse | 3.74 GB | — |
| Q3_K_S | Basse | 3.41 GB | — |
| Q3_K_XL | Basse | 4.45 GB | — |
| Q2_K | Basse | 2.96 GB | — |
| Q2_K_L | Basse | 3.44 GB | — |
| Q3_K_L | Basse | 4.03 GB | — |
| Q4_0_4_4 | Basse | 4.34 GB | — |
| Q4_0_4_8 | Basse | 4.34 GB | — |
| Q4_0_8_8 | Basse | 4.34 GB | — |
| Q4_K_L | Basse | 4.95 GB | — |
| Q5_K_L | Basse | 5.64 GB | — |
| Q6_K_L | Basse | 6.38 GB | — |
Dernière mise à jour : 5 mars 2026