Meta Llama 3.1 8B Instruct
Meta
Code Multilingual Tool Calls
Meta Llama 3.1 8B Instruct e un trasformatore denso da 8 miliardi di parametri di Meta, progettato per il seguimento di istruzioni, la generazione di codice e compiti multilingue. Offre un ottimo equilibrio tra qualita ed efficienza nella categoria dei modelli piccoli, superando molte alternative di classe 7B nei benchmark standard. Il modello supporta il "tool calling" e otto lingue tra cui inglese, tedesco e francese. Con una finestra di contesto da 128K e supporto "flash attention", funziona comodamente su una singola GPU consumer ai livelli di quantizzazione Q4.
Configurazione hardware
Facoltativo — per raccomandazioni di distribuzione precise
| Quantizzazione | Qualità | Dimensione | Adeguatezza |
|---|---|---|---|
| FP32 | Piena precisione | 29.92 GB | — |
| Q8_0 | Alta | 7.95 GB | — |
| Q6_K | Alta | 6.14 GB | — |
| Q5_K_M | Media | 5.34 GB | — |
| Q5_K_S | Media | 5.21 GB | — |
| Q4_K_M | Media | 4.58 GB | — |
| Q4_K_S | Media | 4.37 GB | — |
| Q3_K_M | Bassa | 3.74 GB | — |
| Q3_K_S | Bassa | 3.41 GB | — |
| Q3_K_XL | Bassa | 4.45 GB | — |
| Q2_K | Bassa | 2.96 GB | — |
| Q2_K_L | Bassa | 3.44 GB | — |
| Q3_K_L | Bassa | 4.03 GB | — |
| Q4_0_4_4 | Bassa | 4.34 GB | — |
| Q4_0_4_8 | Bassa | 4.34 GB | — |
| Q4_0_8_8 | Bassa | 4.34 GB | — |
| Q4_K_L | Bassa | 4.95 GB | — |
| Q5_K_L | Bassa | 5.64 GB | — |
| Q6_K_L | Bassa | 6.38 GB | — |
Ultimo aggiornamento: 5 marzo 2026