Salta ai contenuti

Meta Llama 3.1 8B Instruct

Meta
Code Multilingual Tool Calls

Meta Llama 3.1 8B Instruct e un trasformatore denso da 8 miliardi di parametri di Meta, progettato per il seguimento di istruzioni, la generazione di codice e compiti multilingue. Offre un ottimo equilibrio tra qualita ed efficienza nella categoria dei modelli piccoli, superando molte alternative di classe 7B nei benchmark standard. Il modello supporta il "tool calling" e otto lingue tra cui inglese, tedesco e francese. Con una finestra di contesto da 128K e supporto "flash attention", funziona comodamente su una singola GPU consumer ai livelli di quantizzazione Q4.

Configurazione hardware

Facoltativo — per raccomandazioni di distribuzione precise
Quantizzazione Qualità Dimensione Adeguatezza
FP32 Piena precisione 29.92 GB
Q8_0 Alta 7.95 GB
Q6_K Alta 6.14 GB
Q5_K_M Media 5.34 GB
Q5_K_S Media 5.21 GB
Q4_K_M Media 4.58 GB
Q4_K_S Media 4.37 GB
Q3_K_M Bassa 3.74 GB
Q3_K_S Bassa 3.41 GB
Q3_K_XL Bassa 4.45 GB
Q2_K Bassa 2.96 GB
Q2_K_L Bassa 3.44 GB
Q3_K_L Bassa 4.03 GB
Q4_0_4_4 Bassa 4.34 GB
Q4_0_4_8 Bassa 4.34 GB
Q4_0_8_8 Bassa 4.34 GB
Q4_K_L Bassa 4.95 GB
Q5_K_L Bassa 5.64 GB
Q6_K_L Bassa 6.38 GB
Ultimo aggiornamento: 5 marzo 2026