Meta Llama 3.1 8B Instruct

Code Multilingual Tool Calls

Meta Llama 3.1 8B Instruct e un trasformatore denso da 8 miliardi di parametri di Meta, progettato per il seguimento di istruzioni, la generazione di codice e compiti multilingue. Offre un ottimo equilibrio tra qualita ed efficienza nella categoria dei modelli piccoli, superando molte alternative di classe 7B nei benchmark standard. Il modello supporta il "tool calling" e otto lingue tra cui inglese, tedesco e francese. Con una finestra di contesto da 128K e supporto "flash attention", funziona comodamente su una singola GPU consumer ai livelli di quantizzazione Q4.

Configurazione hardware

Produttore

Prodotto

Piattaforma

Famiglia

Modello

VRAM

RAM di sistema (GB) Facoltativo — per raccomandazioni di distribuzione precise

Quantizzazione	Qualità	Dimensione	Adeguatezza
FP32	Piena precisione	29.92 GB	—
Q8_0	Alta	7.95 GB	—
Q6_K	Alta	6.14 GB	—
Q5_K_M	Media	5.34 GB	—
Q5_K_S	Media	5.21 GB	—
Q4_K_M	Media	4.58 GB	—
Q4_K_S	Media	4.37 GB	—
Q3_K_M	Bassa	3.74 GB	—
Q3_K_S	Bassa	3.41 GB	—
Q3_K_XL	Bassa	4.45 GB	—
Q2_K	Bassa	2.96 GB	—
Q2_K_L	Bassa	3.44 GB	—
Q3_K_L	Bassa	4.03 GB	—
Q4_0_4_4	Bassa	4.34 GB	—
Q4_0_4_8	Bassa	4.34 GB	—
Q4_0_8_8	Bassa	4.34 GB	—
Q4_K_L	Bassa	4.95 GB	—
Q5_K_L	Bassa	5.64 GB	—
Q6_K_L	Bassa	6.38 GB	—

Ultimo aggiornamento: 24 marzo 2026