Meta Llama 3.1 70B Instruct

Code Multilingual Tool Calls

Meta Llama 3.1 70B Instruct è un trasformatore denso da 70 miliardi di parametri di Meta, ottimizzato per il dialogo multilingue, la generazione di codice e l'uso di strumenti. Come predecessore di Llama 3.3, ha gettato le basi dell'architettura Llama 70B con fine-tuning supervisionato e allineamento RLHF. Il modello supporta il "tool calling" e otto lingue tra cui inglese, tedesco, francese e spagnolo. Con una finestra di contesto da 128K, "grouped-query attention" e "flash attention", si quantizza in modo efficiente in GGUF per inferenza self-hosted su configurazioni GPU a singolo nodo.

Configurazione hardware

Produttore

Prodotto

Piattaforma

Famiglia

Modello

VRAM

RAM di sistema (GB) Facoltativo — per raccomandazioni di distribuzione precise

Quantizzazione	Qualità	Dimensione	Adeguatezza
Q8_0	Alta	69.82 GB	—
Q6_K	Alta	53.92 GB	—
Q5_K_M	Media	46.52 GB	—
Q5_K_S	Media	45.32 GB	—
Q4_K_M	Media	39.6 GB	—
Q4_K_S	Media	37.58 GB	—
Q3_K_M	Bassa	31.91 GB	—
Q3_K_S	Bassa	28.79 GB	—
Q3_K_XL	Bassa	35.45 GB	—
Q2_K	Bassa	24.56 GB	—
Q2_K_L	Bassa	25.52 GB	—
Q3_K_L	Bassa	34.59 GB	—
Q4_K_L	Bassa	40.33 GB	—
Q5_K_L	Bassa	47.13 GB	—
Q6_K_L	Bassa	54.38 GB	—

Ultimo aggiornamento: 29 aprile 2026