Llama 4 Scout 17B 16E Instruct

Code Multilingual Tool Calls Vision

Llama 4 Scout 17B 16E Instruct e un modello "Mixture-of-Experts" di Meta con 17 miliardi di parametri per esperto e 16 esperti, attivando un esperto per token. Supporta vision, generazione di codice, "tool calling" e 12 lingue, rendendolo uno dei modelli piu versatili della famiglia Llama 4. Scout punta al segmento orientato all'efficienza, offrendo capacita multimodali a un costo computazionale inferiore rispetto a modelli densi di qualita simile. La sua finestra di contesto da 10M di token e tra le piu grandi disponibili, e si quantizza bene per deployment multi-GPU self-hosted.

Configurazione hardware

Produttore

Prodotto

Piattaforma

Famiglia

Modello

VRAM

RAM di sistema (GB) Facoltativo — per raccomandazioni di distribuzione precise

Quantizzazione	Qualità	Dimensione	Adeguatezza
Q8_0	Alta	106.66 GB	—
Q8_K_XL	Alta	119.38 GB	—
Q6_K	Alta	82.36 GB	—
Q6_K_XL	Alta	87.61 GB	—
Q5_K_M	Media	71.29 GB	—
Q5_K_S	Media	69.16 GB	—
Q5_K_XL	Media	73.71 GB	—
Q4_K_M	Media	60.87 GB	—
Q4_K_S	Media	57.23 GB	—
Q4_K_XL	Media	57.74 GB	—
Q4_0	Media	56.98 GB	—
Q4_1	Media	62.94 GB	—
Q3_K_M	Bassa	48.2 GB	—
Q3_K_S	Bassa	43.53 GB	—
Q3_K_XL	Bassa	45.65 GB	—
Q2_K	Bassa	36.85 GB	—
Q2_K_L	Bassa	37.07 GB	—
Q2_K_XL	Bassa	39.47 GB	—

Ultimo aggiornamento: 29 aprile 2026