Salta ai contenuti

Llama 4 Scout 17B 16E Instruct

Meta
Code Multilingual Tool Calls Vision

Llama 4 Scout 17B 16E Instruct e un modello "Mixture-of-Experts" di Meta con 17 miliardi di parametri per esperto e 16 esperti, attivando un esperto per token. Supporta vision, generazione di codice, "tool calling" e 12 lingue, rendendolo uno dei modelli piu versatili della famiglia Llama 4. Scout punta al segmento orientato all'efficienza, offrendo capacita multimodali a un costo computazionale inferiore rispetto a modelli densi di qualita simile. La sua finestra di contesto da 10M di token e tra le piu grandi disponibili, e si quantizza bene per deployment multi-GPU self-hosted.

Configurazione hardware

Facoltativo — per raccomandazioni di distribuzione precise
Quantizzazione Qualità Dimensione Adeguatezza
Q8_0 Alta 106.66 GB
Q8_K_XL Alta 119.38 GB
Q6_K Alta 82.36 GB
Q6_K_XL Alta 87.61 GB
Q5_K_M Media 71.29 GB
Q5_K_S Media 69.16 GB
Q5_K_XL Media 73.71 GB
Q4_K_M Media 60.87 GB
Q4_K_S Media 57.23 GB
Q4_K_XL Media 57.74 GB
Q4_0 Media 56.98 GB
Q4_1 Media 62.94 GB
Q3_K_M Bassa 48.2 GB
Q3_K_S Bassa 43.53 GB
Q3_K_XL Bassa 45.65 GB
Q2_K Bassa 36.85 GB
Q2_K_L Bassa 37.07 GB
Q2_K_XL Bassa 39.47 GB
Ultimo aggiornamento: 5 marzo 2026