Llama 4 Scout 17B 16E Instruct
Meta
Code Multilingual Tool Calls Vision
Llama 4 Scout 17B 16E Instruct e un modello "Mixture-of-Experts" di Meta con 17 miliardi di parametri per esperto e 16 esperti, attivando un esperto per token. Supporta vision, generazione di codice, "tool calling" e 12 lingue, rendendolo uno dei modelli piu versatili della famiglia Llama 4. Scout punta al segmento orientato all'efficienza, offrendo capacita multimodali a un costo computazionale inferiore rispetto a modelli densi di qualita simile. La sua finestra di contesto da 10M di token e tra le piu grandi disponibili, e si quantizza bene per deployment multi-GPU self-hosted.
Configurazione hardware
Facoltativo — per raccomandazioni di distribuzione precise
| Quantizzazione | Qualità | Dimensione | Adeguatezza |
|---|---|---|---|
| Q8_0 | Alta | 106.66 GB | — |
| Q8_K_XL | Alta | 119.38 GB | — |
| Q6_K | Alta | 82.36 GB | — |
| Q6_K_XL | Alta | 87.61 GB | — |
| Q5_K_M | Media | 71.29 GB | — |
| Q5_K_S | Media | 69.16 GB | — |
| Q5_K_XL | Media | 73.71 GB | — |
| Q4_K_M | Media | 60.87 GB | — |
| Q4_K_S | Media | 57.23 GB | — |
| Q4_K_XL | Media | 57.74 GB | — |
| Q4_0 | Media | 56.98 GB | — |
| Q4_1 | Media | 62.94 GB | — |
| Q3_K_M | Bassa | 48.2 GB | — |
| Q3_K_S | Bassa | 43.53 GB | — |
| Q3_K_XL | Bassa | 45.65 GB | — |
| Q2_K | Bassa | 36.85 GB | — |
| Q2_K_L | Bassa | 37.07 GB | — |
| Q2_K_XL | Bassa | 39.47 GB | — |
Ultimo aggiornamento: 5 marzo 2026