Llama 4 Maverick 17B 128E Instruct
Meta
Code Multilingual Tool Calls Vision
Llama 4 Maverick 17B 128E Instruct e un modello "Mixture-of-Experts" su larga scala di Meta con 17 miliardi di parametri per esperto e 128 esperti, attivando un esperto per token per un totale di circa 400 miliardi di parametri. Offre prestazioni di frontiera in vision, generazione di codice e compiti multilingue in 12 lingue. Maverick rappresenta il livello ad alta capacita della famiglia Llama 4, scambiando requisiti di memoria piu elevati con risultati di benchmark superiori. Con una finestra di contesto da 1M di token, richiede configurazioni multi-GPU ma si quantizza fino a livelli Q2.
Configurazione hardware
Facoltativo — per raccomandazioni di distribuzione precise
| Quantizzazione | Qualità | Dimensione | Adeguatezza |
|---|---|---|---|
| Q8_0 | Alta | 396.58 GB | — |
| Q8_K_XL | Alta | 428.4 GB | — |
| Q6_K | Alta | 306.2 GB | — |
| Q6_K_XL | Alta | 317.63 GB | — |
| Q5_K_M | Media | 264.93 GB | — |
| Q5_K_S | Media | 256.77 GB | — |
| Q5_K_XL | Media | 267.29 GB | — |
| Q4_K_M | Media | 226.1 GB | — |
| Q4_K_S | Media | 212.16 GB | — |
| Q4_K_XL | Media | 216.2 GB | — |
| Q4_0 | Media | 211.19 GB | — |
| Q4_1 | Media | 233.49 GB | — |
| Q3_K_M | Bassa | 177.95 GB | — |
| Q3_K_S | Bassa | 160.79 GB | — |
| Q3_K_XL | Bassa | 167.23 GB | — |
| Q2_K | Bassa | 135.64 GB | — |
| Q2_K_L | Bassa | 135.87 GB | — |
| Q2_K_XL | Bassa | 142.17 GB | — |
Ultimo aggiornamento: 5 marzo 2026