Llama 4 Maverick 17B 128E Instruct
Meta
Code Multilingual Tool Calls Vision
Llama 4 Maverick 17B 128E Instruct es un modelo "Mixture-of-Experts" a gran escala de Meta con 17.000 millones de parametros por experto y 128 expertos, activando un experto por token para un total de aproximadamente 400.000 millones de parametros. Ofrece rendimiento de vanguardia en vision, generacion de codigo y tareas multilingues en 12 idiomas. Maverick representa el nivel de alta capacidad de la familia Llama 4, intercambiando mayores requisitos de memoria por mejores resultados en benchmarks. Con una ventana de contexto de 1M de tokens, requiere configuraciones multi-GPU pero se cuantiza hasta niveles Q2.
Configuración de hardware
Opcional — para recomendaciones de despliegue precisas
| Cuantización | Calidad | Tamaño | Ajuste |
|---|---|---|---|
| Q8_0 | Alta | 396.58 GB | — |
| Q8_K_XL | Alta | 428.4 GB | — |
| Q6_K | Alta | 306.2 GB | — |
| Q6_K_XL | Alta | 317.63 GB | — |
| Q5_K_M | Media | 264.93 GB | — |
| Q5_K_S | Media | 256.77 GB | — |
| Q5_K_XL | Media | 267.29 GB | — |
| Q4_K_M | Media | 226.1 GB | — |
| Q4_K_S | Media | 212.16 GB | — |
| Q4_K_XL | Media | 216.2 GB | — |
| Q4_0 | Media | 211.19 GB | — |
| Q4_1 | Media | 233.49 GB | — |
| Q3_K_M | Baja | 177.95 GB | — |
| Q3_K_S | Baja | 160.79 GB | — |
| Q3_K_XL | Baja | 167.23 GB | — |
| Q2_K | Baja | 135.64 GB | — |
| Q2_K_L | Baja | 135.87 GB | — |
| Q2_K_XL | Baja | 142.17 GB | — |
Última actualización: 5 de marzo de 2026