Llama 4 Maverick 17B 128E Instruct

Code Multilingual Tool Calls Vision

Llama 4 Maverick 17B 128E Instruct es un modelo "Mixture-of-Experts" a gran escala de Meta con 17.000 millones de parametros por experto y 128 expertos, activando un experto por token para un total de aproximadamente 400.000 millones de parametros. Ofrece rendimiento de vanguardia en vision, generacion de codigo y tareas multilingues en 12 idiomas. Maverick representa el nivel de alta capacidad de la familia Llama 4, intercambiando mayores requisitos de memoria por mejores resultados en benchmarks. Con una ventana de contexto de 1M de tokens, requiere configuraciones multi-GPU pero se cuantiza hasta niveles Q2.

Configuración de hardware

Fabricante

Producto

Plataforma

Familia

Modelo

VRAM

RAM del sistema (GB) Opcional — para recomendaciones de despliegue precisas

Cuantización	Calidad	Tamaño	Ajuste
Q8_0	Alta	396.58 GB	—
Q8_K_XL	Alta	428.4 GB	—
Q6_K	Alta	306.2 GB	—
Q6_K_XL	Alta	317.63 GB	—
Q5_K_M	Media	264.93 GB	—
Q5_K_S	Media	256.77 GB	—
Q5_K_XL	Media	267.29 GB	—
Q4_K_M	Media	226.1 GB	—
Q4_K_S	Media	212.16 GB	—
Q4_K_XL	Media	216.2 GB	—
Q4_0	Media	211.19 GB	—
Q4_1	Media	233.49 GB	—
Q3_K_M	Baja	177.95 GB	—
Q3_K_S	Baja	160.79 GB	—
Q3_K_XL	Baja	167.23 GB	—
Q2_K	Baja	135.64 GB	—
Q2_K_L	Baja	135.87 GB	—
Q2_K_XL	Baja	142.17 GB	—

Última actualización: 29 de abril de 2026