Llama 4 Scout 17B 16E Instruct

Code Multilingual Tool Calls Vision

Llama 4 Scout 17B 16E Instruct es un modelo "Mixture-of-Experts" de Meta con 17.000 millones de parametros por experto y 16 expertos, activando un experto por token. Soporta vision, generacion de codigo, "tool calling" y 12 idiomas, lo que lo convierte en uno de los modelos mas versatiles de la familia Llama 4. Scout apunta al segmento orientado a la eficiencia, ofreciendo capacidades multimodales a un coste computacional menor que modelos densos de calidad similar. Su ventana de contexto de 10M de tokens es de las mas grandes disponibles, y se cuantiza bien para despliegues multi-GPU autoalojados.

Configuración de hardware

Fabricante

Producto

Plataforma

Familia

Modelo

VRAM

RAM del sistema (GB) Opcional — para recomendaciones de despliegue precisas

Cuantización	Calidad	Tamaño	Ajuste
Q8_0	Alta	106.66 GB	—
Q8_K_XL	Alta	119.38 GB	—
Q6_K	Alta	82.36 GB	—
Q6_K_XL	Alta	87.61 GB	—
Q5_K_M	Media	71.29 GB	—
Q5_K_S	Media	69.16 GB	—
Q5_K_XL	Media	73.71 GB	—
Q4_K_M	Media	60.87 GB	—
Q4_K_S	Media	57.23 GB	—
Q4_K_XL	Media	57.74 GB	—
Q4_0	Media	56.98 GB	—
Q4_1	Media	62.94 GB	—
Q3_K_M	Baja	48.2 GB	—
Q3_K_S	Baja	43.53 GB	—
Q3_K_XL	Baja	45.65 GB	—
Q2_K	Baja	36.85 GB	—
Q2_K_L	Baja	37.07 GB	—
Q2_K_XL	Baja	39.47 GB	—

Última actualización: 29 de abril de 2026