Ir al contenido

Llama 4 Scout 17B 16E Instruct

Meta
Code Multilingual Tool Calls Vision

Llama 4 Scout 17B 16E Instruct es un modelo "Mixture-of-Experts" de Meta con 17.000 millones de parametros por experto y 16 expertos, activando un experto por token. Soporta vision, generacion de codigo, "tool calling" y 12 idiomas, lo que lo convierte en uno de los modelos mas versatiles de la familia Llama 4. Scout apunta al segmento orientado a la eficiencia, ofreciendo capacidades multimodales a un coste computacional menor que modelos densos de calidad similar. Su ventana de contexto de 10M de tokens es de las mas grandes disponibles, y se cuantiza bien para despliegues multi-GPU autoalojados.

Configuración de hardware

Opcional — para recomendaciones de despliegue precisas
Cuantización Calidad Tamaño Ajuste
Q8_0 Alta 106.66 GB
Q8_K_XL Alta 119.38 GB
Q6_K Alta 82.36 GB
Q6_K_XL Alta 87.61 GB
Q5_K_M Media 71.29 GB
Q5_K_S Media 69.16 GB
Q5_K_XL Media 73.71 GB
Q4_K_M Media 60.87 GB
Q4_K_S Media 57.23 GB
Q4_K_XL Media 57.74 GB
Q4_0 Media 56.98 GB
Q4_1 Media 62.94 GB
Q3_K_M Baja 48.2 GB
Q3_K_S Baja 43.53 GB
Q3_K_XL Baja 45.65 GB
Q2_K Baja 36.85 GB
Q2_K_L Baja 37.07 GB
Q2_K_XL Baja 39.47 GB
Última actualización: 5 de marzo de 2026