Llama 4 Scout 17B 16E Instruct
Meta
Code Multilingual Tool Calls Vision
Llama 4 Scout 17B 16E Instruct es un modelo "Mixture-of-Experts" de Meta con 17.000 millones de parametros por experto y 16 expertos, activando un experto por token. Soporta vision, generacion de codigo, "tool calling" y 12 idiomas, lo que lo convierte en uno de los modelos mas versatiles de la familia Llama 4. Scout apunta al segmento orientado a la eficiencia, ofreciendo capacidades multimodales a un coste computacional menor que modelos densos de calidad similar. Su ventana de contexto de 10M de tokens es de las mas grandes disponibles, y se cuantiza bien para despliegues multi-GPU autoalojados.
Configuración de hardware
Opcional — para recomendaciones de despliegue precisas
| Cuantización | Calidad | Tamaño | Ajuste |
|---|---|---|---|
| Q8_0 | Alta | 106.66 GB | — |
| Q8_K_XL | Alta | 119.38 GB | — |
| Q6_K | Alta | 82.36 GB | — |
| Q6_K_XL | Alta | 87.61 GB | — |
| Q5_K_M | Media | 71.29 GB | — |
| Q5_K_S | Media | 69.16 GB | — |
| Q5_K_XL | Media | 73.71 GB | — |
| Q4_K_M | Media | 60.87 GB | — |
| Q4_K_S | Media | 57.23 GB | — |
| Q4_K_XL | Media | 57.74 GB | — |
| Q4_0 | Media | 56.98 GB | — |
| Q4_1 | Media | 62.94 GB | — |
| Q3_K_M | Baja | 48.2 GB | — |
| Q3_K_S | Baja | 43.53 GB | — |
| Q3_K_XL | Baja | 45.65 GB | — |
| Q2_K | Baja | 36.85 GB | — |
| Q2_K_L | Baja | 37.07 GB | — |
| Q2_K_XL | Baja | 39.47 GB | — |
Última actualización: 5 de marzo de 2026