Meta Llama 3.1 8B Instruct
Meta
Code Multilingual Tool Calls
Meta Llama 3.1 8B Instruct es un transformador denso de 8.000 millones de parametros de Meta, disenado para el seguimiento de instrucciones, la generacion de codigo y tareas multilingues. Ofrece un solido equilibrio entre calidad y eficiencia en la categoria de modelos pequenos, superando a muchas alternativas de clase 7B en benchmarks estandar. El modelo soporta "tool calling" y ocho idiomas, incluidos ingles, aleman y frances. Con una ventana de contexto de 128K y soporte de "flash attention", funciona comodamente en una sola GPU de consumo con niveles de cuantizacion Q4.
Configuración de hardware
Opcional — para recomendaciones de despliegue precisas
| Cuantización | Calidad | Tamaño | Ajuste |
|---|---|---|---|
| FP32 | Precisión completa | 29.92 GB | — |
| Q8_0 | Alta | 7.95 GB | — |
| Q6_K | Alta | 6.14 GB | — |
| Q5_K_M | Media | 5.34 GB | — |
| Q5_K_S | Media | 5.21 GB | — |
| Q4_K_M | Media | 4.58 GB | — |
| Q4_K_S | Media | 4.37 GB | — |
| Q3_K_M | Baja | 3.74 GB | — |
| Q3_K_S | Baja | 3.41 GB | — |
| Q3_K_XL | Baja | 4.45 GB | — |
| Q2_K | Baja | 2.96 GB | — |
| Q2_K_L | Baja | 3.44 GB | — |
| Q3_K_L | Baja | 4.03 GB | — |
| Q4_0_4_4 | Baja | 4.34 GB | — |
| Q4_0_4_8 | Baja | 4.34 GB | — |
| Q4_0_8_8 | Baja | 4.34 GB | — |
| Q4_K_L | Baja | 4.95 GB | — |
| Q5_K_L | Baja | 5.64 GB | — |
| Q6_K_L | Baja | 6.38 GB | — |
Última actualización: 5 de marzo de 2026