Ir al contenido

Meta Llama 3.1 8B Instruct

Meta
Code Multilingual Tool Calls

Meta Llama 3.1 8B Instruct es un transformador denso de 8.000 millones de parametros de Meta, disenado para el seguimiento de instrucciones, la generacion de codigo y tareas multilingues. Ofrece un solido equilibrio entre calidad y eficiencia en la categoria de modelos pequenos, superando a muchas alternativas de clase 7B en benchmarks estandar. El modelo soporta "tool calling" y ocho idiomas, incluidos ingles, aleman y frances. Con una ventana de contexto de 128K y soporte de "flash attention", funciona comodamente en una sola GPU de consumo con niveles de cuantizacion Q4.

Configuración de hardware

Opcional — para recomendaciones de despliegue precisas
Cuantización Calidad Tamaño Ajuste
FP32 Precisión completa 29.92 GB
Q8_0 Alta 7.95 GB
Q6_K Alta 6.14 GB
Q5_K_M Media 5.34 GB
Q5_K_S Media 5.21 GB
Q4_K_M Media 4.58 GB
Q4_K_S Media 4.37 GB
Q3_K_M Baja 3.74 GB
Q3_K_S Baja 3.41 GB
Q3_K_XL Baja 4.45 GB
Q2_K Baja 2.96 GB
Q2_K_L Baja 3.44 GB
Q3_K_L Baja 4.03 GB
Q4_0_4_4 Baja 4.34 GB
Q4_0_4_8 Baja 4.34 GB
Q4_0_8_8 Baja 4.34 GB
Q4_K_L Baja 4.95 GB
Q5_K_L Baja 5.64 GB
Q6_K_L Baja 6.38 GB
Última actualización: 5 de marzo de 2026