Meta Llama 3.1 8B Instruct

Code Multilingual Tool Calls

Meta Llama 3.1 8B Instruct es un transformador denso de 8.000 millones de parametros de Meta, disenado para el seguimiento de instrucciones, la generacion de codigo y tareas multilingues. Ofrece un solido equilibrio entre calidad y eficiencia en la categoria de modelos pequenos, superando a muchas alternativas de clase 7B en benchmarks estandar. El modelo soporta "tool calling" y ocho idiomas, incluidos ingles, aleman y frances. Con una ventana de contexto de 128K y soporte de "flash attention", funciona comodamente en una sola GPU de consumo con niveles de cuantizacion Q4.

Configuración de hardware

Fabricante

Producto

Plataforma

Familia

Modelo

VRAM

RAM del sistema (GB) Opcional — para recomendaciones de despliegue precisas

Cuantización	Calidad	Tamaño	Ajuste
FP32	Precisión completa	29.92 GB	—
Q8_0	Alta	7.95 GB	—
Q6_K	Alta	6.14 GB	—
Q5_K_M	Media	5.34 GB	—
Q5_K_S	Media	5.21 GB	—
Q4_K_M	Media	4.58 GB	—
Q4_K_S	Media	4.37 GB	—
Q3_K_M	Baja	3.74 GB	—
Q3_K_S	Baja	3.41 GB	—
Q3_K_XL	Baja	4.45 GB	—
Q2_K	Baja	2.96 GB	—
Q2_K_L	Baja	3.44 GB	—
Q3_K_L	Baja	4.03 GB	—
Q4_0_4_4	Baja	4.34 GB	—
Q4_0_4_8	Baja	4.34 GB	—
Q4_0_8_8	Baja	4.34 GB	—
Q4_K_L	Baja	4.95 GB	—
Q5_K_L	Baja	5.64 GB	—
Q6_K_L	Baja	6.38 GB	—

Última actualización: 24 de marzo de 2026