Phi 4
Microsoft
Code
Phi 4 es un transformador denso de 14.660 millones de parámetros de Microsoft, entrenado con 9,8 billones de tokens con énfasis en datos sintéticos curados para razonamiento avanzado. Supera a muchos modelos mayores en benchmarks de ciencia y matemáticas, lo que lo convierte en una opción sólida para cargas de trabajo intensivas en razonamiento a escala moderada. El modelo se centra en inglés con capacidades en generación de código y resolución de problemas matemáticos. Una ventana de contexto de 16K y "flash attention" permiten una inferencia eficiente y se cuantiza bien en formato GGUF para despliegues GPU autoalojados.
Configuración de hardware
Opcional — para recomendaciones de despliegue precisas
| Cuantización | Calidad | Tamaño | Ajuste |
|---|---|---|---|
| Q8_0 | Alta | 14.51 GB | — |
| Q6_K | Alta | 11.2 GB | — |
| Q5_K_S | Media | 9.45 GB | — |
| Q4_K_S | Media | 7.86 GB | — |
| Q4_0 | Media | 7.81 GB | — |
| Q4_1 | Media | 8.63 GB | — |
| Q3_K_S | Baja | 6.06 GB | — |
| Q2_K | Baja | 5.17 GB | — |
| Q3_K | Baja | 6.86 GB | — |
| Q3_K_L | Baja | 7.39 GB | — |
| Q4_K | Baja | 8.43 GB | — |
| Q5_0 | Baja | 9.45 GB | — |
| Q5_1 | Baja | 10.28 GB | — |
| Q5_K | Baja | 9.88 GB | — |
Última actualización: 5 de marzo de 2026