Kimi K2.5
Moonshot AI
Code Thinking Tool Calls Vision
Kimi K2.5 es un modelo "Mixture-of-Experts" de 1.016.230 millones de parámetros de Moonshot AI, que combina visión nativa con razonamiento agentivo avanzado. Activa 8 de 384 expertos más 1 experto compartido por token, alcanzando rendimiento de vanguardia en programación, matemáticas y benchmarks multimodales con un coste de cómputo por token equivalente a un modelo denso de 32B. El modelo soporta generación de código, pensamiento extendido, "tool calling" y comprensión de imágenes en inglés y chino. Con una ventana de contexto de 256K y "flash attention", gestiona análisis de documentos largos y flujos de trabajo agentivos multi-paso con entradas visuales.
Configuración de hardware
Opcional — para recomendaciones de despliegue precisas
| Cuantización | Calidad | Tamaño | Ajuste |
|---|---|---|---|
| Q8_0 | Alta | 1016.23 GB | — |
| Q8_K_XL | Alta | 1108.05 GB | — |
| Q6_K | Alta | 785.01 GB | — |
| Q6_K_XL | Alta | 817.42 GB | — |
| Q5_K_M | Media | 678.67 GB | — |
| Q5_K_S | Media | 658.39 GB | — |
| Q5_K_XL | Media | 681.05 GB | — |
| Q4_K_M | Media | 578.6 GB | — |
| Q4_K_S | Media | 543.22 GB | — |
| Q4_K_XL | Media | 579.29 GB | — |
| Q4_0 | Media | 541.23 GB | — |
| Q4_1 | Media | 598.79 GB | — |
| Q3_K_M | Baja | 456.13 GB | — |
| Q3_K_S | Baja | 412.7 GB | — |
| Q3_K_XL | Baja | 456.76 GB | — |
| Q2_K | Baja | 348.09 GB | — |
| Q2_K_L | Baja | 348.35 GB | — |
| Q2_K_XL | Baja | 349.01 GB | — |
Última actualización: 5 de marzo de 2026