Kimi K2 Thinking
Kimi K2 Thinking es un modelo "Mixture-of-Experts" de 170.270 millones de parámetros de Moonshot AI, entrenado de extremo a extremo para razonamiento "chain-of-thought" extendido con uso integrado de herramientas. Activa 8 de 384 expertos más 1 experto compartido por token, alcanzando rendimiento de vanguardia en benchmarks complejos de matemáticas, programación y tareas agentivas, manteniendo coherencia a largo plazo a través de cientos de invocaciones consecutivas de herramientas. El modelo soporta generación de código, pensamiento profundo y "tool calling" en inglés y chino. Con una ventana de contexto de 256K y "flash attention", destaca en flujos de trabajo agentivos multi-paso que requieren razonamiento sostenido y orientado a objetivos.
Configuración de hardware
| Cuantización | Calidad | Tamaño | Ajuste |
|---|---|---|---|
| Q8_0 | Alta | 1016.07 GB | — |
| Q8_K_XL | Alta | 1108.35 GB | — |
| Q6_K | Alta | 785.01 GB | — |
| Q6_K_XL | Alta | 818.73 GB | — |
| Q5_K_M | Media | 678.67 GB | — |
| Q5_K_S | Media | 658.39 GB | — |
| Q5_K_XL | Media | 679.68 GB | — |
| Q4_K_M | Media | 578.6 GB | — |
| Q4_K_S | Media | 543.23 GB | — |
| Q4_K_XL | Media | 601.86 GB | — |
| Q4_0 | Media | 541.24 GB | — |
| Q4_1 | Media | 598.79 GB | — |
| Q3_K_M | Baja | 456.33 GB | — |
| Q3_K_S | Baja | 412.7 GB | — |
| Q3_K_XL | Baja | 423.87 GB | — |
| Q2_K | Baja | 348.4 GB | — |
| Q2_K_L | Baja | 348.65 GB | — |
| Q2_K_XL | Baja | 359.82 GB | — |