Kimi K2 Thinking

Code Thinking Tool Calls

Kimi K2 Thinking es un modelo "Mixture-of-Experts" de 170.270 millones de parámetros de Moonshot AI, entrenado de extremo a extremo para razonamiento "chain-of-thought" extendido con uso integrado de herramientas. Activa 8 de 384 expertos más 1 experto compartido por token, alcanzando rendimiento de vanguardia en benchmarks complejos de matemáticas, programación y tareas agentivas, manteniendo coherencia a largo plazo a través de cientos de invocaciones consecutivas de herramientas. El modelo soporta generación de código, pensamiento profundo y "tool calling" en inglés y chino. Con una ventana de contexto de 256K y "flash attention", destaca en flujos de trabajo agentivos multi-paso que requieren razonamiento sostenido y orientado a objetivos.

Configuración de hardware

Fabricante

Producto

Plataforma

Familia

Modelo

VRAM

RAM del sistema (GB) Opcional — para recomendaciones de despliegue precisas

Cuantización	Calidad	Tamaño	Ajuste
Q8_0	Alta	1016.07 GB	—
Q8_K_XL	Alta	1108.35 GB	—
Q6_K	Alta	785.01 GB	—
Q6_K_XL	Alta	818.73 GB	—
Q5_K_M	Media	678.67 GB	—
Q5_K_S	Media	658.39 GB	—
Q5_K_XL	Media	679.68 GB	—
Q4_K_M	Media	578.6 GB	—
Q4_K_S	Media	543.23 GB	—
Q4_K_XL	Media	601.86 GB	—
Q4_0	Media	541.24 GB	—
Q4_1	Media	598.79 GB	—
Q3_K_M	Baja	456.33 GB	—
Q3_K_S	Baja	412.7 GB	—
Q3_K_XL	Baja	423.87 GB	—
Q2_K	Baja	348.4 GB	—
Q2_K_L	Baja	348.65 GB	—
Q2_K_XL	Baja	359.82 GB	—

Última actualización: 29 de abril de 2026