GLM 4.7

Code Thinking Tool Calls

GLM-4.7 est un modèle "Mixture-of-Experts" de 358,34 milliards de paramètres de l'équipe GLM chez Zai Org, conçu pour la programmation avancée, le raisonnement agentique et l'utilisation d'outils. Il achemine chaque jeton à travers 8 des 160 experts plus 1 expert partagé, atteignant des performances de pointe sur des benchmarks comme SWE-bench et AIME tout en maintenant un coût de calcul par jeton raisonnable. Le modèle prend en charge la génération de code, la réflexion étendue avec raisonnement entrelacé et le "tool calling" en anglais et en chinois. Avec une fenêtre de contexte de 198K et le "flash attention", il est destiné aux workflows agentiques multi-étapes sur des déploiements GPU haut de gamme.

Configuration matérielle

Fabricant

Produit

Plateforme

Famille

Modèle

VRAM

RAM système (Go) Facultatif — pour des recommandations de déploiement précises

Quantification	Qualité	Taille	Adéquation
Q8_0	Élevée	354.79 GB	—
Q8_K_XL	Élevée	367.72 GB	—
Q6_K	Élevée	274.17 GB	—
Q6_K_XL	Élevée	280.43 GB	—
Q5_K_M	Moyenne	236.81 GB	—
Q5_K_S	Moyenne	230.04 GB	—
Q5_K_XL	Moyenne	236.19 GB	—
Q4_K_M	Moyenne	201.58 GB	—
Q4_K_S	Moyenne	189.71 GB	—
Q4_K_XL	Moyenne	190.51 GB	—
Q4_0	Moyenne	189.1 GB	—
Q4_1	Moyenne	209.19 GB	—
Q3_K_M	Basse	159.5 GB	—
Q3_K_S	Basse	144.39 GB	—
Q3_K_XL	Basse	147.83 GB	—
Q2_K	Basse	122.14 GB	—
Q2_K_L	Basse	122.31 GB	—
Q2_K_XL	Basse	125.92 GB	—

Dernière mise à jour : 29 avril 2026