Aller au contenu

GLM 4.7

Zai Org
Code Thinking Tool Calls

GLM-4.7 est un modèle "Mixture-of-Experts" de 358,34 milliards de paramètres de l'équipe GLM chez Zai Org, conçu pour la programmation avancée, le raisonnement agentique et l'utilisation d'outils. Il achemine chaque jeton à travers 8 des 160 experts plus 1 expert partagé, atteignant des performances de pointe sur des benchmarks comme SWE-bench et AIME tout en maintenant un coût de calcul par jeton raisonnable. Le modèle prend en charge la génération de code, la réflexion étendue avec raisonnement entrelacé et le "tool calling" en anglais et en chinois. Avec une fenêtre de contexte de 198K et le "flash attention", il est destiné aux workflows agentiques multi-étapes sur des déploiements GPU haut de gamme.

Configuration matérielle

Facultatif — pour des recommandations de déploiement précises
Quantification Qualité Taille Adéquation
Q8_0 Élevée 354.79 GB
Q8_K_XL Élevée 367.72 GB
Q6_K Élevée 274.17 GB
Q6_K_XL Élevée 280.43 GB
Q5_K_M Moyenne 236.81 GB
Q5_K_S Moyenne 230.04 GB
Q5_K_XL Moyenne 236.19 GB
Q4_K_M Moyenne 201.58 GB
Q4_K_S Moyenne 189.71 GB
Q4_K_XL Moyenne 190.51 GB
Q4_0 Moyenne 189.1 GB
Q4_1 Moyenne 209.19 GB
Q3_K_M Basse 159.5 GB
Q3_K_S Basse 144.39 GB
Q3_K_XL Basse 147.83 GB
Q2_K Basse 122.14 GB
Q2_K_L Basse 122.31 GB
Q2_K_XL Basse 125.92 GB
Dernière mise à jour : 5 mars 2026