Aller au contenu

Qwen3.6 35B A3B

Qwen
Code Multilingual Thinking Tool Calls Vision

Qwen3.6 35B A3B est un modèle « Mixture-of-Experts » de l'équipe Qwen d'Alibaba avec 35,9 milliards de paramètres totaux mais seulement 3 milliards actifs par token, répartis sur 256 experts via un mécanisme hybride novateur Gated DeltaNet et Gated Attention. Il est nativement multimodal, traitant texte, images et vidéo, avec des capacités intégrées de raisonnement et d'appel d'outils sur une fenêtre de contexte de 262K tokens. Le modèle prend en charge plus de 200 langues et est publié sous licence Apache 2.0. En quantification Q4 il nécessite environ 20 Go de VRAM, ce qui le rend très adapté au déploiement auto-hébergé sur GPU grand public.

Configuration matérielle
Facultatif — pour des recommandations de déploiement précises
Quantification Qualité Taille Adéquation
BF16 Pleine précision 64.62 GB
Q8_0 Élevée 34.37 GB
Q8_K_XL Élevée 35.81 GB
Q6_K Élevée 27.06 GB
Q6_K_XL Élevée 29.66 GB
Q5_K_M Moyenne 24.64 GB
Q5_K_S Moyenne 23.23 GB
Q5_K_XL Moyenne 24.77 GB
Q4_K_M Moyenne 20.61 GB
Q4_K_S Moyenne 19.46 GB
Q4_K_XL Moyenne 20.82 GB
MXFP4_MOE Moyenne 20.22 GB
IQ4_NL Moyenne 16.8 GB
IQ4_XS Moyenne 16.51 GB
Q3_K_M Basse 15.46 GB
Q3_K_S Basse 14.3 GB
Q3_K_XL Basse 15.69 GB
IQ3_S Basse 12.74 GB
IQ3_XXS Basse 12.3 GB
Q2_K_XL Basse 11.45 GB
IQ2_M Basse 10.73 GB
IQ2_XXS Basse 10.02 GB
IQ1_M Basse 9.36 GB
Dernière mise à jour : 29 avril 2026