Qwen3.6 35B A3B

Code Multilingual Thinking Tool Calls Vision

Qwen3.6 35B A3B est un modèle « Mixture-of-Experts » de l'équipe Qwen d'Alibaba avec 35,9 milliards de paramètres totaux mais seulement 3 milliards actifs par token, répartis sur 256 experts via un mécanisme hybride novateur Gated DeltaNet et Gated Attention. Il est nativement multimodal, traitant texte, images et vidéo, avec des capacités intégrées de raisonnement et d'appel d'outils sur une fenêtre de contexte de 262K tokens. Le modèle prend en charge plus de 200 langues et est publié sous licence Apache 2.0. En quantification Q4 il nécessite environ 20 Go de VRAM, ce qui le rend très adapté au déploiement auto-hébergé sur GPU grand public.

Configuration matérielle

Fabricant

Produit

Plateforme

Famille

Modèle

VRAM

RAM système (Go) Facultatif — pour des recommandations de déploiement précises

Quantification	Qualité	Taille	Adéquation
BF16	Pleine précision	64.62 GB	—
Q8_0	Élevée	34.37 GB	—
Q8_K_XL	Élevée	35.81 GB	—
Q6_K	Élevée	27.06 GB	—
Q6_K_XL	Élevée	29.66 GB	—
Q5_K_M	Moyenne	24.64 GB	—
Q5_K_S	Moyenne	23.23 GB	—
Q5_K_XL	Moyenne	24.77 GB	—
Q4_K_M	Moyenne	20.61 GB	—
Q4_K_S	Moyenne	19.46 GB	—
Q4_K_XL	Moyenne	20.82 GB	—
MXFP4_MOE	Moyenne	20.22 GB	—
IQ4_NL	Moyenne	16.8 GB	—
IQ4_XS	Moyenne	16.51 GB	—
Q3_K_M	Basse	15.46 GB	—
Q3_K_S	Basse	14.3 GB	—
Q3_K_XL	Basse	15.69 GB	—
IQ3_S	Basse	12.74 GB	—
IQ3_XXS	Basse	12.3 GB	—
Q2_K_XL	Basse	11.45 GB	—
IQ2_M	Basse	10.73 GB	—
IQ2_XXS	Basse	10.02 GB	—
IQ1_M	Basse	9.36 GB	—

Dernière mise à jour : 29 avril 2026