Qwen3.6 35B A3B
Qwen
Code Multilingual Thinking Tool Calls Vision
Qwen3.6 35B A3B est un modèle « Mixture-of-Experts » de l'équipe Qwen d'Alibaba avec 35,9 milliards de paramètres totaux mais seulement 3 milliards actifs par token, répartis sur 256 experts via un mécanisme hybride novateur Gated DeltaNet et Gated Attention. Il est nativement multimodal, traitant texte, images et vidéo, avec des capacités intégrées de raisonnement et d'appel d'outils sur une fenêtre de contexte de 262K tokens. Le modèle prend en charge plus de 200 langues et est publié sous licence Apache 2.0. En quantification Q4 il nécessite environ 20 Go de VRAM, ce qui le rend très adapté au déploiement auto-hébergé sur GPU grand public.
Configuration matérielle
Facultatif — pour des recommandations de déploiement précises
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| BF16 | Pleine précision | 64.62 GB | — |
| Q8_0 | Élevée | 34.37 GB | — |
| Q8_K_XL | Élevée | 35.81 GB | — |
| Q6_K | Élevée | 27.06 GB | — |
| Q6_K_XL | Élevée | 29.66 GB | — |
| Q5_K_M | Moyenne | 24.64 GB | — |
| Q5_K_S | Moyenne | 23.23 GB | — |
| Q5_K_XL | Moyenne | 24.77 GB | — |
| Q4_K_M | Moyenne | 20.61 GB | — |
| Q4_K_S | Moyenne | 19.46 GB | — |
| Q4_K_XL | Moyenne | 20.82 GB | — |
| MXFP4_MOE | Moyenne | 20.22 GB | — |
| IQ4_NL | Moyenne | 16.8 GB | — |
| IQ4_XS | Moyenne | 16.51 GB | — |
| Q3_K_M | Basse | 15.46 GB | — |
| Q3_K_S | Basse | 14.3 GB | — |
| Q3_K_XL | Basse | 15.69 GB | — |
| IQ3_S | Basse | 12.74 GB | — |
| IQ3_XXS | Basse | 12.3 GB | — |
| Q2_K_XL | Basse | 11.45 GB | — |
| IQ2_M | Basse | 10.73 GB | — |
| IQ2_XXS | Basse | 10.02 GB | — |
| IQ1_M | Basse | 9.36 GB | — |
Dernière mise à jour : 29 avril 2026