Qwen3.5 9B
Qwen
Code Multilingual Thinking Tool Calls Vision
Qwen3.5 9B est le modèle phare de petite taille dans la famille Qwen 3.5 d'Alibaba à architecture hybride Gated Delta Networks avec 9,65 milliards de paramètres, surpassant gpt-oss-120B sur GPQA Diamond avec 81,7 contre 80,1 à treize fois moins de paramètres. Il est nativement multimodal, traitant texte, images et vidéo, avec des capacités de réflexion intégrées pour le raisonnement « chain-of-thought ». Le modèle prend en charge une fenêtre de contexte de 262K et couvre plus de 201 langues. Publié sous licence Apache 2.0, il fonctionne avec environ 5 Go de VRAM en Q4, ce qui en fait un choix de premier plan pour le déploiement auto-hébergé sur du matériel grand public.
Configuration matérielle
Facultatif — pour des recommandations de déploiement précises
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| Q8_0 | Élevée | 8.87 GB | — |
| Q8_K_XL | Élevée | 12.08 GB | — |
| Q6_K | Élevée | 6.95 GB | — |
| Q6_K_XL | Élevée | 8.16 GB | — |
| Q5_K_M | Moyenne | 6.13 GB | — |
| Q5_K_S | Moyenne | 5.92 GB | — |
| Q5_K_XL | Moyenne | 6.28 GB | — |
| Q4_K_M | Moyenne | 5.29 GB | — |
| Q4_K_S | Moyenne | 5.02 GB | — |
| Q4_K_XL | Moyenne | 5.56 GB | — |
| Q4_0 | Moyenne | 5.01 GB | — |
| Q4_1 | Moyenne | 5.44 GB | — |
| Q3_K_M | Basse | 4.35 GB | — |
| Q3_K_S | Basse | 4.02 GB | — |
| Q3_K_XL | Basse | 4.71 GB | — |
| Q2_K_XL | Basse | 3.84 GB | — |
Dernière mise à jour : 13 mars 2026