Qwen3.5 4B
Qwen
Code Multilingual Thinking Tool Calls Vision
Qwen3.5 4B est un modèle de la famille Qwen 3.5 d'Alibaba à architecture hybride Gated Delta Networks avec 4,66 milliards de paramètres, largement considéré comme le meilleur compromis performance-consommation par la communauté. Il est nativement multimodal, traitant texte, images et vidéo, avec des capacités de réflexion intégrées pour le raisonnement « chain-of-thought ». Le modèle prend en charge une fenêtre de contexte de 262K et couvre plus de 201 langues, rivalisant presque avec les modèles MoE 80B de génération précédente sur les benchmarks de code. Publié sous licence Apache 2.0, il fonctionne avec environ 3 Go de VRAM en Q4, offrant un déploiement auto-hébergé rapide et stable sur du matériel grand public.
Configuration matérielle
Facultatif — pour des recommandations de déploiement précises
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| Q8_0 | Élevée | 4.17 GB | — |
| Q8_K_XL | Élevée | 5.54 GB | — |
| Q6_K | Élevée | 3.28 GB | — |
| Q6_K_XL | Élevée | 3.86 GB | — |
| Q5_K_M | Moyenne | 2.93 GB | — |
| Q5_K_S | Moyenne | 2.82 GB | — |
| Q5_K_XL | Moyenne | 3.03 GB | — |
| Q4_K_M | Moyenne | 2.55 GB | — |
| Q4_K_S | Moyenne | 2.41 GB | — |
| Q4_K_XL | Moyenne | 2.71 GB | — |
| Q4_0 | Moyenne | 2.41 GB | — |
| Q4_1 | Moyenne | 2.59 GB | — |
| Q3_K_M | Basse | 2.14 GB | — |
| Q3_K_S | Basse | 1.96 GB | — |
| Q3_K_XL | Basse | 2.27 GB | — |
| Q2_K_XL | Basse | 1.81 GB | — |
Dernière mise à jour : 13 mars 2026