Aller au contenu

Qwen3.5 4B

Qwen
Code Multilingual Thinking Tool Calls Vision

Qwen3.5 4B est un modèle de la famille Qwen 3.5 d'Alibaba à architecture hybride Gated Delta Networks avec 4,66 milliards de paramètres, largement considéré comme le meilleur compromis performance-consommation par la communauté. Il est nativement multimodal, traitant texte, images et vidéo, avec des capacités de réflexion intégrées pour le raisonnement « chain-of-thought ». Le modèle prend en charge une fenêtre de contexte de 262K et couvre plus de 201 langues, rivalisant presque avec les modèles MoE 80B de génération précédente sur les benchmarks de code. Publié sous licence Apache 2.0, il fonctionne avec environ 3 Go de VRAM en Q4, offrant un déploiement auto-hébergé rapide et stable sur du matériel grand public.

Configuration matérielle

Facultatif — pour des recommandations de déploiement précises
Quantification Qualité Taille Adéquation
Q8_0 Élevée 4.17 GB
Q8_K_XL Élevée 5.54 GB
Q6_K Élevée 3.28 GB
Q6_K_XL Élevée 3.86 GB
Q5_K_M Moyenne 2.93 GB
Q5_K_S Moyenne 2.82 GB
Q5_K_XL Moyenne 3.03 GB
Q4_K_M Moyenne 2.55 GB
Q4_K_S Moyenne 2.41 GB
Q4_K_XL Moyenne 2.71 GB
Q4_0 Moyenne 2.41 GB
Q4_1 Moyenne 2.59 GB
Q3_K_M Basse 2.14 GB
Q3_K_S Basse 1.96 GB
Q3_K_XL Basse 2.27 GB
Q2_K_XL Basse 1.81 GB
Dernière mise à jour : 13 mars 2026