Qwen3.5 4B

Code Multilingual Thinking Tool Calls Vision

Qwen3.5 4B est un modèle de la famille Qwen 3.5 d'Alibaba à architecture hybride Gated Delta Networks avec 4,66 milliards de paramètres, largement considéré comme le meilleur compromis performance-consommation par la communauté. Il est nativement multimodal, traitant texte, images et vidéo, avec des capacités de réflexion intégrées pour le raisonnement « chain-of-thought ». Le modèle prend en charge une fenêtre de contexte de 262K et couvre plus de 201 langues, rivalisant presque avec les modèles MoE 80B de génération précédente sur les benchmarks de code. Publié sous licence Apache 2.0, il fonctionne avec environ 3 Go de VRAM en Q4, offrant un déploiement auto-hébergé rapide et stable sur du matériel grand public.

Configuration matérielle

Fabricant

Produit

Plateforme

Famille

Modèle

VRAM

RAM système (Go) Facultatif — pour des recommandations de déploiement précises

Quantification	Qualité	Taille	Adéquation
Q8_0	Élevée	4.17 GB	—
Q8_K_XL	Élevée	5.54 GB	—
Q6_K	Élevée	3.28 GB	—
Q6_K_XL	Élevée	3.86 GB	—
Q5_K_M	Moyenne	2.93 GB	—
Q5_K_S	Moyenne	2.82 GB	—
Q5_K_XL	Moyenne	3.03 GB	—
Q4_K_M	Moyenne	2.55 GB	—
Q4_K_S	Moyenne	2.41 GB	—
Q4_K_XL	Moyenne	2.71 GB	—
Q4_0	Moyenne	2.41 GB	—
Q4_1	Moyenne	2.59 GB	—
Q3_K_M	Basse	2.14 GB	—
Q3_K_S	Basse	1.96 GB	—
Q3_K_XL	Basse	2.27 GB	—
Q2_K_XL	Basse	1.81 GB	—

Dernière mise à jour : 24 mars 2026