Qwen3.5 9B

Code Multilingual Thinking Tool Calls Vision

Qwen3.5 9B est le modèle phare de petite taille dans la famille Qwen 3.5 d'Alibaba à architecture hybride Gated Delta Networks avec 9,65 milliards de paramètres, surpassant gpt-oss-120B sur GPQA Diamond avec 81,7 contre 80,1 à treize fois moins de paramètres. Il est nativement multimodal, traitant texte, images et vidéo, avec des capacités de réflexion intégrées pour le raisonnement « chain-of-thought ». Le modèle prend en charge une fenêtre de contexte de 262K et couvre plus de 201 langues. Publié sous licence Apache 2.0, il fonctionne avec environ 5 Go de VRAM en Q4, ce qui en fait un choix de premier plan pour le déploiement auto-hébergé sur du matériel grand public.

Configuration matérielle

Fabricant

Produit

Plateforme

Famille

Modèle

VRAM

RAM système (Go) Facultatif — pour des recommandations de déploiement précises

Quantification	Qualité	Taille	Adéquation
Q8_0	Élevée	8.87 GB	—
Q8_K_XL	Élevée	12.08 GB	—
Q6_K	Élevée	6.95 GB	—
Q6_K_XL	Élevée	8.16 GB	—
Q5_K_M	Moyenne	6.13 GB	—
Q5_K_S	Moyenne	5.92 GB	—
Q5_K_XL	Moyenne	6.28 GB	—
Q4_K_M	Moyenne	5.29 GB	—
Q4_K_S	Moyenne	5.02 GB	—
Q4_K_XL	Moyenne	5.56 GB	—
Q4_0	Moyenne	5.01 GB	—
Q4_1	Moyenne	5.44 GB	—
Q3_K_M	Basse	4.35 GB	—
Q3_K_S	Basse	4.02 GB	—
Q3_K_XL	Basse	4.71 GB	—
Q2_K_XL	Basse	3.84 GB	—

Dernière mise à jour : 24 mars 2026