Qwen3.5 9B
Qwen
Code Multilingual Thinking Tool Calls Vision
Qwen3.5 9B ist das Flaggschiff unter den kleinen Modellen in Alibabas Qwen-3.5-Familie mit Gated-Delta-Networks-Hybridarchitektur und 9,65 Milliarden Parametern. Es übertrifft gpt-oss-120B auf GPQA Diamond mit 81,7 gegenüber 80,1 bei dreizehnmal weniger Parametern. Es ist nativ multimodal und verarbeitet Text, Bilder und Video, mit integrierten Denkfähigkeiten für Chain-of-Thought-Schlussfolgern. Das Modell unterstützt ein 262K-Kontextfenster und deckt über 201 Sprachen ab. Unter der Apache-2.0-Lizenz veröffentlicht, läuft es mit etwa 5 GB VRAM bei Q4 und ist eine erstklassige Wahl für selbstgehostetes Deployment auf Consumer-Hardware.
Hardwarekonfiguration
Optional — für präzise Bereitstellungsempfehlungen
| Quantisierung | Qualität | Größe | Eignung |
|---|---|---|---|
| Q8_0 | Hoch | 8.87 GB | — |
| Q8_K_XL | Hoch | 12.08 GB | — |
| Q6_K | Hoch | 6.95 GB | — |
| Q6_K_XL | Hoch | 8.16 GB | — |
| Q5_K_M | Mittel | 6.13 GB | — |
| Q5_K_S | Mittel | 5.92 GB | — |
| Q5_K_XL | Mittel | 6.28 GB | — |
| Q4_K_M | Mittel | 5.29 GB | — |
| Q4_K_S | Mittel | 5.02 GB | — |
| Q4_K_XL | Mittel | 5.56 GB | — |
| Q4_0 | Mittel | 5.01 GB | — |
| Q4_1 | Mittel | 5.44 GB | — |
| Q3_K_M | Niedrig | 4.35 GB | — |
| Q3_K_S | Niedrig | 4.02 GB | — |
| Q3_K_XL | Niedrig | 4.71 GB | — |
| Q2_K_XL | Niedrig | 3.84 GB | — |
Zuletzt aktualisiert: 13. März 2026