Qwen3.5 4B
Qwen
Code Multilingual Thinking Tool Calls Vision
Qwen3.5 4B ist ein Modell aus Alibabas Qwen-3.5-Familie mit Gated-Delta-Networks-Hybridarchitektur und 4,66 Milliarden Parametern, das weithin als der ideale Kompromiss zwischen Leistung und Energieverbrauch in der Community gilt. Es ist nativ multimodal und verarbeitet Text, Bilder und Video, mit integrierten Denkfähigkeiten für Chain-of-Thought-Schlussfolgern. Das Modell unterstützt ein 262K-Kontextfenster und deckt über 201 Sprachen ab, wobei es auf Coding-Benchmarks nahezu an 80B-MoE-Modelle der vorherigen Generation heranreicht. Unter der Apache-2.0-Lizenz veröffentlicht, läuft es mit etwa 3 GB VRAM bei Q4 und bietet schnelles, stabiles selbstgehostetes Deployment auf Consumer-Hardware.
Hardwarekonfiguration
Optional — für präzise Bereitstellungsempfehlungen
| Quantisierung | Qualität | Größe | Eignung |
|---|---|---|---|
| Q8_0 | Hoch | 4.17 GB | — |
| Q8_K_XL | Hoch | 5.54 GB | — |
| Q6_K | Hoch | 3.28 GB | — |
| Q6_K_XL | Hoch | 3.86 GB | — |
| Q5_K_M | Mittel | 2.93 GB | — |
| Q5_K_S | Mittel | 2.82 GB | — |
| Q5_K_XL | Mittel | 3.03 GB | — |
| Q4_K_M | Mittel | 2.55 GB | — |
| Q4_K_S | Mittel | 2.41 GB | — |
| Q4_K_XL | Mittel | 2.71 GB | — |
| Q4_0 | Mittel | 2.41 GB | — |
| Q4_1 | Mittel | 2.59 GB | — |
| Q3_K_M | Niedrig | 2.14 GB | — |
| Q3_K_S | Niedrig | 1.96 GB | — |
| Q3_K_XL | Niedrig | 2.27 GB | — |
| Q2_K_XL | Niedrig | 1.81 GB | — |
Zuletzt aktualisiert: 13. März 2026