Zum Inhalt springen

Qwen3.5 4B

Qwen
Code Multilingual Thinking Tool Calls Vision

Qwen3.5 4B ist ein Modell aus Alibabas Qwen-3.5-Familie mit Gated-Delta-Networks-Hybridarchitektur und 4,66 Milliarden Parametern, das weithin als der ideale Kompromiss zwischen Leistung und Energieverbrauch in der Community gilt. Es ist nativ multimodal und verarbeitet Text, Bilder und Video, mit integrierten Denkfähigkeiten für Chain-of-Thought-Schlussfolgern. Das Modell unterstützt ein 262K-Kontextfenster und deckt über 201 Sprachen ab, wobei es auf Coding-Benchmarks nahezu an 80B-MoE-Modelle der vorherigen Generation heranreicht. Unter der Apache-2.0-Lizenz veröffentlicht, läuft es mit etwa 3 GB VRAM bei Q4 und bietet schnelles, stabiles selbstgehostetes Deployment auf Consumer-Hardware.

Hardwarekonfiguration

Optional — für präzise Bereitstellungsempfehlungen
Quantisierung Qualität Größe Eignung
Q8_0 Hoch 4.17 GB
Q8_K_XL Hoch 5.54 GB
Q6_K Hoch 3.28 GB
Q6_K_XL Hoch 3.86 GB
Q5_K_M Mittel 2.93 GB
Q5_K_S Mittel 2.82 GB
Q5_K_XL Mittel 3.03 GB
Q4_K_M Mittel 2.55 GB
Q4_K_S Mittel 2.41 GB
Q4_K_XL Mittel 2.71 GB
Q4_0 Mittel 2.41 GB
Q4_1 Mittel 2.59 GB
Q3_K_M Niedrig 2.14 GB
Q3_K_S Niedrig 1.96 GB
Q3_K_XL Niedrig 2.27 GB
Q2_K_XL Niedrig 1.81 GB
Zuletzt aktualisiert: 13. März 2026