Qwen3.5 0.8B
Qwen
Code Multilingual Thinking Tool Calls Vision
Qwen3.5 0.8B ist das kleinste Modell in Alibabas Qwen-3.5-Familie mit Gated-Delta-Networks-Hybridarchitektur und 0,87 Milliarden Parametern, speziell entwickelt für Smartphones, Edge-Geräte und extrem ressourcenbeschränkte Umgebungen. Es ist nativ multimodal und verarbeitet Text, Bilder und Video, mit integrierten Denkfähigkeiten für Chain-of-Thought-Schlussfolgern. Das Modell unterstützt ein 262K-Kontextfenster und deckt über 201 Sprachen ab. Unter der Apache-2.0-Lizenz veröffentlicht, lässt es sich auf unter 1 GB VRAM bei Q4 quantisieren und eignet sich ideal für Klassifikation und einfache Aufgaben im selbstgehosteten Deployment.
Hardwarekonfiguration
Optional — für präzise Bereitstellungsempfehlungen
| Quantisierung | Qualität | Größe | Eignung |
|---|---|---|---|
| Q8_0 | Hoch | 0.76 GB | — |
| Q8_K_XL | Hoch | 1.1 GB | — |
| Q6_K | Hoch | 0.6 GB | — |
| Q6_K_XL | Hoch | 0.72 GB | — |
| Q5_K_M | Mittel | 0.55 GB | — |
| Q5_K_S | Mittel | 0.53 GB | — |
| Q5_K_XL | Mittel | 0.56 GB | — |
| Q4_K_M | Mittel | 0.5 GB | — |
| Q4_K_S | Mittel | 0.47 GB | — |
| Q4_K_XL | Mittel | 0.52 GB | — |
| Q4_0 | Mittel | 0.47 GB | — |
| Q4_1 | Mittel | 0.5 GB | — |
| Q3_K_M | Niedrig | 0.44 GB | — |
| Q3_K_S | Niedrig | 0.41 GB | — |
| Q3_K_XL | Niedrig | 0.46 GB | — |
| Q2_K_XL | Niedrig | 0.39 GB | — |
Zuletzt aktualisiert: 13. März 2026