Qwen3.6 35B A3B
Qwen
Code Multilingual Thinking Tool Calls Vision
Qwen3.6 35B A3B ist ein Mixture-of-Experts-Modell vom Qwen-Team bei Alibaba mit 35,9 Milliarden Gesamtparametern, von denen nur 3 Milliarden pro Token aktiv sind, verteilt auf 256 Experten über einen neuartigen hybriden Gated-DeltaNet- und Gated-Attention-Mechanismus. Es ist nativ multimodal und verarbeitet Text, Bilder und Video, mit integrierten Denk- und Tool-Calling-Fähigkeiten über ein 262K-Kontextfenster. Das Modell unterstützt über 200 Sprachen und steht unter der Apache-2.0-Lizenz. Bei Q4-Quantisierung benötigt es etwa 20 GB VRAM und eignet sich damit hervorragend für selbstgehostete Bereitstellung auf Consumer-GPUs.
Hardwarekonfiguration
Optional — für präzise Bereitstellungsempfehlungen
| Quantisierung | Qualität | Größe | Eignung |
|---|---|---|---|
| BF16 | Volle Präzision | 64.62 GB | — |
| Q8_0 | Hoch | 34.37 GB | — |
| Q8_K_XL | Hoch | 35.81 GB | — |
| Q6_K | Hoch | 27.06 GB | — |
| Q6_K_XL | Hoch | 29.66 GB | — |
| Q5_K_M | Mittel | 24.64 GB | — |
| Q5_K_S | Mittel | 23.23 GB | — |
| Q5_K_XL | Mittel | 24.77 GB | — |
| Q4_K_M | Mittel | 20.61 GB | — |
| Q4_K_S | Mittel | 19.46 GB | — |
| Q4_K_XL | Mittel | 20.82 GB | — |
| MXFP4_MOE | Mittel | 20.22 GB | — |
| IQ4_NL | Mittel | 16.8 GB | — |
| IQ4_XS | Mittel | 16.51 GB | — |
| Q3_K_M | Niedrig | 15.46 GB | — |
| Q3_K_S | Niedrig | 14.3 GB | — |
| Q3_K_XL | Niedrig | 15.69 GB | — |
| IQ3_S | Niedrig | 12.74 GB | — |
| IQ3_XXS | Niedrig | 12.3 GB | — |
| Q2_K_XL | Niedrig | 11.45 GB | — |
| IQ2_M | Niedrig | 10.73 GB | — |
| IQ2_XXS | Niedrig | 10.02 GB | — |
| IQ1_M | Niedrig | 9.36 GB | — |
Zuletzt aktualisiert: 29. April 2026