Zum Inhalt springen

Qwen3.6 35B A3B

Qwen
Code Multilingual Thinking Tool Calls Vision

Qwen3.6 35B A3B ist ein Mixture-of-Experts-Modell vom Qwen-Team bei Alibaba mit 35,9 Milliarden Gesamtparametern, von denen nur 3 Milliarden pro Token aktiv sind, verteilt auf 256 Experten über einen neuartigen hybriden Gated-DeltaNet- und Gated-Attention-Mechanismus. Es ist nativ multimodal und verarbeitet Text, Bilder und Video, mit integrierten Denk- und Tool-Calling-Fähigkeiten über ein 262K-Kontextfenster. Das Modell unterstützt über 200 Sprachen und steht unter der Apache-2.0-Lizenz. Bei Q4-Quantisierung benötigt es etwa 20 GB VRAM und eignet sich damit hervorragend für selbstgehostete Bereitstellung auf Consumer-GPUs.

Hardwarekonfiguration
Optional — für präzise Bereitstellungsempfehlungen
Quantisierung Qualität Größe Eignung
BF16 Volle Präzision 64.62 GB
Q8_0 Hoch 34.37 GB
Q8_K_XL Hoch 35.81 GB
Q6_K Hoch 27.06 GB
Q6_K_XL Hoch 29.66 GB
Q5_K_M Mittel 24.64 GB
Q5_K_S Mittel 23.23 GB
Q5_K_XL Mittel 24.77 GB
Q4_K_M Mittel 20.61 GB
Q4_K_S Mittel 19.46 GB
Q4_K_XL Mittel 20.82 GB
MXFP4_MOE Mittel 20.22 GB
IQ4_NL Mittel 16.8 GB
IQ4_XS Mittel 16.51 GB
Q3_K_M Niedrig 15.46 GB
Q3_K_S Niedrig 14.3 GB
Q3_K_XL Niedrig 15.69 GB
IQ3_S Niedrig 12.74 GB
IQ3_XXS Niedrig 12.3 GB
Q2_K_XL Niedrig 11.45 GB
IQ2_M Niedrig 10.73 GB
IQ2_XXS Niedrig 10.02 GB
IQ1_M Niedrig 9.36 GB
Zuletzt aktualisiert: 29. April 2026