Qwen3 32B
Qwen
Code Multilingual Thinking Tool Calls
Qwen3 32B ist ein dichter Transformer mit 32 Milliarden Parametern vom Qwen-Team bei Alibaba, der Denkfaehigkeiten mit starker Codegenerierung, Tool Calling und mehrsprachiger Unterstuetzung kombiniert. Er besetzt eine mittlere Parameterklasse, die Schlussfolgerungstiefe mit praktischen Deployment-Anforderungen ausbalanciert und viele groessere Modelle bei Mathematik- und Logik-Benchmarks uebertrifft. Das Modell unterstuetzt 14 Sprachen, darunter Englisch, Chinesisch und Arabisch. Mit einem 40K-Kontextfenster und Flash Attention passt es bei Q4-Quantisierung auf eine einzelne High-End-GPU fuer selbstgehostete Inferenz.
Hardwarekonfiguration
Optional — für präzise Bereitstellungsempfehlungen
| Quantisierung | Qualität | Größe | Eignung |
|---|---|---|---|
| Q8_0 | Hoch | 32.43 GB | — |
| Q8_K_XL | Hoch | 36.77 GB | — |
| Q6_K | Hoch | 25.04 GB | — |
| Q6_K_XL | Hoch | 26.97 GB | — |
| Q5_K_M | Mittel | 21.62 GB | — |
| Q5_K_S | Mittel | 21.08 GB | — |
| Q5_K_XL | Mittel | 21.64 GB | — |
| Q4_K_M | Mittel | 18.4 GB | — |
| Q4_K_S | Mittel | 17.48 GB | — |
| Q4_K_XL | Mittel | 18.65 GB | — |
| Q4_0 | Mittel | 17.42 GB | — |
| Q4_1 | Mittel | 19.22 GB | — |
| Q3_K_M | Niedrig | 14.87 GB | — |
| Q3_K_S | Niedrig | 13.4 GB | — |
| Q3_K_XL | Niedrig | 15.28 GB | — |
| Q2_K | Niedrig | 11.5 GB | — |
| Q2_K_L | Niedrig | 11.67 GB | — |
| Q2_K_XL | Niedrig | 11.92 GB | — |
Zuletzt aktualisiert: 5. März 2026