Qwen3 Next 80B A3B Instruct
Qwen
Code Multilingual Tool Calls
Qwen3 Next 80B A3B Instruct ist ein Mixture-of-Experts-Modell vom Qwen-Team bei Alibaba mit 81,32 Milliarden Gesamtparametern, feinabgestimmt für Instruktionsbefolgung und Tool-Use-Workflows. Nur etwa 3 Milliarden Parameter werden pro Token aktiviert, wobei 10 von 512 Experten zum Einsatz kommen, was die Leistung weit größerer Modelle bei drastisch geringeren Rechenkosten erreicht. Es unterstützt Codegenerierung, Tool Calling und 13 Sprachen, darunter Englisch und Chinesisch. Mit einem 262K-Kontextfenster und Flash Attention verarbeitet es lange Dokumente nativ und lässt sich gut ins GGUF-Format quantisieren für selbstgehostete Inferenz auf Consumer-Multi-GPU-Konfigurationen.
Hardwarekonfiguration
Optional — für präzise Bereitstellungsempfehlungen
| Quantisierung | Qualität | Größe | Eignung |
|---|---|---|---|
| Q8_0 | Hoch | 78.99 GB | — |
| Q8_K_XL | Hoch | 86.69 GB | — |
| Q6_K | Hoch | 61.04 GB | — |
| Q6_K_XL | Hoch | 63.81 GB | — |
| Q5_K_M | Mittel | 52.91 GB | — |
| Q5_K_S | Mittel | 51.24 GB | — |
| Q5_K_XL | Mittel | 52.77 GB | — |
| Q4_K_M | Mittel | 45.17 GB | — |
| Q4_K_S | Mittel | 42.38 GB | — |
| Q4_K_XL | Mittel | 42.9 GB | — |
| Q4_0 | Mittel | 42.2 GB | — |
| Q4_1 | Mittel | 46.61 GB | — |
| Q3_K_M | Niedrig | 35.67 GB | — |
| Q3_K_S | Niedrig | 32.21 GB | — |
| Q3_K_XL | Niedrig | 33.19 GB | — |
| Q2_K | Niedrig | 27.17 GB | — |
| Q2_K_L | Niedrig | 27.24 GB | — |
| Q2_K_XL | Niedrig | 28.06 GB | — |
Zuletzt aktualisiert: 5. März 2026