Qwen3 Next 80B A3B Instruct

Code Multilingual Tool Calls

Qwen3 Next 80B A3B Instruct ist ein Mixture-of-Experts-Modell vom Qwen-Team bei Alibaba mit 81,32 Milliarden Gesamtparametern, feinabgestimmt für Instruktionsbefolgung und Tool-Use-Workflows. Nur etwa 3 Milliarden Parameter werden pro Token aktiviert, wobei 10 von 512 Experten zum Einsatz kommen, was die Leistung weit größerer Modelle bei drastisch geringeren Rechenkosten erreicht. Es unterstützt Codegenerierung, Tool Calling und 13 Sprachen, darunter Englisch und Chinesisch. Mit einem 262K-Kontextfenster und Flash Attention verarbeitet es lange Dokumente nativ und lässt sich gut ins GGUF-Format quantisieren für selbstgehostete Inferenz auf Consumer-Multi-GPU-Konfigurationen.

Hardwarekonfiguration

Hersteller

Produkt

Plattform

Familie

Modell

VRAM

System-RAM (GB) Optional — für präzise Bereitstellungsempfehlungen

Quantisierung	Qualität	Größe	Eignung
Q8_0	Hoch	78.99 GB	—
Q8_K_XL	Hoch	86.69 GB	—
Q6_K	Hoch	61.04 GB	—
Q6_K_XL	Hoch	63.81 GB	—
Q5_K_M	Mittel	52.91 GB	—
Q5_K_S	Mittel	51.24 GB	—
Q5_K_XL	Mittel	52.77 GB	—
Q4_K_M	Mittel	45.17 GB	—
Q4_K_S	Mittel	42.38 GB	—
Q4_K_XL	Mittel	42.9 GB	—
Q4_0	Mittel	42.2 GB	—
Q4_1	Mittel	46.61 GB	—
Q3_K_M	Niedrig	35.67 GB	—
Q3_K_S	Niedrig	32.21 GB	—
Q3_K_XL	Niedrig	33.19 GB	—
Q2_K	Niedrig	27.17 GB	—
Q2_K_L	Niedrig	27.24 GB	—
Q2_K_XL	Niedrig	28.06 GB	—

Zuletzt aktualisiert: 29. April 2026