Qwen2.5 72B Instruct
Qwen
Code Multilingual Tool Calls
Qwen2.5 72B Instruct e un trasformatore denso da 72,71 miliardi di parametri del team Qwen di Alibaba, perfezionato per il seguimento di istruzioni, la generazione di codice e compiti multilingue. Compete con altri modelli instruct da 70B di primo piano, supportando 14 lingue tra cui inglese, cinese, arabo e giapponese. Il modello offre "tool calling" nativo e capacita di output strutturato. Con una finestra di contesto da 32K e "grouped-query attention", si quantizza in modo efficiente per inferenza self-hosted su configurazioni GPU di fascia alta consumer o server.
Configurazione hardware
Facoltativo — per raccomandazioni di distribuzione precise
| Quantizzazione | Qualità | Dimensione | Adeguatezza |
|---|---|---|---|
| FP16 | Piena precisione | 135.84 GB | — |
| Q8_0 | Alta | 72.27 GB | — |
| Q6_K | Alta | 55.76 GB | — |
| Q5_K_M | Media | 48.1 GB | — |
| Q4_K_M | Media | 40.97 GB | — |
| Q4_0 | Media | 38.51 GB | — |
| Q3_K_M | Bassa | 33.02 GB | — |
| Q2_K | Bassa | 25.45 GB | — |
| Q5_0 | Bassa | 46.89 GB | — |
Ultimo aggiornamento: 5 marzo 2026