Salta ai contenuti

Qwen2.5 72B Instruct

Qwen
Code Multilingual Tool Calls

Qwen2.5 72B Instruct e un trasformatore denso da 72,71 miliardi di parametri del team Qwen di Alibaba, perfezionato per il seguimento di istruzioni, la generazione di codice e compiti multilingue. Compete con altri modelli instruct da 70B di primo piano, supportando 14 lingue tra cui inglese, cinese, arabo e giapponese. Il modello offre "tool calling" nativo e capacita di output strutturato. Con una finestra di contesto da 32K e "grouped-query attention", si quantizza in modo efficiente per inferenza self-hosted su configurazioni GPU di fascia alta consumer o server.

Configurazione hardware

Facoltativo — per raccomandazioni di distribuzione precise
Quantizzazione Qualità Dimensione Adeguatezza
FP16 Piena precisione 135.84 GB
Q8_0 Alta 72.27 GB
Q6_K Alta 55.76 GB
Q5_K_M Media 48.1 GB
Q4_K_M Media 40.97 GB
Q4_0 Media 38.51 GB
Q3_K_M Bassa 33.02 GB
Q2_K Bassa 25.45 GB
Q5_0 Bassa 46.89 GB
Ultimo aggiornamento: 5 marzo 2026