Qwen2.5 72B Instruct

Code Multilingual Tool Calls

Qwen2.5 72B Instruct e un trasformatore denso da 72,71 miliardi di parametri del team Qwen di Alibaba, perfezionato per il seguimento di istruzioni, la generazione di codice e compiti multilingue. Compete con altri modelli instruct da 70B di primo piano, supportando 14 lingue tra cui inglese, cinese, arabo e giapponese. Il modello offre "tool calling" nativo e capacita di output strutturato. Con una finestra di contesto da 32K e "grouped-query attention", si quantizza in modo efficiente per inferenza self-hosted su configurazioni GPU di fascia alta consumer o server.

Configurazione hardware

Produttore

Prodotto

Piattaforma

Famiglia

Modello

VRAM

RAM di sistema (GB) Facoltativo — per raccomandazioni di distribuzione precise

Quantizzazione	Qualità	Dimensione	Adeguatezza
FP16	Piena precisione	135.84 GB	—
Q8_0	Alta	72.27 GB	—
Q6_K	Alta	55.76 GB	—
Q5_K_M	Media	48.1 GB	—
Q4_K_M	Media	40.97 GB	—
Q4_0	Media	38.51 GB	—
Q3_K_M	Bassa	33.02 GB	—
Q2_K	Bassa	25.45 GB	—
Q5_0	Bassa	46.89 GB	—

Ultimo aggiornamento: 29 aprile 2026