Phi 4
Microsoft
Code
Phi 4 è un trasformatore denso da 14,66 miliardi di parametri di Microsoft, addestrato su 9,8 bilioni di token con enfasi su dati sintetici curati per il ragionamento avanzato. Supera molti modelli più grandi nei benchmark di scienze e matematica, rendendolo una scelta solida per carichi di lavoro intensivi in ragionamento a scala moderata. Il modello si concentra sull'inglese con capacità nella generazione di codice e nella risoluzione di problemi matematici. Una finestra di contesto da 16K e il "flash attention" consentono un'inferenza efficiente e si quantizza bene in formato GGUF per deployment GPU self-hosted.
Configurazione hardware
Facoltativo — per raccomandazioni di distribuzione precise
| Quantizzazione | Qualità | Dimensione | Adeguatezza |
|---|---|---|---|
| Q8_0 | Alta | 14.51 GB | — |
| Q6_K | Alta | 11.2 GB | — |
| Q5_K_S | Media | 9.45 GB | — |
| Q4_K_S | Media | 7.86 GB | — |
| Q4_0 | Media | 7.81 GB | — |
| Q4_1 | Media | 8.63 GB | — |
| Q3_K_S | Bassa | 6.06 GB | — |
| Q2_K | Bassa | 5.17 GB | — |
| Q3_K | Bassa | 6.86 GB | — |
| Q3_K_L | Bassa | 7.39 GB | — |
| Q4_K | Bassa | 8.43 GB | — |
| Q5_0 | Bassa | 9.45 GB | — |
| Q5_1 | Bassa | 10.28 GB | — |
| Q5_K | Bassa | 9.88 GB | — |
Ultimo aggiornamento: 5 marzo 2026