Phi 4
Microsoft
Code
Phi 4 est un transformeur dense de 14,66 milliards de paramètres de Microsoft, entraîné sur 9,8 billions de tokens avec un accent sur les données synthétiques curées pour le raisonnement avancé. Il surpasse de nombreux modèles plus grands sur les benchmarks de sciences et de mathématiques, ce qui en fait un choix solide pour les charges de travail intensives en raisonnement à échelle modérée. Le modèle se concentre sur l'anglais avec des capacités en génération de code et résolution de problèmes mathématiques. Une fenêtre de contexte de 16K et le "flash attention" permettent une inférence efficace, et il se quantifie bien au format GGUF pour des déploiements GPU auto-hébergés.
Configuration matérielle
Facultatif — pour des recommandations de déploiement précises
| Quantification | Qualité | Taille | Adéquation |
|---|---|---|---|
| Q8_0 | Élevée | 14.51 GB | — |
| Q6_K | Élevée | 11.2 GB | — |
| Q5_K_S | Moyenne | 9.45 GB | — |
| Q4_K_S | Moyenne | 7.86 GB | — |
| Q4_0 | Moyenne | 7.81 GB | — |
| Q4_1 | Moyenne | 8.63 GB | — |
| Q3_K_S | Basse | 6.06 GB | — |
| Q2_K | Basse | 5.17 GB | — |
| Q3_K | Basse | 6.86 GB | — |
| Q3_K_L | Basse | 7.39 GB | — |
| Q4_K | Basse | 8.43 GB | — |
| Q5_0 | Basse | 9.45 GB | — |
| Q5_1 | Basse | 10.28 GB | — |
| Q5_K | Basse | 9.88 GB | — |
Dernière mise à jour : 5 mars 2026