Phi : les petits modeles IA de Microsoft specialises en raisonnement
- Editeur
- Microsoft Research
- Version actuelle
- Phi-4 (14B params) + variantes reasoning et multimodal
- Parametres
- 14 milliards (Phi-4 base)
- Entrainement
- 9,8 trillions de tokens (donnees curees + synthetiques)
- Specialite
- Raisonnement, mathematiques, STEM, code
- Licence
- MIT (open-source)
- Disponibilite
- Azure AI Foundry, Hugging Face
- URL
- azure.microsoft.com/phi
Qu’est-ce que Phi ?
Phi est la reponse de Microsoft a une question fondamentale en IA : jusqu’ou peut-on pousser les performances d’un petit modele ? Alors que la course aux parametres domine l’industrie (GPT-5.4, Opus 4.6, Gemini 3.1 Pro sont tous des modeles massifs), Microsoft Research demontre que la qualite des donnees d’entrainement peut compenser la taille du modele.
L’approche Phi repose sur deux piliers : des donnees d’entrainement soigneusement curees (filtrage rigoureux des sources web) et des donnees synthetiques generees par des modeles plus grands pour enseigner le raisonnement. Le resultat : un modele de 14B parametres qui surpasse des modeles 5 a 10 fois plus grands sur certains benchmarks de mathematiques et de code.
En mars 2026, la famille Phi-4 comprend plusieurs variantes : Phi-4 (base), Phi-4-mini (compact multilingue), Phi-4-multimodal (texte + audio + vision), Phi-4-reasoning (STEM avance) et Phi-4-reasoning-vision (raisonnement visuel, 15B parametres, mars 2026).
Les modeles Phi-4 en detail
Phi-4 (14B)
Le modele de base, entraine sur 9,8 trillions de tokens. Il excelle en raisonnement complexe, particulierement en mathematiques et en code. A sa sortie, il surpassait des modeles beaucoup plus grands sur les benchmarks STEM, defiant la logique conventionnelle selon laquelle plus gros = meilleur.
Phi-4-mini
Version compacte avec un vocabulaire de 200 000 mots supportant plus de 20 langues. Il integre le Grouped Query Attention, le function calling natif et une meilleure capacite a suivre les instructions. Ideal pour le deploiement on-device (smartphones, IoT, edge computing).
Phi-4-multimodal
Premier modele Phi a supporter le texte, l’audio et la vision en entree. Il se specialise dans la reconnaissance vocale, la traduction, le resume de contenu audio, le Q&A et la comprehension d’images. C’est une avancee significative pour les cas d’usage embarques multimodaux.
Phi-4-reasoning et Phi-4-reasoning-plus
Phi-4-reasoning est fine-tune sur plus de 1,4 million de questions STEM et de code. Il utilise une chaine de raisonnement etendue (chain-of-thought) pour resoudre des problemes complexes etape par etape. La variante « plus » ajoute une phase de reinforcement learning pour ameliorer encore la precision.
Phi-4-reasoning-vision (mars 2026)
Derniere variante en date (4 mars 2026), ce modele de 15B parametres combine le raisonnement avance avec la comprehension d’images. Il a ete entraine sur 240 GPU NVIDIA B200 en seulement 4 jours, avec un contexte de 16 384 tokens.
| Modele | Parametres | Modalites | Specialite |
|---|---|---|---|
| Phi-4 | 14B | Texte | Raisonnement general, maths, code |
| Phi-4-mini | Compact | Texte | On-device, multilingue (20+ langues) |
| Phi-4-multimodal | ~14B | Texte + audio + vision | Applications embarquees multimodales |
| Phi-4-reasoning | 14B | Texte | STEM avance, code |
| Phi-4-reasoning-vision | 15B | Texte + images | Raisonnement visuel |
L’approche « donnees synthetiques »
Ce qui rend Phi unique dans le paysage IA n’est pas son architecture (un Transformer relativement standard) mais sa methode d’entrainement. Microsoft Research a systematiquement utilise des donnees synthetiques generees par des modeles plus grands pour enseigner le raisonnement au modele.
L’idee : plutot que d’entrainer sur du texte web brut (souvent bruyant et de qualite variable), generer des exemples de raisonnement step-by-step de haute qualite et entrainer le petit modele dessus. Cette technique de « distillation de connaissances » permet a Phi d’acquerir des capacites de raisonnement disproportionnees par rapport a sa taille.
Deploiement
Les modeles Phi sont disponibles sur Azure AI Foundry (la plateforme cloud de Microsoft) et sur Hugging Face en open-source sous licence MIT. Ils peuvent etre deployes localement via Ollama, vLLM ou directement avec HuggingFace Transformers.
La petite taille de Phi est son atout principal pour le deploiement : Phi-4 base necessite environ 28 Go de VRAM en FP16, ou ~8 Go en quantification 4-bit. C’est compatible avec un GPU consumer comme une RTX 4070 Ti (16 Go) en precision reduite.
Phi vs LLaMA 3 8B vs Mistral Small
| Critere | Phi-4 (14B) | LLaMA 3 8B | Mistral Small 3 |
|---|---|---|---|
| Parametres | 14B | 8B | ~24B |
| Force | Raisonnement, maths | Polyvalence | Multilingue, code |
| Licence | MIT | Llama Community | Apache 2.0 |
| Multimodal | Oui (variantes) | Non (base) | Oui |
| Donnees synthetiques | Oui (massivement) | Non | Non confirme |
| Editeur | Microsoft | Meta | Mistral AI |
Phi excelle sur les taches de raisonnement structure (maths, STEM, logique) grace a son entrainement sur donnees synthetiques. LLaMA 3 8B est plus polyvalent et beneficie d’un ecosysteme de fine-tunes plus large. Mistral Small offre un bon equilibre multilingue/code avec une taille intermediaire.
Historique de la famille Phi
| Version | Date | Taille | Innovation |
|---|---|---|---|
| Phi-1 | Juin 2023 | 1,3B | Code genere par donnees synthetiques |
| Phi-2 | Decembre 2023 | 2,7B | Raisonnement ameliore, surpasse Mistral 7B |
| Phi-3 | Avril 2024 | 3,8B / 14B | Mini et Medium, on-device |
| Phi-4 | Decembre 2025 | 14B | 9,8T tokens, STEM avance |
| Phi-4-reasoning-vision | Mars 2026 | 15B | Raisonnement visuel |
FAQ Phi
Phi est-il gratuit ?
Oui, les modeles Phi sont open-source sous licence MIT (la plus permissive). Vous pouvez les telecharger depuis Hugging Face et les deployer sans aucune restriction, y compris pour un usage commercial.
Phi peut-il remplacer un grand modele comme GPT-5.4 ?
Non pour les taches generalistes complexes (redaction longue, analyse nuancee, raisonnement multi-etapes profond). Oui pour les taches de raisonnement structure (maths, code, logique STEM) ou Phi-4 rivalise avec des modeles 5-10x plus grands. Le cas d’usage ideal est le deploiement embarque ou edge.
Phi-4 fonctionne-t-il sur un Mac ?
Oui, via Ollama ou llama.cpp. Phi-4 en quantification 4-bit necessite environ 8 Go de RAM, ce qui le rend compatible avec un Mac M1 16 Go. Les variantes plus grandes (reasoning-vision 15B) necessitent un peu plus de memoire.
Qu’est-ce qui rend Phi different des autres petits modeles ?
L’utilisation massive de donnees synthetiques pour l’entrainement. Plutot que de compter uniquement sur du texte web, Microsoft genere des exemples de raisonnement de haute qualite avec des modeles plus grands. Cette approche de distillation permet a Phi de « raisonner » au-dela de ce que sa taille suggere.
Phi supporte-t-il le francais ?
Phi-4-mini integre un vocabulaire de 200 000 mots avec support de plus de 20 langues, dont le francais. Les performances en francais sont inferieures a celles en anglais, mais suffisantes pour de nombreuses taches courantes. Pour un usage intensif en francais, Mistral reste un meilleur choix.