Azure
Azure (Microsoft Azure) est la plateforme de cloud computing de Microsoft qui fournit des services d’infrastructure, de calcul, de stockage, d’IA et de machine learning à la demande, utilisée par plus de 85 % des entreprises du Fortune 500.
- Éditeur
- Microsoft
- Type
- Cloud computing (IaaS, PaaS, SaaS)
- Part de marché
- ≈ 20 % du marché cloud mondial (n°2 derrière AWS)
- Régions
- 70+ régions dans 33+ pays, 300+ datacenters
- IA / LLM
- Azure OpenAI Service (GPT-5.4, GPT-5, GPT-4.1, etc.) + Microsoft Foundry (11 000+ modèles)
- GPU
- NVIDIA A100, H100, Grace Blackwell, Vera Rubin (annoncé)
- Pricing
- Pay-as-you-go, PTU (Provisioned Throughput), Enterprise Agreement
- Essai gratuit
- $200 de crédits + services gratuits pendant 30 jours
- URL
- azure.microsoft.com
Qu’est-ce qu’Azure exactement ?
Azure est la branche cloud de Microsoft, lancée en février 2010. Concrètement, au lieu d’acheter et de maintenir vos propres serveurs, vous louez de la puissance de calcul, du stockage et des services managés dans les datacenters de Microsoft répartis sur toute la planète. Vous payez à l’usage (pay-as-you-go) ou négociez un engagement annuel (Enterprise Agreement).
Le catalogue Azure couvre plus de 200 services regroupés en grandes familles : calcul (machines virtuelles, containers, serverless), stockage (Blob, Files, Data Lake), bases de données (Cosmos DB, SQL, PostgreSQL managé), réseau (VNet, Load Balancer, CDN), et surtout un écosystème IA/ML qui est devenu le principal moteur de croissance de la plateforme. Avec l’intégration exclusive des modèles OpenAI et le lancement de Microsoft Foundry, Azure s’est positionné comme la plateforme de référence pour déployer des applications d’IA en production.
Ce qui distingue Azure de ses concurrents, c’est son intégration native avec l’écosystème Microsoft : Active Directory, Microsoft 365, Dynamics 365, Power Platform et GitHub. Si votre entreprise tourne déjà sous Windows et Office, Azure est souvent le chemin de moindre résistance vers le cloud.
Azure dans le paysage cloud : AWS, GCP et les autres
Le marché du cloud infrastructure est dominé par trois hyperscalers qui contrôlent environ deux tiers des dépenses mondiales. Voici où en sont les parts de marché :
| Fournisseur | Part de marché (2025) | Croissance YoY | Force principale |
|---|---|---|---|
| AWS (Amazon) | ≈ 30 % | ≈ 20 % | Catalogue le plus large, first-mover advantage |
| Azure (Microsoft) | ≈ 20 % | ≈ 33 % | Écosystème Microsoft, partenariat OpenAI |
| GCP (Google) | ≈ 13 % | ≈ 34 % | IA/ML (Vertex AI, TPU), analytics (BigQuery) |
| Alibaba Cloud | ≈ 4 % | Variable | Leader en Chine et Asie-Pacifique |
| Oracle Cloud | ≈ 2-3 % | En hausse | Bases de données, workloads enterprise |
Le chiffre qui saute aux yeux : Azure affiche la croissance la plus forte des trois leaders (33 % YoY au T1 2025 pour le segment Intelligent Cloud), portée en grande partie par les services IA. Le segment Intelligent Cloud de Microsoft a généré 26,8 milliards de dollars au T3 2025, dont 16 points de pourcentage de croissance attribués directement aux services IA.
Les services IA d’Azure : le cœur de la stratégie Microsoft
C’est ici qu’Azure a pris un avantage stratégique majeur. L’investissement de plus de 13 milliards de dollars dans OpenAI a donné à Microsoft un accès exclusif aux modèles GPT dans un environnement cloud enterprise-grade. Voici les piliers IA d’Azure :
Azure OpenAI Service
Azure OpenAI Service vous donne accès aux modèles d’OpenAI (GPT-5.4, GPT-5, GPT-4.1, o3, o4-mini, DALL·E, Whisper, etc.) avec les garanties enterprise d’Azure : isolation des données, conformité réglementaire, déploiement régional et intégration avec le reste de l’écosystème Azure. Vos données ne sont pas utilisées pour entraîner les modèles, contrairement à l’API OpenAI directe sur certains plans.
La tarification suit deux modèles principaux :
| Modèle | Input (par 1M tokens) | Output (par 1M tokens) | Contexte |
|---|---|---|---|
| GPT-5.4 | $2,50 | $15,00 | ≈ 1,05M tokens |
| GPT-5 (Global) | $1,25 | $10,00 | ≈ 400K tokens |
| GPT-5 Pro (Global) | $15,00 | $120,00 | ≈ 400K tokens |
| GPT-5 mini | $0,25 | $2,00 | Variable |
| GPT-5 nano | $0,05 | $0,40 | Variable |
| GPT-4.1 (Global) | $2,00 | $8,00 | ≈ 128K tokens |
| GPT-4.1 mini | $0,40 | $1,60 | ≈ 128K tokens |
| o3 (Global) | $2,00 | $8,00 | 200K tokens |
| o4-mini (Global) | ≈ $0,40 | ≈ $1,60 | 200K tokens |
Microsoft Foundry (ex-Azure AI Studio)
Microsoft Foundry est la plateforme unifiée pour construire, déployer et gérer des applications IA sur Azure. Microsoft la positionne désormais comme « le système d’exploitation pour l’IA d’entreprise ». Elle regroupe plus de 11 000 modèles provenant d’OpenAI, Meta (Llama), Mistral, DeepSeek, xAI (Grok), NVIDIA (Nemotron), Cohere et bien d’autres.
Les composants clés de Foundry :
Foundry Agent Service (GA depuis mars 2026) : permet de construire des agents IA qui raisonnent, planifient et agissent à travers des outils, données et workflows. C’est la réponse de Microsoft à la vague des agents IA.
Foundry Models : catalogue de modèles avec deux modes de déploiement. Le mode Standard (pay-as-you-go, routage global pour maximiser le throughput) et le mode Provisioned (PTU, throughput dédié avec coûts prévisibles).
Foundry Control Plane : observabilité end-to-end du comportement des agents en production. Indispensable pour le debugging et la confiance enterprise.
La plateforme Foundry elle-même est gratuite. Vous payez uniquement les services consommés (modèles, compute, stockage).
Azure AI Services (ex-Cognitive Services)
Au-delà des LLM, Azure propose des services IA spécialisés prêts à l’emploi :
Azure AI Vision : analyse d’images, OCR, détection d’objets, analyse spatiale.
Azure AI Speech : reconnaissance vocale, synthèse vocale (text-to-speech), traduction en temps réel, custom neural voice.
Azure AI Language : analyse de sentiment, extraction d’entités, résumé, Q&A sur documents.
Azure AI Content Safety : modération de contenu texte et image, détection de jailbreak.
Azure AI Search : moteur de recherche hybride (vectoriel + keyword) pour construire des systèmes RAG.
Infrastructure GPU : la course aux puces
Azure a massivement investi dans son infrastructure GPU pour répondre à la demande d’entraînement et d’inférence IA. Microsoft a annoncé avoir déployé des centaines de milliers de GPU NVIDIA Grace Blackwell refroidis par liquide dans ses datacenters en moins d’un an.
Les types de VM GPU disponibles sur Azure :
| Série VM | GPU | Usage typique | Disponibilité |
|---|---|---|---|
| ND A100 v4 | NVIDIA A100 (80 Go) | Entraînement, inférence lourde | GA, multi-régions |
| ND H100 v5 | NVIDIA H100 | Entraînement LLM, HPC | GA, régions limitées |
| ND GB200 (Blackwell) | NVIDIA Grace Blackwell | Inférence reasoning, agents | En déploiement |
| NC T4 v3 | NVIDIA T4 | Inférence légère, dev/test | GA, large disponibilité |
| NV A10 v5 | NVIDIA A10 | Visualisation, inférence moyenne | GA |
L’annonce majeure de la GTC NVIDIA 2026 (mars 2026) : Microsoft est le premier hyperscaler à avoir allumé les systèmes NVIDIA Vera Rubin NVL72 dans ses laboratoires. Le déploiement plus large dans les datacenters Azure refroidis par liquide est prévu dans les mois à venir. C’est un signal clair que Microsoft mise sur l’inférence massive pour les workloads agentiques.
Infrastructure globale : régions et zones
Azure revendique le réseau de datacenters le plus étendu de tous les fournisseurs cloud : plus de 70 régions dans plus de 33 pays, avec plus de 300 datacenters physiques interconnectés par plus de 442 000 kilomètres de fibre optique terrestre et sous-marine.
Chaque région Azure contient un ou plusieurs datacenters. La plupart des régions proposent des zones de disponibilité (Availability Zones), qui sont des emplacements physiques séparés avec alimentation, refroidissement et réseau indépendants. C’est le mécanisme de base pour la haute disponibilité.
Expansion récente et prévue :
En 2025, Microsoft a lancé de nouvelles régions en Malaisie et en Indonésie. En 2026, de nouvelles régions sont prévues en Inde (Hyderabad, India South Central) et à Taïwan. Aux États-Unis, la région East US 3 (Atlanta) arrive début 2027, et des Availability Zones seront ajoutées à North Central US fin 2026.
Pour l’Europe, un investissement de plus de 4 milliards de dollars a été annoncé pour un nouveau datacenter en France, ce qui est pertinent si vous avez des contraintes de résidence des données RGPD.
Cloud hybride : Azure Arc et Azure Stack
Un des avantages compétitifs d’Azure est sa stratégie hybride. Azure Arc vous permet de gérer des ressources qui tournent n’importe où (on-premise, edge, autres clouds) depuis le portail Azure, avec les mêmes outils de sécurité, gouvernance et monitoring.
Azure Stack HCI permet de faire tourner des services Azure directement dans votre propre datacenter. C’est particulièrement pertinent pour les secteurs réglementés (banque, santé, défense) qui ne peuvent pas tout mettre dans le cloud public.
La nouveauté de mars 2026 : Foundry Local, qui permet de faire tourner des modèles IA sur Azure Local (anciennement Azure Stack). Vous gardez le contrôle total sur l’emplacement des données et des calculs, tout en bénéficiant de la cohérence opérationnelle Azure via Azure Arc. C’est la réponse de Microsoft au besoin de souveraineté des données pour l’IA.
Pricing Azure : comprendre la facturation
Le pricing Azure est notoirement complexe. Contrairement à un SaaS avec un prix fixe, chaque service a sa propre grille tarifaire. Voici les principaux modèles :
Pay-as-you-go (PAYG) : vous payez à la consommation, sans engagement. C’est le modèle par défaut. Facile à démarrer, mais le plus cher au token/heure.
Azure Reservations : engagement sur 1 ou 3 ans en échange de réductions significatives (jusqu’à 72 % sur certaines VM). Pertinent si votre charge est prévisible.
Azure Savings Plan for Compute : engagement sur un montant de dépense horaire (pas sur une VM spécifique), ce qui offre plus de flexibilité que les réservations.
Enterprise Agreement (EA) : contrat négocié pour les grandes entreprises, avec des remises volume et des conditions personnalisées.
Provisioned Throughput Units (PTU) : spécifique à Azure OpenAI, les PTU garantissent un throughput fixe pour vos appels LLM. Exemple : GPT-5 Global à $1/heure ou $260/mois pour 15 PTU minimum. C’est avantageux pour des charges stables et élevées, mais vous payez même quand la capacité n’est pas utilisée.
Essai gratuit : Azure offre $200 de crédits valables 30 jours, plus un accès gratuit à certains services populaires pendant 12 mois (VM B1s, 5 Go de Blob Storage, 250 Go de SQL Database, etc.). C’est suffisant pour tester Azure OpenAI et quelques services cognitifs.
Cas d’usage concrets pour l’IA
Voici les scénarios où Azure excelle particulièrement pour les projets IA :
Déployer un chatbot enterprise avec Azure OpenAI + RAG
C’est le cas d’usage numéro un. Vous combinez Azure OpenAI (GPT-5 ou GPT-4.1) avec Azure AI Search pour créer un assistant qui répond à partir de vos documents internes. Le pattern typique :
1. Ingérez vos documents dans Azure AI Search (indexation vectorielle + BM25).
2. L’utilisateur pose une question, Azure AI Search retrouve les passages pertinents.
3. Les passages sont injectés dans le prompt du LLM via RAG.
4. Le LLM génère une réponse avec citations.
Azure fournit des templates prêts à l’emploi dans Foundry pour ce pattern, avec gestion de l’historique de conversation et filtrage Content Safety intégré.
Construire des agents IA avec Foundry Agent Service
Foundry Agent Service (GA depuis mars 2026) permet de créer des agents IA capables d’exécuter des outils (code interpreter, file search, function calling) de manière autonome. L’agent planifie les étapes, appelle les outils nécessaires et synthétise les résultats. C’est le point d’entrée de Microsoft dans la course aux agents, en concurrence directe avec l’Agents SDK d’OpenAI et l’Agents SDK d’Anthropic.
Fine-tuner un modèle sur vos données
Azure OpenAI permet le fine-tuning de certains modèles (GPT-4o, o4-mini) directement dans la plateforme. Les données restent dans votre tenant Azure, ce qui résout les problèmes de conformité. Mais attention au coût d’hébergement du modèle fine-tuné (voir l’encadré ci-dessus).
Servir des modèles open-source à grande échelle
Via Foundry Models, vous pouvez déployer des modèles comme Llama, Mistral Large 3, DeepSeek V3.2, ou Grok 4 en serverless (pay-as-you-go par token) ou en compute managé (pay-per-GPU). C’est une alternative à RunPod ou Vast.ai pour les équipes qui veulent rester dans l’écosystème Azure avec les garanties enterprise.
Azure OpenAI vs API OpenAI directe : que choisir ?
La question revient constamment : faut-il utiliser Azure OpenAI ou l’API OpenAI directe ? Voici les différences concrètes :
| Critère | Azure OpenAI | API OpenAI directe |
|---|---|---|
| Données utilisées pour l’entraînement | Non (engagement contractuel) | Non par défaut sur les endpoints API, mais vérifier les conditions |
| Résidence des données | Choix de la région Azure | Pas de choix de région (sauf data residency endpoints, +10 %) |
| Conformité | SOC 2, ISO 27001, HIPAA, FedRAMP, etc. | SOC 2, mais moins de certifications |
| Réseau privé | Private endpoints, VNet integration | Non |
| SLA | 99,9 % (Standard), plus élevé avec PTU | Best-effort |
| Prix au token | Similaire, parfois légèrement plus élevé sur certains modèles régionaux | Prix de référence |
| Disponibilité des modèles | Décalage de quelques jours/semaines après le lancement OpenAI | Disponibilité immédiate |
| Support | Support Azure enterprise | Support OpenAI |
Sécurité et conformité
Azure détient le plus grand portefeuille de certifications de conformité de tous les fournisseurs cloud. Plus de 100 certifications, dont SOC 1/2/3, ISO 27001/27017/27018, HIPAA, FedRAMP High, PCI DSS, RGPD, C5 (Allemagne), HDS (France, hébergement de données de santé), et SecNumCloud (en cours pour certaines offres).
Les mécanismes de sécurité clés :
Microsoft Entra ID (anciennement Azure AD) : gestion des identités, SSO, MFA, accès conditionnel. C’est le pilier de la sécurité Azure.
Azure Key Vault : gestion centralisée des secrets, clés de chiffrement et certificats.
Microsoft Defender for Cloud : posture de sécurité cloud (CSPM) et protection des workloads (CWPP).
Azure Policy : gouvernance déclarative. Vous définissez des règles (pas de VM sans chiffrement, pas de ressource hors Europe, etc.) et Azure les applique automatiquement.
Confidential Computing : enclaves sécurisées (TEE) pour traiter des données sensibles sans que Microsoft puisse y accéder, même au niveau de l’infrastructure.
Forces et faiblesses d’Azure
Ce qu’Azure fait bien
Intégration Microsoft inégalée. Si votre stack inclut Active Directory, Microsoft 365, Teams, Dynamics ou Power Platform, Azure s’intègre de manière fluide. C’est un avantage que ni AWS ni GCP ne peuvent répliquer.
Offre IA la plus complète. Entre Azure OpenAI, Foundry avec 11 000+ modèles, les services cognitifs, et l’infrastructure GPU, Azure propose l’offre IA la plus large du marché. L’accès exclusif aux modèles OpenAI dans un environnement enterprise est un atout décisif.
Cloud hybride mature. Azure Arc et Azure Stack sont en avance sur les offres équivalentes d’AWS (Outposts) et GCP (Anthos/Distributed Cloud) en termes de maturité et de couverture fonctionnelle.
Réseau de régions le plus étendu. 70+ régions, ce qui dépasse AWS (33 régions) et GCP (40+ régions). C’est un avantage pour la résidence des données et la latence.
Ce qu’Azure fait moins bien
Complexité du pricing. La facturation Azure est fragmentée et difficile à prévoir. Chaque service a sa propre grille, et les coûts cachés (gateway, monitoring, stockage des logs) s’accumulent. Le FinOps est indispensable sur Azure.
Courbe d’apprentissage. Le portail Azure est dense et parfois confus. La documentation, bien que volumineuse, manque de clarté sur certains sujets. La nomenclature change fréquemment (Azure AI Studio → Microsoft Foundry, Azure AD → Microsoft Entra ID).
Disponibilité GPU inégale. Les GPU haut de gamme (H100, Blackwell) sont souvent en rupture ou limités à quelques régions. Les délais de provisioning peuvent être longs. Pour du GPU à la demande, des services spécialisés comme RunPod, Lambda Cloud ou Vast.ai offrent souvent une meilleure disponibilité et des prix plus bas.
Dépendance Microsoft. L’intégration avec l’écosystème Microsoft est un avantage si vous y êtes déjà, mais un verrou (vendor lock-in) si vous souhaitez en sortir.
Comment démarrer avec Azure pour l’IA
Voici le chemin le plus direct pour utiliser Azure dans un projet IA :
Étape 1 : Créer un compte Azure. Rendez-vous sur azure.microsoft.com, créez un compte avec une carte bancaire. Vous obtenez $200 de crédits gratuits pendant 30 jours.
Étape 2 : Demander l’accès à Azure OpenAI. Azure OpenAI nécessite une demande d’accès séparée via un formulaire. L’approbation est généralement rapide (quelques heures à quelques jours) pour les comptes professionnels.
Étape 3 : Créer un projet dans Microsoft Foundry. Allez sur ai.azure.com, créez un projet Foundry. Choisissez votre région (France Central si vous êtes en France et avez des contraintes RGPD).
Étape 4 : Déployer un modèle. Dans le catalogue de modèles, sélectionnez GPT-5 ou GPT-4.1 selon votre budget. Déployez-le en mode Standard (pay-as-you-go) pour commencer.
Étape 5 : Tester dans le playground. Foundry fournit un playground interactif pour tester vos prompts avant d’écrire du code.
Étape 6 : Intégrer via l’API. L’API Azure OpenAI est compatible avec le SDK OpenAI Python/Node.js. Changez simplement le base_url et la clé API :
from openai import AzureOpenAI
client = AzureOpenAI(
azure_endpoint="https://votre-resource.openai.azure.com/",
api_key="votre-cle-azure",
api_version="2024-12-01-preview"
)
response = client.chat.completions.create(
model="gpt-5", # nom de votre deployment
messages=[{"role": "user", "content": "Bonjour Azure !"}]
)
print(response.choices[0].message.content)
Alternatives à Azure pour l’IA
Azure n’est pas le seul choix. Selon votre cas d’usage, d’autres plateformes peuvent être plus adaptées :
| Plateforme | Meilleur pour | Avantage clé vs Azure |
|---|---|---|
| AWS (Bedrock, SageMaker) | Multi-modèle enterprise, ML custom | Catalogue de services plus large, écosystème plus mature |
| GCP (Vertex AI) | IA/ML native, analytics | TPU custom, BigQuery, meilleur écosystème data |
| Replicate | Déploiement rapide de modèles open-source | Simplicité, pay-per-second, pas de config infra |
| Together AI | Inférence modèles open-source à bas coût | Prix agressifs, fine-tuning simple |
| Modal | GPU serverless pour devs | DX supérieure, scale-to-zero, pricing transparent |
| RunPod | GPU bare-metal abordable | Jusqu’à 80 % moins cher pour du GPU pur |
| Lambda Cloud | Entraînement et inférence GPU | H100/A100 à prix compétitifs, setup minimal |
Questions fréquentes sur Azure
Quelle est la différence entre Azure et Azure OpenAI ?
Azure est la plateforme cloud complète de Microsoft (compute, stockage, réseau, bases de données, etc.). Azure OpenAI Service est un service spécifique au sein d’Azure qui donne accès aux modèles d’OpenAI (GPT-5.4, GPT-5, DALL·E, Whisper) avec les garanties enterprise d’Azure. Vous pouvez utiliser Azure sans Azure OpenAI, mais l’inverse n’est pas possible : Azure OpenAI nécessite un compte et un abonnement Azure.
Azure est-il gratuit pour commencer ?
Oui, partiellement. Azure offre $200 de crédits gratuits valables 30 jours à l’ouverture du compte, plus un accès gratuit à certains services pendant 12 mois (VM B1s, stockage, bases de données). Au-delà, vous passez en pay-as-you-go. Attention : Azure OpenAI nécessite une demande d’accès séparée, qui est généralement approuvée en quelques jours pour les comptes professionnels.
Azure est-il plus cher qu’AWS ou GCP ?
C’est comparable. Pour le compute pur (VM, conteneurs), les prix des trois hyperscalers sont proches, avec des variations selon les régions et les types d’instances. Azure est souvent compétitif grâce au programme Azure Hybrid Benefit, qui permet de réutiliser vos licences Windows Server et SQL Server existantes (réduction jusqu’à 85 % sur certaines VM). Pour l’IA spécifiquement, les prix au token d’Azure OpenAI sont alignés sur ceux de l’API OpenAI directe. Les coûts cachés (gateway, monitoring, Content Safety) peuvent rendre la facture finale plus élevée que prévu.
Peut-on utiliser des modèles autres qu’OpenAI sur Azure ?
Absolument. Microsoft Foundry propose plus de 11 000 modèles de fournisseurs variés : Meta (Llama), Mistral, DeepSeek, xAI (Grok), Cohere, NVIDIA (Nemotron) et bien d’autres. Vous pouvez les déployer en serverless (pay-as-you-go par token) ou en compute managé (pay-per-GPU). Vous pouvez aussi héberger n’importe quel modèle open-source sur des VM GPU ou via Azure Container Apps avec GPU serverless.
Azure est-il adapté aux startups et petites équipes ?
Azure est avant tout conçu pour les entreprises et les grandes organisations. Pour une startup ou une petite équipe, la complexité de configuration et de facturation peut être un frein. Des alternatives comme Replicate, Modal ou Together AI offrent une expérience développeur plus simple pour déployer de l’IA. Cela dit, si vous avez besoin d’un écosystème complet (base de données, authentification, CDN, monitoring) ou si vous ciblez des clients enterprise qui exigent des certifications de conformité, Azure devient pertinent même pour une petite structure.