Vast.ai

Vast.ai est un marketplace décentralisé de GPU cloud pour l’IA où des fournisseurs indépendants louent leurs GPU à des développeurs, avec des prix fixés par l’offre et la demande, souvent 3 à 5 fois moins chers que les hyperscalers.

Éditeur: Vast.ai (ne pas confondre avec VAST Data, une entreprise différente)
Type: Marketplace GPU décentralisé + Serverless
GPU disponibles: 32+ modèles, 20 000+ GPU, 1 400+ fournisseurs, 500+ locations
Pricing: Marketplace (variable) : H100 depuis ≈ $0,90/h, RTX 4090 depuis ≈ $0,34/h
Facturation: À la seconde, sans minimum
Modes: On-demand, Interruptible (spot), Reserved, Serverless
Conformité: SOC 2 Type I (obtenu en 2025)
Fondation: 2018, Los Angeles, Californie
URL: vast.ai

Qu’est-ce que Vast.ai ?

Vast.ai fonctionne comme un Airbnb pour les GPU. Des propriétaires de matériel (datacenters professionnels, entreprises, et même des particuliers avec des cartes graphiques puissantes) listent leurs GPU sur la plateforme et fixent leurs prix. Les développeurs IA filtrent les offres par modèle de GPU, VRAM, bande passante, prix et localisation, puis louent le matériel pour leurs workloads d’entraînement ou d’inférence.

Ce modèle de marketplace crée une dynamique de concurrence qui tire les prix vers le bas. Quand l’offre de GPU augmente (par exemple quand de nouveaux datacenters listent leur capacité), les prix baissent. Le résultat : Vast.ai affiche les prix les plus bas du marché GPU cloud, régulièrement 3 à 5 fois moins chers que AWS, Azure ou GCP.

Fondée en 2018 à Los Angeles, Vast.ai a grandi de manière organique pour devenir le plus grand marketplace GPU décentralisé, avec plus de 17 000 GPU disponibles à travers 1 400+ fournisseurs dans 500+ emplacements à travers le monde. La plateforme connecte plus de 120 000 développeurs IA avec ces ressources de calcul. L’entreprise a obtenu la certification SOC 2 Type I en 2025, un signal de maturité pour ses ambitions enterprise.

Ne pas confondre Vast.ai et VAST Data Vast.ai (marketplace GPU, Los Angeles) et VAST Data (infrastructure de stockage IA, New York, valorisée à $30 Mds) sont deux entreprises complètement différentes. Vast.ai est le sujet de cette page.

Comment fonctionne le marketplace

Les trois modes de location

On-demand : prix fixe, ressources garanties. Vous louez un GPU à un tarif défini et vous en avez l’usage exclusif pendant toute la durée de location. C’est la priorité haute : votre instance ne sera pas interrompue. C’est le mode recommandé pour les workloads qui ne tolèrent pas d’interruption.

Interruptible : équivalent des instances spot. Le prix est réduit, mais votre instance peut être suspendue ou arrêtée si un locataire on-demand a besoin de la machine. Idéal pour les jobs d’entraînement avec checkpointing régulier ou le traitement batch tolérant aux interruptions. Les économies peuvent atteindre 60-80 % par rapport au on-demand.

Reserved : engagement long terme avec prépaiement pour un tarif réduit. Priorité haute. Adapté aux charges de travail stables et prévisibles.

Les deux tiers de confiance

Tous les fournisseurs sur Vast.ai ne se valent pas. La plateforme distingue deux niveaux :

Hosts non vérifiés (Community) : n’importe qui peut lister ses GPU. Les prix sont les plus bas du marché, mais la fiabilité est variable. Les machines peuvent tomber sans préavis. L’environnement réseau et la sécurité dépendent entièrement du fournisseur.

Hosts vérifiés (Secure Cloud / Blue Trust Label) : datacenters professionnels avec des installations managées, vérifiés par Vast.ai. Prix plus élevés (typiquement $1,50-1,87/h pour un H100 au lieu de ≈ $0,90/h), mais fiabilité nettement supérieure et meilleures garanties de sécurité.

Conseil critique : budgétisez 30-50 % au-dessus du prix affiché Le prix le plus bas affiché sur Vast.ai est attractif, mais il s’agit souvent d’un host non vérifié avec une fiabilité incertaine. En pratique, en tenant compte des interruptions, des redémarrages et du temps perdu, le coût effectif sur les hosts non vérifiés est 20 à 40 % plus élevé que le tarif affiché. Pour des coûts prévisibles, privilégiez les hosts vérifiés et budgétisez en conséquence.

Pricing : les vrais chiffres

Les prix sur Vast.ai fluctuent en temps réel selon l’offre et la demande. Voici les fourchettes typiques observées début 2026 :

GPU	Community (min observé)	Verified Datacenter	VRAM
RTX 3090	≈ $0,15-0,20/h	≈ $0,35-0,50/h	24 Go
RTX 4090	≈ $0,27-0,34/h	≈ $0,50-0,70/h	24 Go
RTX 5090	Variable (nouveau)	Variable	32 Go
A100 80 Go	≈ $0,50-0,80/h	≈ $1,20-1,60/h	80 Go
H100 PCIe	≈ $0,90-1,50/h	≈ $1,50-1,87/h	80 Go
H100 SXM	≈ $1,50-2,50/h	≈ $1,87-3,00/h	80 Go
B200 SXM	Variable	≈ $5-6/h	180 Go

La facturation comprend trois composantes : le compute GPU (facturé à la seconde pendant que l’instance tourne), le stockage disque (facturé en continu tant que l’instance existe, même arrêtée), et la bande passante (facturée par octet transféré, variable selon le fournisseur). Les frais de bande passante sont un piège potentiel sur Vast.ai : contrairement à Lambda Cloud ou RunPod qui offrent le transfert gratuit, Vast.ai facture le transfert de données, et les tarifs varient selon l’hôte.

Attention au stockage des instances arrêtées Sur Vast.ai, le stockage est facturé en continu tant que l’instance existe, même quand elle est arrêtée. Les tarifs de stockage sont souvent plus élevés pour les instances arrêtées que pour les instances actives. Supprimez complètement vos instances quand vous avez terminé pour arrêter la facturation du stockage. C’est différent de « stop » : il faut « delete ».

Vast.ai Serverless : la nouveauté

Lancé en décembre 2025, Vast.ai Serverless est une couche d’inférence automatisée qui route les requêtes vers les GPU les plus rentables du marketplace, en fonction de vos exigences de performance. Le scaling est automatique et prédictif : pas de gestion d’instances, pas de surprovisionnement.

Le pricing serverless est transparent : vous payez uniquement les coûts d’instance sous-jacents (compute, stockage, bande passante) sans frais supplémentaires de la part de Vast.ai pour l’orchestration. C’est un avantage par rapport à RunPod Serverless qui facture un premium de 2-3x au-dessus du prix des pods pour l’orchestration.

Le serverless Vast.ai cible l’inférence en production : vous envoyez des requêtes via API REST et la plateforme gère tout. C’est un pas important pour Vast.ai, qui était historiquement perçu comme un outil de recherche et d’expérimentation plutôt que de production.

Clusters GPU

Vast.ai propose des clusters multi-nœuds pour l’entraînement distribué. Vous pouvez provisionner des groupes de GPU interconnectés via la plateforme. Cependant, les clusters Vast.ai n’offrent pas d’interconnexion InfiniBand native. Pour de l’entraînement distribué de modèles très larges (70B+ paramètres), cette limitation est significative par rapport à Lambda Cloud qui propose de l’InfiniBand Quantum-2 sur ses clusters.

Héberger ses GPU sur Vast.ai

Vast.ai est un marketplace biface : vous pouvez aussi devenir fournisseur et louer vos propres GPU. L’installation est simple : vous inscrivez votre matériel, installez le logiciel léger de Vast.ai, configurez vos tarifs et vos fenêtres de disponibilité, et les clients trouvent vos GPU sur le marketplace.

Vast.ai gère la facturation, le support et la découverte. Les fournisseurs professionnels (5+ serveurs en datacenter) peuvent postuler pour un « Blue Trust Label » qui leur donne un placement prioritaire et plus de visibilité. C’est un modèle intéressant pour les datacenters qui ont de la capacité GPU inutilisée : plutôt que de laisser les machines inactives, vous les rentabilisez via le marketplace.

Vast.ai vs RunPod vs Lambda Cloud

Critère	Vast.ai	RunPod	Lambda Cloud
Modèle	Marketplace décentralisé	Cloud managé + Community	Cloud managé
Prix H100 (min)	≈ $0,90/h (community)	≈ $2,69/h (community)	$2,76/h (cluster)
Prix A100 80 Go (min)	≈ $0,50/h	≈ $0,89/h	$2,06/h
GPU consommateurs	Oui (RTX 3090, 4090, 5090)	Oui (RTX 3090, 4090)	Non
Frais d’egress	Oui (variable par host)	Gratuit	Gratuit
Serverless	Oui (déc. 2025)	Oui (mature)	Non
InfiniBand	Non	Non	Oui (Quantum-2)
Fiabilité	Variable (marketplace)	Bonne (Secure Cloud)	Bonne
SOC-2	Oui (Type I)	Oui	Oui
Hébergement bi-face	Oui (louez vos GPU)	Non	Non
Régions	500+ (global)	31	≈ 3 (US)

Verdict Polydesk Vast.ai est le choix le plus économique pour les workloads qui tolèrent une fiabilité variable : expérimentation, recherche, batch processing, fine-tuning ponctuel. Pour les hosts vérifiés, le rapport qualité-prix reste excellent, surtout sur les A100 ($1,20-1,60/h vs $2,06 chez Lambda, $1,89 chez RunPod Secure). Pour la production en temps réel, RunPod Serverless offre une meilleure fiabilité et un écosystème plus mature. Pour l’entraînement distribué massif, Lambda Cloud avec InfiniBand reste la référence.

Forces et faiblesses

Ce que Vast.ai fait bien

Les prix les plus bas du marché. C’est l’avantage numéro un. Un A100 80 Go à $0,50/h sur Community Cloud, c’est 8 fois moins cher qu’AWS ($4,10/h). Même sur les hosts vérifiés, les économies sont substantielles.

Diversité du matériel. 32+ modèles de GPU disponibles, des RTX 3090 d’entrée de gamme aux B200 de dernière génération. Vous trouvez le GPU exact dont vous avez besoin, avec des filtres précis (VRAM, bande passante, fiabilité, localisation).

Couverture géographique massive. 500+ emplacements à travers le monde, ce qui dépasse largement tous les cloud managés. Pour des workloads qui nécessitent une localisation spécifique (souveraineté des données, latence), Vast.ai offre plus de choix.

Transparence du pricing. Les prix sont visibles en temps réel, avec l’historique des tarifs par GPU. Pas de pricing opaque, pas de « contactez-nous pour un devis ». Vous voyez exactement ce que chaque host facture.

Hébergement biface. La possibilité de louer vos propres GPU est un avantage unique. Si vous avez du matériel GPU inutilisé, Vast.ai vous permet de le monétiser.

Python SDK et CLI. L’automatisation est bien supportée avec un SDK Python, un CLI, et une API REST pour rechercher, lancer et gérer des instances programmatiquement.

Ce que Vast.ai fait moins bien

Fiabilité hétérogène. Sur les hosts non vérifiés, les interruptions sont fréquentes. Les machines tombent sans préavis, les performances réseau sont inconsistantes, et la sécurité dépend du fournisseur. Ce n’est pas un environnement de production.

Frais de bande passante variables. Contrairement à Lambda et RunPod (zéro egress), Vast.ai facture la bande passante, avec des tarifs qui varient par hôte. Pour des workloads qui déplacent beaucoup de données, c’est un coût caché important à surveiller.

Pas d’autoscaling natif. Hors du mode Serverless, Vast.ai ne propose pas d’autoscaling. Vous devez gérer manuellement le provisionnement et le déprovisionnement des instances. Si vous avez besoin de scaling automatique, le serverless est désormais une option, mais il reste plus récent et moins éprouvé que celui de RunPod.

Pas d’InfiniBand. Comme RunPod, Vast.ai ne propose pas d’interconnexion InfiniBand pour les clusters. C’est un frein pour l’entraînement distribué de très grands modèles.

Sécurité à vérifier. Sur les hosts non vérifiés, vos données transitent par du matériel que vous ne contrôlez pas. Pour des données sensibles ou des modèles propriétaires, utilisez exclusivement les hosts vérifiés (Secure Cloud) ou optez pour un cloud managé.

Cas d’usage idéaux

Recherche et expérimentation. C’est le terrain de prédilection de Vast.ai. Louer un RTX 4090 à $0,34/h pour tester un modèle, lancer un fine-tuning LoRA sur un A100 à $0,50/h, ou faire de l’inférence batch sur un dataset : les prix permettent d’itérer sans se soucier du budget.

Génération d’images et de vidéos. La communauté Stable Diffusion, Flux, et ComfyUI utilise massivement Vast.ai pour la génération d’images à bas coût. Des RTX 4090 à $0,34/h offrent un excellent rapport performance/prix pour ces workloads.

Fine-tuning ponctuel de LLM. Si vous faites un fine-tuning LoRA de Llama ou Mistral sur quelques heures, le coût sur un A100 Vast.ai ($0,50-0,80/h) est imbattable. Implémentez du checkpointing régulier pour vous prémunir contre les interruptions sur les hosts non vérifiés.

Transcription audio et traitement batch. Les GPU d’entrée de gamme sur Vast.ai sont parfaits pour du traitement batch non urgent : transcription Whisper, OCR, extraction de features, etc.

Monétiser du matériel GPU inutilisé. Si vous avez des GPU qui ne tournent pas 24/7, listez-les sur Vast.ai et générez des revenus passifs pendant les heures creuses.

Démarrer avec Vast.ai

Étape 1 : Créer un compte. Inscrivez-vous sur cloud.vast.ai. Déposez un minimum de $5 pour commencer. Pas de contrat, pas de minimum.

Étape 2 : Rechercher des offres. Utilisez les filtres pour trouver le GPU qui correspond à vos besoins. Filtrez par modèle (H100, A100, RTX 4090), VRAM, prix, fiabilité du host et localisation.

Étape 3 : Lancer une instance. Choisissez une offre, sélectionnez un template Docker (PyTorch, vLLM, ComfyUI, etc.) ou amenez votre propre image, et lancez. L’instance est prête en secondes.

Étape 4 : Automatiser via le SDK Python.

from vastai_sdk import VastAI

vast = VastAI(api_key="VOTRE_CLE")

# Rechercher des offres H100
offres = vast.search_offers(
    query="gpu_name=H100_SXM num_gpus=8"
)

# Lancer une instance sur la meilleure offre
result = vast.launch_instance(
    id=offres[0]["id"],
    image="vllm/vllm-openai:latest",
    disk=100,
    ssh=True
)
print(f"Instance lancée : {result}")

Startup Program Vast.ai propose un programme startup qui offre jusqu’à 2 500 heures de compute gratuites. Si vous êtes une startup early-stage, c’est un excellent moyen de démarrer sans investissement initial.

Questions fréquentes sur Vast.ai

Vast.ai est-il sûr pour mes données ?

Sur les hosts vérifiés (Secure Cloud), vos workloads tournent dans des conteneurs Docker isolés au sein de datacenters professionnels. Vast.ai a obtenu la certification SOC 2 Type I en 2025. Cependant, sur les hosts non vérifiés, vos données transitent par du matériel que vous ne contrôlez pas. Pour des données sensibles ou des modèles propriétaires, utilisez exclusivement les hosts vérifiés ou optez pour un cloud managé comme Lambda Cloud ou RunPod Secure Cloud.

Pourquoi les prix sont-ils si bas sur Vast.ai ?

Le modèle marketplace agrège du matériel GPU qui a déjà été acheté par les fournisseurs. Ces fournisseurs rentabilisent leurs machines en les louant pendant les heures creuses, et la concurrence entre eux tire les prix vers le bas. AWS, en comparaison, facture l’infrastructure complète (SLA, redondance, réseau, conformité). Vous comparez des choses différentes : du compute brut (Vast.ai) versus de l’infrastructure managée (AWS). Le GPU est le même, mais tout ce qui l’entoure est différent.

Quelle est la différence entre Vast.ai et RunPod Community Cloud ?

RunPod Community Cloud et Vast.ai partagent un concept similaire (GPU agrégés de fournisseurs tiers), mais l’exécution diffère. RunPod vétérifie davantage ses fournisseurs Community Cloud et offre une migration automatique en cas de préemption. Vast.ai offre plus de choix (plus de GPU, plus de modèles, plus de localisations) et des prix encore plus bas. RunPod est plus simple et plus fiable; Vast.ai est moins cher et plus flexible. Pour du serverless, RunPod a un avantage de maturité, bien que Vast.ai Serverless rattrape son retard.

Dois-je utiliser les hosts vérifiés ou non vérifiés ?

Pour des expérimentations courtes (quelques heures), les hosts non vérifiés sont acceptables si vous implémentez du checkpointing. Pour des jobs de plus de 4 heures, les hosts vérifiés sont généralement plus rentables en coût effectif (moins d’interruptions = moins de temps perdu). Pour tout ce qui touche à la production, utilisez exclusivement les hosts vérifiés.

Vaut-il mieux acheter un GPU ou louer sur Vast.ai ?

Pour une utilisation inférieure à 60 % du temps, la location sur Vast.ai est presque toujours moins chère que l’achat. Un H100 coûte $25 000-35 000 à l’achat, plus l’électricité, le refroidissement et la maintenance. Aux tarifs vérifiés de Vast.ai (≈ $1,60/h), il faudrait plus de 15 000 heures de fonctionnement (≈ 21 mois 24/7) pour amortir le coût d’achat, sans compter les frais opérationnels. Pour la majorité des équipes, la location reste le choix économiquement rationnel.