Runway : la plateforme de génération vidéo IA qui domine les benchmarks

Définition rapide Runway est une startup d’IA générative fondée en 2018, spécialisée dans la génération et l’édition de vidéos par IA. Son modèle Gen-4.5, lancé en décembre 2025, occupe la première place du classement Artificial Analysis Text to Video (1 247 points Elo), surpassant les modèles de Google, OpenAI et tous les autres concurrents. Runway propose une plateforme web complète avec text-to-video, image-to-video, workflows personnalisables et, depuis 2026, l’intégration de modèles tiers (Kling, Sora 2 Pro, GPT Image 1.5). Valorisation : 3,55 milliards de dollars.

L’histoire de Runway : du pionnier au leader

Runway a été fondée en 2018 par Cristóbal Valenzuela, Alejandro Matamala et Anastasis Germanidis. L’entreprise s’est d’abord fait connaître comme un outil d’édition vidéo assisté par IA, avant de pivoter vers la génération vidéo pure avec le lancement de Gen-1 en 2023, le premier modèle de génération vidéo accessible au public.

L’évolution des modèles Gen a été rapide : Gen-1 (mars 2023, premiers pas en text-to-video), Gen-2 (juin 2023, qualité améliorée), Gen-3 Alpha (juin 2024, saut qualitatif majeur avec motion brush et styles), Gen-4 (mars 2025, references et cohérence de personnages), et Gen-4.5 (décembre 2025, n°1 au benchmark avec précision physique inégalée).

Runway a levé 315 millions de dollars supplémentaires en 2026 pour financer le développement de « world models », des modèles d’IA capables de comprendre et simuler le monde physique. Les investisseurs incluent General Atlantic, Baillie Gifford, NVIDIA et Salesforce Ventures. L’entreprise emploie environ 100 personnes et est valorisée à 3,55 milliards de dollars.

Le CEO Cristóbal Valenzuela a décrit Gen-4.5 comme un « overnight success that took seven years », soulignant que le modèle avait été développé par une équipe de 100 personnes qui a réussi à surpasser des modèles de sociétés valant plusieurs milliers de milliards de dollars.

Gen-4.5 : le modèle n°1 mondial

Gen-4.5, lancé le 1er décembre 2025 (disponible pour tous les plans payants depuis le 11 décembre), est le modèle phare de Runway. Il occupe la première place du classement Artificial Analysis Text to Video avec 1 247 points Elo, basé sur un système de comparaison aveugle où les évaluateurs choisissent entre deux vidéos sans savoir quelle entreprise les a produites.

Qualité et capacités

Précision physique : Gen-4.5 comprend la physique du monde réel avec un niveau de détail remarquable. Les objets se déplacent avec un poids, une inertie et une force réalistes. Les liquides coulent avec une dynamique correcte. Les surfaces sont rendues avec des reflets, des ombres et des textures cohérents. Les cheveux et les tissus se comportent naturellement en mouvement.

Fidélité au prompt : le modèle adhère aux descriptions textuelles complexes avec une précision élevée. Les compositions multi-éléments, les interactions entre personnages, les mouvements de caméra spécifiques et les ambiances d’éclairage sont respectés de manière fiable.

Cohérence temporelle : les personnages et objets maintiennent leur apparence et leurs proportions entre les frames, même lors de mouvements complexes ou de changements d’angle de caméra. C’est un point où Gen-4.5 surpasse la plupart des concurrents.

Personnages expressifs : les visages expriment des émotions nuancées, les gestes sont naturels, les détails comme les rides d’expression et les mouvements oculaires sont cohérents. Gen-4.5 gère aussi les interactions entre personnages de manière réaliste.

Diversité stylistique : le modèle supporte un large spectre de styles visuels, du cinéma réaliste à l’animation stylisée, en maintenant une cohérence visuelle et une identité unifiée dans chaque style.

Limites connues

Malgré ses performances, Gen-4.5 présente des limitations communes aux modèles de génération vidéo actuels :

Raisonnement causal : les effets précèdent parfois les causes (une porte s’ouvre avant que la poignée soit actionnée).

Permanence des objets : des objets peuvent disparaître ou apparaître de manière inattendue quand ils sont occultés par d’autres éléments.

Biais de succès : les actions réussissent de manière disproportionnée (un tir mal visé marque quand même le but). Ce biais est particulièrement important dans le contexte des « world models » que Runway développe.

Pas d’audio natif en text-to-video : contrairement à Sora 2 Pro et Veo 3.1, Gen-4.5 ne génère pas d’audio synchronisé nativement en text-to-video. Runway a ajouté des fonctionnalités audio séparées (Text to Speech, SFX, Speech to Speech) en décembre 2025, mais elles ne sont pas intégrées directement dans le pipeline de génération vidéo.

Les fonctionnalités de Runway

Text-to-video

Décrivez une scène et Gen-4.5 génère une vidéo HD. Le modèle comprend les mouvements de caméra (panoramique, travelling, zoom, grue, steadicam), les interactions physiques, les expressions faciales et les ambiances d’éclairage. Les vidéos sont typiquement de 5 à 10 secondes, en résolution jusqu’à 1080p.

Image-to-video

Disponible depuis le 21 janvier 2026 pour Gen-4.5. Fournissez une image (réelle, générée, esquissée ou illustrée) comme première frame et ajoutez un prompt textuel pour guider le mouvement. Le modèle anime l’image en respectant son style, sa composition et ses détails. C’est particulièrement puissant pour animer des photos produit, des concept arts ou des illustrations.

References (personnages et objets)

Gen-4 et Gen-4.5 supportent un système de References qui permet de maintenir la cohérence de personnages, lieux et objets entre plusieurs générations. Uploadez des images de référence et le modèle reproduit le sujet dans de nouvelles scènes. La mise à jour Gen-4 References améliore significativement la cohérence des objets et l’adhérence au prompt.

Workflows

Les Workflows sont un système de pipelines visuels (node-based, comparable à ComfyUI) permettant d’enchaîner plusieurs modèles et opérations. Vous pouvez créer un workflow qui génère une image, la transforme en vidéo, applique un upscale, ajoute de l’audio, puis exporte le résultat. Les Workflows peuvent être publiés comme « Apps » partageables avec votre workspace.

Les nœuds disponibles incluent la génération vidéo (Gen-4.5, modèles tiers), la génération d’images (Gen-4 Image), l’upscaling vidéo, les nœuds audio (Text to Speech, SFX, Speech to Speech) et des nœuds de contrôle logique.

Gen-4 Image

Runway propose aussi un modèle de génération d’images (Gen-4 Image) décrit comme le « modèle de génération d’images le plus avancé et le plus cohérent » de l’entreprise. Il est disponible via l’interface web et via API. Les images peuvent servir directement de first frame pour la génération vidéo Gen-4.5, créant un pipeline image→vidéo fluide.

Modèles tiers intégrés

Depuis février 2026, Runway intègre des modèles tiers directement dans sa plateforme : Kling 3.0, Kling 2.6 Pro, Kling 2.5 Turbo Pro, WAN2.2 Animate, GPT Image 1.5, Sora 2 Pro, et d’autres. Cette stratégie multi-modèles transforme Runway d’un outil propriétaire en une plateforme agrégeant les meilleurs modèles du marché, à l’image de ce que fait Leonardo AI pour les images.

Fonctionnalités audio

Lancées en décembre 2025 : Text to Speech (génération de voix à partir de texte), SFX (Sound Effects, effets sonores à partir de descriptions), Speech to Speech (transformation de voix). Ces fonctionnalités sont accessibles via l’onglet Audio en mode Tool et via les nœuds Audio des Workflows.

Autres outils

Act-One : transposez vos performances faciales (capturées par webcam) directement sur des personnages dans des vidéos existantes. Un outil de motion capture facial simplifié.

Canvas : espace de travail pour le dessin et la composition, permettant de partir d’un croquis ou de dessiner sur une image existante pour guider la génération.

Upscale 4K : upscaling direct des vidéos Gen-3 Alpha et Gen-4.5 en résolution 4K depuis l’interface.

Keyframes : définissez une première et une dernière frame (et depuis récemment, une frame intermédiaire) pour contrôler précisément le début et la fin de votre vidéo.

Prix et plans Runway

Plan	Prix/mois	Crédits/mois	Gen-4.5	Modèles tiers	Fonctionnalités clés
Free	$0	125 crédits	❌	❌	Gen-4 Text to Image, Gen-4 References, exploration
Standard	~$12/mois	625 crédits	✅	✅	Tous les modèles Gen, Workflows, Audio
Pro	~$28/mois	2 250 crédits	✅	✅	Plus de crédits, upscale 4K, priorité
Unlimited	~$76/mois	Illimité (Gen-4.5)	✅	✅	Générations illimitées sur Gen-4.5, Gen-4 Image avancé
Enterprise	Custom	Custom	✅	✅	Modèles custom, SLA, support dédié

La consommation de crédits varie selon le modèle et la durée. Gen-4.5 consomme 25 crédits par seconde de vidéo. Avec le plan Standard (625 crédits), vous pouvez générer environ 25 secondes de vidéo Gen-4.5 par mois. Le plan Pro (2 250 crédits) permet environ 90 secondes.

Le free tier donne accès à Gen-4 Text to Image et Gen-4 References, mais pas à Gen-4.5 ni aux modèles tiers. C’est suffisant pour explorer l’interface et tester la génération d’images, mais pas pour de la vidéo Gen-4.5.

Attention au ratio crédits/secondes À 25 crédits/seconde, le plan Standard ($12/mois, 625 crédits) ne permet que 25 secondes de vidéo Gen-4.5 par mois. Si votre usage est principalement vidéo, le plan Pro ou Unlimited est recommandé. Le plan Unlimited offre des générations illimitées sur Gen-4.5, ce qui change radicalement l’équation économique pour un usage professionnel intensif.

L’API Runway

Runway propose une API complète pour les développeurs. Gen-4 Image est disponible via API depuis mai 2025, et Gen-4.5 est également accessible pour les cas d’usage de production. L’API supporte le text-to-video, l’image-to-video, la génération d’images et les References.

L’API est utilisée par des studios, des marques, des agences et des plateformes qui intègrent les capacités de Runway dans leurs propres produits. Runway propose aussi des modèles custom pour les entreprises qui veulent entraîner Gen-4.5 sur leurs propres données visuelles.

GWM-1 : les World Models de Runway

Au-delà de la génération vidéo, Runway développe des General World Models (GWM), des modèles d’IA capables de construire une représentation interne de l’environnement pour planifier des actions futures. GWM-1, introduit en décembre 2025, est le premier modèle public dans cette direction.

L’objectif à long terme : passer de la génération de vidéos (contenu passif) à la simulation d’environnements interactifs (jeux, robotique, simulation). Runway a publié des recherches sur l’utilisation des world models pour accélérer l’évaluation de politiques robotiques (février 2026) et travaille avec NVIDIA sur la plateforme Rubin pour entraîner des modèles de plus en plus ambitieux.

Les applications potentielles incluent la simulation de scénarios climatiques, l’optimisation de grilles énergétiques, la génération de mondes de jeux vidéo (Runway Game Worlds, lancé en août 2025) et la robotique. C’est un pari à long terme qui différencie Runway des pure-players de la génération vidéo.

Runway vs les alternatives en 2026

Critère	Runway Gen-4.5	Sora 2 Pro	Veo 3.1 (Google)	Kling 3.0 (Kuaishou)	Seedance (ByteDance)
Benchmark Elo	★★★★★ (1 247, n°1)	★★★★ (top 3)	★★★★ (top 3)	★★★★ (top 5)	★★★☆ (top 5)
Cohérence physique	★★★★★	★★★★	★★★★	★★★★	★★★★
Durée max	~10 sec	25 sec (API Pro)	~8 sec	~10 sec	~10 sec
Audio synchronisé	⚠️ (séparé : TTS + SFX)	✅ (natif Pro)	✅ (natif Veo 3.1)	❌	✅
Image-to-video	✅	✅	✅	✅	✅
References/personnages	✅ (Gen-4 References)	✅ (Cameos)	❌	❌	❌
Workflows visuels	✅ (node-based)	❌	❌	❌	❌
Modèles tiers intégrés	✅ (Kling, Sora 2 Pro, GPT Image…)	❌	❌	❌	❌
Génération d’images	✅ (Gen-4 Image)	❌ (via ChatGPT)	✅ (Imagen)	❌	❌
API	✅	✅	✅ (Gemini API)	✅	✅
Plan d’entrée	~$12/mois (625 crédits)	$20/mois (ChatGPT Plus)	~$20/mois (Google AI Pro)	Free tier + payant	Free tier + payant
World Models	✅ (GWM-1)	❌	❌	❌	❌

Verdict Polydesk Runway Gen-4.5 est le meilleur modèle de génération vidéo IA disponible en mars 2026, point final. Le benchmark Artificial Analysis le confirme (n°1 avec 1 247 Elo), et la qualité physique, la cohérence temporelle et la fidélité au prompt sont effectivement impressionnantes. L’absence d’audio natif en text-to-video est le principal point faible face à Sora 2 Pro et Veo 3.1, mais les fonctionnalités audio séparées (TTS, SFX) et les Workflows permettent de contourner cette limitation. L’intégration de modèles tiers (Kling, Sora 2 Pro, GPT Image 1.5) transforme Runway en plateforme multi-modèles, offrant le meilleur des deux mondes. Pour le prix d’entrée (~$12/mois), c’est un bon investissement pour tester. Le plan Unlimited est recommandé pour un usage professionnel sérieux. Si l’audio synchronisé natif est critique pour vous, testez Sora 2 Pro ou Veo 3.1 en parallèle.

Cas d’usage concrets

Production cinéma et publicité : concept videos, animatics, previsualization. Runway est utilisé par des studios, des agences et des marques pour explorer des concepts visuels avant un tournage réel. Le partenariat IMAX pour le AI Film Festival 2025 montre l’ambition de Runway dans le monde du cinéma.

Marketing et réseaux sociaux : clips produit, spots publicitaires courts, contenus éditoriaux. Le pipeline image→vidéo (Gen-4 Image + Gen-4.5) permet de créer des assets vidéo cohérents à partir de concepts visuels.

Éducation et formation : Parsons School of Design a développé un cours entièrement basé sur Runway, signalant l’adoption académique de l’outil.

Game design : Runway Game Worlds (lancé en août 2025) vise la génération de mondes interactifs pour les jeux vidéo. Les développeurs de jeux utilisent aussi Gen-4.5 pour les cinématiques, les trailers et le concept art animé.

Motion design et VFX : les fonctionnalités Act-One (performance capture faciale), Keyframes (contrôle début/fin de vidéo), Canvas (dessin-to-vidéo) et les Workflows (pipelines automatisés) en font un outil polyvalent pour les motion designers et les artistes VFX.

Écosystème et partenariats

Runway a construit un écosystème de partenariats significatif : NVIDIA (GPUs pour l’entraînement et l’inférence, partenariat sur la plateforme Rubin), IMAX (présentation exclusive du AI Film Festival), AMC Networks (marketing et développement TV), et plusieurs studios de production (Fabula, EDGLRD de Harmony Korine). Le réalisateur Gaspar Noé a rejoint les jurés du AI Film Festival 2025.

Gen-4.5 a été développé entièrement sur GPU NVIDIA (R&D, pré-entraînement, post-entraînement, inférence) et l’inférence en production tourne sur des GPU Hopper et Blackwell.

Runway pour les entreprises

Le plan Enterprise propose des modèles custom (fine-tuning de Gen-4.5 sur vos propres données visuelles), un SLA garanti, un support dédié, et des options de conformité. C’est ciblé sur les studios, les agences de production et les marques qui veulent un modèle adapté à leur identité visuelle.

La valorisation de 3,55 milliards de dollars et les 315 millions de dollars levés en 2026 assurent la pérennité de la plateforme, un point important pour les entreprises qui s’engagent sur un outil de production.

Questions fréquentes sur Runway

Runway est-il gratuit ?

Le plan Free donne accès à Gen-4 Text to Image et Gen-4 References avec 125 crédits, mais pas à Gen-4.5 (le modèle vidéo phare) ni aux modèles tiers. Pour la génération vidéo Gen-4.5, le plan Standard (~$12/mois, 625 crédits) est le minimum. C’est suffisant pour environ 25 secondes de vidéo Gen-4.5 par mois.

Combien de vidéo puis-je générer avec Runway ?

Gen-4.5 consomme 25 crédits par seconde. Le plan Standard (625 crédits) permet environ 25 secondes/mois, le plan Pro (2 250 crédits) environ 90 secondes/mois. Le plan Unlimited offre des générations illimitées sur Gen-4.5. Les modèles tiers intégrés (Kling, Sora 2 Pro) ont leurs propres coûts en crédits.

Runway ou Sora ?

Runway Gen-4.5 est n°1 au benchmark vidéo (1 247 Elo) avec une meilleure cohérence physique que Sora 2. Sora 2 Pro offre des vidéos plus longues (25 sec vs ~10 sec) et l’audio synchronisé natif. Runway offre plus de fonctionnalités créatives (Workflows, References, Canvas, Act-One, modèles tiers intégrés). Choisissez Runway pour la qualité vidéo maximale et les workflows de production, Sora pour les vidéos longues avec audio et l’intégration ChatGPT.

Gen-4.5 génère-t-il du son ?

Pas nativement en text-to-video. Runway propose des fonctionnalités audio séparées (Text to Speech, SFX, Speech to Speech) depuis décembre 2025, accessibles via l’onglet Audio et via les nœuds Workflows. Vous pouvez combiner vidéo et audio dans un Workflow, mais ce n’est pas une génération audio-vidéo synchronisée en une seule passe comme chez Sora 2 Pro ou Veo 3.1.

Les vidéos Runway sont-elles utilisables commercialement ?

Oui, tous les plans payants incluent les droits d’usage commercial sur les vidéos générées. Runway ne revendique pas de droits sur vos créations. Pour les entreprises avec des besoins spécifiques de conformité, le plan Enterprise offre des garanties supplémentaires.