Polydesk-logotype
Polydesk.ai — Header

Gen-3 Alpha (Runway) : Définition, Évolution vers Gen-4.5 et Avis Complet

Gen-3 Alpha est le modèle de génération vidéo IA de Runway qui a posé les bases de la gamme actuelle. Sorti en mi-2024, il a depuis été complété par Gen-4 (cohérence de personnages) et Gen-4.5 (le modèle le plus avancé de Runway, disponible début 2026), tout en restant accessible sur la plateforme pour les usages nécessitant son rapport coût/qualité.

Runway Gen-3 à Gen-4.5 en bref
Éditeur
Runway AI, Inc. (New York, valorisée ≈ 5,3 Mds $ en fév. 2026)
Type
Générateur vidéo IA (text-to-video, image-to-video, video-to-video)
Modèles
Gen-3 Alpha, Gen-3 Alpha Turbo, Gen-4, Gen-4 Turbo, Gen-4.5 Nouveau
Résolution
Jusqu’à 4K (upscale), 24 FPS
Durée max
10 s par génération, ≈ 40 s par extension (Gen-3 Alpha)
Audio
Non natif (lip-sync et TTS disponibles séparément)
Prix
Free (125 crédits) à Unlimited (76 $/mois annuel)
Modèles tiers intégrés
Kling 3.0, Sora 2 Pro, WAN2.2 et autres (mars 2026)
URL
runwayml.com
Verdict
La plateforme la plus complète en outils d’édition et de direction vidéo IA. Cohérence de personnages excellent avec Gen-4, mais pas d’audio natif et crédits limités.

Qu’est-ce que Gen-3 Alpha ?

Gen-3 Alpha est un modèle de génération vidéo IA multimodal développé par Runway, une entreprise new-yorkaise fondée en 2018 qui a levé plus de 630 millions de dollars. Le modèle, lancé en mi-2024, a été le premier de la série « Alpha » conçu sur une nouvelle infrastructure d’entraînement multimodal à grande échelle. Il supporte trois modes de création : text-to-video (génération à partir d’un prompt texte), image-to-video (animation d’une image fixe) et video-to-video (transformation stylistique d’une vidéo existante).

Gen-3 Alpha a marqué un tournant pour Runway. TIME l’a inclus dans ses « 200 Best Inventions » de 2024, saluant sa capacité à créer des clips de 10 secondes avec une fidélité et une cohérence temporelle nettement supérieures à Gen-2. Le modèle a posé les fondations sur lesquelles Runway a ensuite construit Gen-4 et Gen-4.5.

Il est important de comprendre que Gen-3 Alpha reste disponible sur la plateforme Runway, même si Gen-4 et Gen-4.5 l’ont largement dépassé en qualité. Gen-3 Alpha (10 crédits/seconde) et surtout Gen-3 Alpha Turbo (5 crédits/seconde) restent pertinents pour les utilisateurs qui veulent maximiser le volume de vidéos générées avec un budget crédits limité.

Évolution : de Gen-3 Alpha à Gen-4.5

Modèle Date Coût (crédits/s) Apports clés
Gen-3 Alpha Mi-2024 10 cr/s Text-to-video, image-to-video, V2V, 10 s, extension jusqu’à 40 s, 4K upscale
Gen-3 Alpha Turbo Mi-2024 5 cr/s 7x plus rapide, moitié prix, image-to-video requis, qualité comparable
Gen-4 2025 12 cr/s Cohérence de personnages/lieux/objets entre plans, image-to-video requis
Gen-4 Turbo 2025 5 cr/s Version rapide/économique de Gen-4, disponible en Free
Gen-4.5 Nouveau Début 2026 25 cr/s Text-to-video + image-to-video, meilleur réalisme, cohérence de style cinématique

L’évolution entre les modèles est significative. Gen-3 Alpha a posé les bases avec une qualité correcte pour du contenu stylisé et semi-réaliste. Gen-4 a apporté la cohérence de personnages : un personnage, un lieu ou un objet maintient son apparence et ses attributs d’un plan à l’autre, ce qui était le principal point faible de Gen-3. Gen-4.5, annoncé comme « le meilleur modèle vidéo du monde » par Runway, pousse la qualité de génération encore plus loin avec un meilleur réalisme, une meilleure adhérence au prompt et la possibilité de générer depuis du texte seul (sans image de départ obligatoire).

Un changement majeur en mars 2026 : Runway a intégré des modèles tiers directement dans sa plateforme. Vous pouvez désormais accéder à Kling 3.0, Kling 2.6 Pro, Kling 2.5 Turbo Pro, WAN2.2 Animate, GPT-Image-1.5, Sora 2 Pro et d’autres modèles directement depuis l’interface Runway. C’est un virage stratégique qui transforme Runway d’un éditeur de modèle unique en une plateforme multi-modèle.

Fonctionnalités principales de la plateforme Runway

Génération vidéo (Gen-3 à Gen-4.5)

Text-to-Video. Disponible sur Gen-3 Alpha et Gen-4.5 (Gen-4 standard nécessite une image d’entrée). Vous décrivez une scène et le modèle génère un clip de 2 à 10 secondes. Gen-4.5 supporte des durées de 2 à 10 secondes avec un coût de 25 crédits/seconde. La qualité de sortie est parmi les meilleures du marché pour du contenu cinématique et narratif.

Image-to-Video. Disponible sur tous les modèles. Uploadez une image fixe et animez-la avec des mouvements guidés par un prompt texte. Gen-4 excelle particulièrement dans ce mode grâce à sa compréhension avancée de la cohérence visuelle.

Video-to-Video. Transformez une vidéo existante en changeant son style visuel tout en conservant le mouvement et la composition. Disponible sur Gen-3 Alpha et Gen-3 Alpha Turbo. Utilisez une image de référence unique pour appliquer un style cohérent à toute la vidéo.

Cohérence de personnages et de scènes (Gen-4+)

C’est l’avantage compétitif principal de Runway face aux concurrents. Avec Gen-4 et Gen-4.5, vous pouvez créer des personnages, des lieux et des objets persistants qui maintiennent leur apparence et leurs attributs visuels d’un plan à l’autre. En pratique, un personnage avec une tenue spécifique, des traits de visage distincts et un style de cheveux précis restera identique dans toutes les générations qui le référencent. Cette fonctionnalité est disponible sur les plans payants et constitue un atout décisif pour le storytelling vidéo multi-scènes.

Aleph (édition dirigée)

Aleph est l’environnement d’édition vidéo IA de Runway. Au lieu de régénérer un clip entier, vous décrivez les modifications souhaitées en langage naturel : ajouter un objet, supprimer un élément, changer l’éclairage, modifier une couleur, ajuster un angle de caméra. Le modèle applique les changements ciblés tout en préservant le reste du clip. C’est un outil de post-production IA qui réduit considérablement le nombre de régénérations nécessaires pour obtenir le résultat souhaité.

Act-Two (capture de performance)

Act-Two transpose vos expressions faciales et mouvements corporels sur des personnages IA générés. Vous enregistrez une vidéo de vous-même (webcam ou smartphone), et le modèle transpose votre performance sur un personnage de votre choix dans un environnement IA. C’est un outil de « performance capture » simplifié qui ne nécessite ni combinaison de mocap ni studio dédié. Il fonctionne avec Gen-3 Alpha Turbo pour des générations rapides et abordables.

Workflows et Apps

Les Workflows sont des pipelines automatisés qui enchaînent plusieurs étapes de génération, édition, transformation stylistique et export en un processus unique. Vous pouvez par exemple créer un workflow qui prend des images produit en entrée, génère des vidéos de rotation 360°, applique un étalonnage de couleur, ajoute du texte et exporte dans plusieurs formats pour différentes plateformes. Les Apps sont des workflows pré-construits et partageables avec votre workspace.

GWM-1 (General World Model)

Annoncé en mars 2026, GWM-1 est le « General World Model » de Runway, construit sur Gen-4.5. C’est un système de simulation de réalité en temps réel, interactif et contrôlable. Il est conçu pour trois domaines : les mondes virtuels (exploration infinie d’environnements cohérents), les avatars (avec mouvement naturel et audio natif) et la robotique (SDK pour tester des politiques robotiques dans un environnement simulé). GWM-1 marque l’ambition de Runway de dépasser la simple génération vidéo pour devenir une plateforme de simulation de mondes.

Lip Sync et Text-to-Speech

Runway propose des outils de lip-sync et de text-to-speech (TTS) via l’onglet Audio, avec la possibilité de créer des voix personnalisées (Custom Voices). Cependant, il ne s’agit pas d’audio natif intégré à la génération vidéo : Gen-3, Gen-4 et Gen-4.5 produisent des vidéos muettes. L’audio doit être ajouté en post-production, soit via les outils intégrés de Runway, soit via des outils externes. C’est une lacune significative face à Kling AI et Veo 3.1 qui génèrent l’audio de façon synchronisée avec la vidéo.

Tarifs

Plan Prix/mois (annuel) Prix/mois (mensuel) Crédits/mois Points clés
Free 0 $ 0 $ 125 (unique) Gen-4 Turbo I2V + Gen-4 text-to-image, 720p, filigrane
Standard ≈ 12 $ ≈ 15 $ 625 1080p, Gen-4.5, sans filigrane, 5 utilisateurs max
Pro ≈ 28 $ ≈ 35 $ 2 250 4K, Custom Voices, file prioritaire, 10 utilisateurs max
Unlimited ≈ 76 $ ≈ 95 $ 2 250 + Explore Mode Générations illimitées en mode relaxé (Explore), Frames, 10 utilisateurs
Enterprise Custom Custom Custom SSO, crédits custom, sécurité avancée, analytics, support prioritaire

La consommation de crédits varie fortement selon le modèle. Voici les coûts par seconde de vidéo générée :

Modèle Crédits/seconde 10 s de vidéo Équivalent sur plan Standard (625 cr)
Gen-3 Alpha Turbo 5 cr/s 50 cr ≈ 125 s (2 min)
Gen-3 Alpha 10 cr/s 100 cr ≈ 62 s
Gen-4 Turbo 5 cr/s 50 cr ≈ 125 s (2 min)
Gen-4 12 cr/s 120 cr ≈ 52 s
Gen-4.5 25 cr/s 250 cr ≈ 25 s

Le calcul est clair : sur le plan Standard (625 crédits/mois, 12 $/mois), vous obtenez environ 25 secondes de vidéo Gen-4.5, 52 secondes de Gen-4, ou 125 secondes de Gen-4 Turbo. L’upscale 4K ajoute 2 crédits/seconde. Les crédits non utilisés ne se reportent pas. Pour une analyse approfondie, consultez la page Runway prix.

Le coût réel est 3 à 5 fois le coût théorique. La génération vidéo IA est itérative : il faut souvent 3 à 5 essais pour obtenir un clip exploitable (mains déformées, physique incohérente, prompt mal interprété). Sur le plan Standard, si 5 essais sont nécessaires pour un clip Gen-4.5 de 10 secondes (250 cr × 5 = 1 250 cr), vous dépassez déjà votre budget mensuel pour un seul clip final.

Cas d’usage concrets

Storytelling multi-scènes. La cohérence de personnages de Gen-4/Gen-4.5 fait de Runway le meilleur choix pour les créateurs qui construisent des narratifs avec des personnages récurrents. Un même personnage avec la même tenue et les mêmes traits apparaît de façon cohérente dans chaque plan généré.

Storyboarding et prévisualisation. Les réalisateurs et studios utilisent Gen-4 Turbo (rapide et économique) pour créer des storyboards animés, puis masterisent les plans finaux en Gen-4.5 pour la qualité broadcast. Les Workflows automatisent ce pipeline.

Marketing et publicité. Les agences utilisent Runway pour produire des concepts publicitaires, des B-rolls cinématiques et des variations de contenu pour les réseaux sociaux. Les Apps et Workflows permettent de standardiser la production à grande échelle.

Post-production et VFX. Aleph (édition dirigée), le video-to-video de Gen-3 et le Motion Brush permettent de retoucher des séquences filmées : suppression d’objets, changement de style, ajustement d’éclairage, tout via des instructions en langage naturel.

Contenu éducatif et formation. Act-Two permet de créer des présentateurs IA qui reproduisent les expressions et mouvements d’un formateur, combiné avec les voix personnalisées (Custom Voices) pour un résultat professionnel.

Limites et points faibles

Pas d’audio natif. C’est la lacune la plus citée de Runway. Gen-3, Gen-4 et Gen-4.5 produisent des vidéos muettes. Le lip-sync et le TTS sont disponibles comme outils séparés, mais l’absence de génération audio synchronisée nativement est un désavantage majeur face à Kling AI (audio multilingue natif) et Veo 3.1 (dialogues, musique, effets sonores natifs).

Crédits limités et coûteux. Gen-4.5 consomme 25 crédits/seconde. Sur le plan Standard (625 cr/mois), c’est 25 secondes de vidéo Gen-4.5 par mois, et beaucoup moins si vous comptez les itérations ratées. Le passage au plan Pro (2 250 cr, 28 $/mois) ou Unlimited (76 $/mois) est souvent nécessaire pour un usage régulier.

Durée de clips limitée. 10 secondes par génération (Gen-3 et Gen-4), extensible à environ 40 secondes (Gen-3 Alpha). C’est inférieur à Kling 3.0 (15 s natif, 3 min en extension) et Veo 3.1 (8 s + Scene Extension > 60 s).

Cohérence physique imparfaite. Bien que Gen-4.5 représente un progrès net, des artefacts persistent : mains déformées, physique incohérente sur les mouvements complexes, visages qui dérivent sur les clips longs. Runway est noté 8,5/10 en photoréalisme contre 9,5/10 pour Sora 2 et Veo 3.1 selon les évaluations indépendantes.

Support client limité. Les plans Standard et Pro n’ont accès qu’au support chatbot, sans assistance téléphonique et avec des temps de réponse par email souvent longs (plusieurs jours). Le support dédié est réservé aux Enterprise. C’est un point faible notable face aux concurrents avec support premium.

Runway vs la concurrence

Critère Runway (Gen-4.5) Kling 3.0 Veo 3.1 Sora 2
Cohérence de personnages Excellente Très bonne (Elements) Bonne (Ingredients) Bonne
Audio natif Non Oui (multilingue) Oui (excellent) Non
Multi-Shot natif Non Oui (AI Director) Non Non
Édition dirigée (Aleph) Oui Non Non Non
Workflows automatisés Oui Non Non Non
Modèles tiers intégrés Oui (Kling, Sora, WAN…) Non Non Non
Durée max ≈ 40 s (extension) 3 min 60 s+ ≈ 35 s
Prix entrée 12 $/mois 6,99 $/mois 19,99 $/mois 20 $/mois (ChatGPT Plus)

Verdict comparatif. Runway est la plateforme la plus complète en termes d’outils d’édition et de direction (Aleph, Workflows, Act-Two, Motion Brush). Sa cohérence de personnages avec Gen-4/Gen-4.5 reste la meilleure du marché. L’intégration de modèles tiers (Kling, Sora) en mars 2026 en fait une « plateforme de plateformes ». En revanche, l’absence d’audio natif est un handicap sérieux face à Kling et Veo, et les crédits se consomment vite sur les modèles avancés. Pour un comparatif complet, consultez les pages Runway vs Sora et le comparatif générateurs vidéo IA.

Verdict Polydesk

Runway est la plateforme vidéo IA la plus mature et la plus riche en fonctionnalités. Gen-3 Alpha a posé les fondations, Gen-4 a ajouté la cohérence de personnages, et Gen-4.5 pousse la qualité de génération au plus haut niveau. Les outils d’édition (Aleph, Workflows, Act-Two) et l’intégration de modèles tiers en font une suite de production complète, pas un simple générateur de clips.

Son meilleur atout : la cohérence de personnages et la richesse des outils créatifs. Si vous construisez des narratifs avec des personnages récurrents et que vous avez besoin de contrôle fin sur l’édition, Runway est le meilleur choix. Son point faible principal : l’absence d’audio natif et le coût en crédits qui grimpe vite avec Gen-4.5 (25 cr/s).

Choisissez Runway si vous êtes un créatif, un réalisateur ou une agence qui valorise le contrôle, la cohérence narrative et les outils d’édition avancés. Préférez Kling 3.0 si votre priorité est la durée de vidéo, l’audio natif ou le rapport volume/prix. Préférez Veo 3.1 si vous êtes dans l’écosystème Google et que l’audio cinématique natif est essentiel.


FAQ

Gen-3 Alpha est-il encore disponible ?

Oui. Gen-3 Alpha et Gen-3 Alpha Turbo restent accessibles sur la plateforme Runway. Ils sont souvent utilisés pour le video-to-video (transformation stylistique), le mode Turbo économique (5 crédits/seconde) et les extensions de clips (jusqu’à 40 secondes). Pour la génération text-to-video de haute qualité, Gen-4.5 est désormais recommandé.

Quelle est la différence entre Gen-3, Gen-4 et Gen-4.5 ?

Gen-3 Alpha offre text-to-video, image-to-video et video-to-video avec une qualité correcte pour du contenu stylisé. Gen-4 apporte la cohérence de personnages/lieux/objets entre plans (image-to-video requis). Gen-4.5 (début 2026) est le modèle le plus avancé : meilleur réalisme, text-to-video + image-to-video, cohérence cinématique supérieure. Le coût augmente proportionnellement : 5 cr/s (Turbo), 10-12 cr/s (Alpha/Gen-4), 25 cr/s (Gen-4.5).

Runway génère-t-il de l’audio ?

Non nativement. Les modèles Gen-3, Gen-4 et Gen-4.5 produisent des vidéos muettes. Runway propose des outils séparés de lip-sync, text-to-speech (TTS) et Custom Voices via l’onglet Audio, mais l’audio n’est pas généré de façon synchronisée avec la vidéo. C’est un désavantage face à Kling AI et Veo 3.1.

Peut-on utiliser Kling ou Sora directement dans Runway ?

Oui, depuis mars 2026. Runway a intégré des modèles tiers dans sa plateforme, incluant Kling 3.0, Kling 2.6 Pro, Kling 2.5 Turbo Pro, WAN2.2 Animate, GPT-Image-1.5 et Sora 2 Pro. Vous pouvez accéder à ces modèles directement depuis l’interface Runway sans quitter la plateforme.

Combien coûte une vidéo de 10 secondes sur Runway ?

Cela dépend du modèle : 50 crédits (Gen-3 Alpha Turbo ou Gen-4 Turbo), 100 crédits (Gen-3 Alpha), 120 crédits (Gen-4) ou 250 crédits (Gen-4.5). L’upscale 4K ajoute 20 crédits supplémentaires. Sur le plan Standard (625 crédits/mois, 12 $/mois), cela représente 2 à 12 clips de 10 secondes selon le modèle, sans compter les itérations ratées. Consultez la page Runway prix pour un calculateur détaillé.

Polydesk.ai — Footer