Polydesk-logotype
Polydesk.ai — Header

Runway Image-to-Video : transformer des images en vidéos cinématiques

L’image-to-video de Runway transforme n’importe quelle image fixe (photo, illustration, rendu 3D, sketch) en un clip vidéo animé de 5 à 10 secondes. C’est le mode le plus utilisé et le plus contrôlable de Runway, car l’image d’entrée « ancre » l’apparence visuelle dès la première frame. Disponible sur Gen-4.5, Gen-4, Gen-4 Turbo et Gen-3 Alpha Turbo, avec des coûts allant de 5 à 25 crédits par seconde.

Runway Image-to-Video · Fiche technique
Modèles disponibles
Gen-4.5 · Gen-4 · Gen-4 Turbo Moins cher · Gen-3 Alpha · Gen-3 Alpha Turbo
Image requise
Oui (première frame par défaut)
Durée par clip
5 ou 10 secondes (Gen-4/Gen-3) · 2-10 sec (Gen-4.5)
Keyframes
First + Last (Gen-3 Turbo) · First + Middle + Last (Gen-4 Turbo)
References
✅ Gen-4 / Gen-4.5 (personnages, lieux, styles cohérents)
Coût le plus bas
Gen-4 Turbo : 5 crédits/sec (25 crédits par clip de 5 sec)
Plans requis
Free : Gen-4 Turbo uniquement · Standard+ : tous les modèles

Pourquoi l’image-to-video est le mode préféré des créateurs

L’image-to-video est le mode de génération le plus populaire sur Runway, et pour de bonnes raisons. Quand vous fournissez une image d’entrée, vous contrôlez exactement à quoi ressemble la première frame de votre vidéo : la composition, les couleurs, l’éclairage, les personnages, le décor. Le modèle n’a plus qu’à ajouter le mouvement. C’est plus prévisible, plus cohérent et souvent plus qualitatif que le text-to-video, où le modèle doit inventer le visuel en plus du mouvement.

C’est aussi le mode le plus économique. Gen-4 Turbo, le modèle image-to-video le plus rapide, coûte 5 crédits par seconde, soit 5x moins que Gen-4.5. Et il est disponible dès le plan Free (avec watermark), ce qui en fait le point d’entrée idéal pour découvrir Runway.

L’image-to-video est particulièrement adapté aux cas d’usage suivants : animer des photos produit pour le e-commerce, donner vie à des illustrations ou des concept arts, créer des séquences narratives cohérentes (storytelling multi-shot), produire des product shots cinématiques, et animer des artworks pour les réseaux sociaux.


Quel modèle choisir

Modèle Crédits/sec Qualité Vitesse Keyframes References Meilleur pour
Gen-4 Turbo 5 Très bonne Rapide (30-60 sec) First + Middle + Last Itérations, prototypage, volume
Gen-4 12 Excellente Moyenne (2-3 min) First + Last Rendus finaux, clients
Gen-4.5 25 État de l’art Moyenne First frame Qualité maximale, physique réaliste
Gen-3 Alpha Turbo ~5 Bonne Rapide First + Last Budget serré, mode Explore
Gen-3 Alpha ~10 Très bonne Lente (2-3 min) First ou Last Legacy, text-to-video aussi

La recommandation officielle de Runway : commencez avec Gen-4 Turbo pour itérer rapidement et à moindre coût. Quand votre prompt et votre image d’entrée produisent un résultat satisfaisant en Turbo, passez à Gen-4 ou Gen-4.5 pour le rendu final en qualité maximale.

Gen-4.5 en image-to-video est disponible depuis janvier 2026. C’est le modèle le plus performant (physique réaliste, meilleure adhérence au prompt), mais aussi le plus coûteux. Réservez-le aux plans où chaque frame compte (publicités, présentations client, contenu premium).


Workflow pas à pas

1. Préparer votre image

La qualité de votre image d’entrée détermine directement la qualité du résultat. Quelques règles essentielles :

Résolution et qualité. Utilisez une image nette, sans artefacts de compression, sans bruit excessif. Une image de mauvaise qualité produira une vidéo de mauvaise qualité, quel que soit le modèle. Si votre image est générée par IA (via Midjourney, Stable Diffusion, DALL-E ou Gen-4 Image de Runway), assurez-vous qu’elle est propre et sans artefacts visuels.

Composition. Composez votre image en pensant à la vidéo finale. Si vous voulez un mouvement de caméra vers la gauche, laissez de l’espace à gauche pour que le modèle ait de la « matière » à révéler. Si vous voulez un zoom in, centrez votre sujet.

Types d’images supportés. Runway accepte les photos, les rendus 3D, les illustrations, les sketches, les captures d’écran et même les dessins à la main. Gen-4.5 peut transformer n’importe quelle image statique en vidéo, quel que soit son style.

2. Uploader et configurer

Naviguez vers « Generate Video » dans le dashboard Runway. Sélectionnez votre modèle (Gen-4 Turbo recommandé pour commencer). Uploadez votre image par drag-and-drop. L’image servira de première frame par défaut.

Aspect ratio : l’aspect ratio s’adapte automatiquement à votre image. Si vous le changez, l’image sera recadrée. Formats disponibles : 16:9 (paysage), 9:16 (portrait), 1:1 (carré).

Durée : 5 ou 10 secondes. Les actions simples fonctionnent en 5 sec. Les mouvements complexes ou séquentiels nécessitent 10 sec.

3. Écrire le prompt de mouvement

C’est la différence clé avec le text-to-video. En image-to-video, votre image définit déjà le visuel. Votre prompt ne doit décrire que le mouvement et les changements temporels. Ne répétez pas ce qui est déjà visible dans l’image.

Exemples de bons prompts image-to-video :

The woman slowly turns her head toward the camera and smiles. Soft wind moves her hair.

Camera slowly pushes in while the coffee cup steams. The background softly blurs.

The leaves begin to fall from the tree, caught by a gentle breeze. Camera static.

Exemples de mauvais prompts (répètent l’image) :

A woman with brown hair wearing a blue dress sitting in a garden with flowers... (tout ça est déjà dans l’image, inutile de le réécrire).

Pour des techniques avancées de prompting, consultez notre guide dédié.

4. Utiliser les keyframes (optionnel)

Les keyframes vous permettent de définir plusieurs points de repère dans votre vidéo, pas seulement la première frame.

Gen-4 Turbo supporte three keyframes : première frame, frame du milieu et dernière frame. C’est le contrôle le plus granulaire disponible. Vous pouvez, par exemple, fournir une image de départ (un personnage à gauche) et une image de fin (le même personnage à droite), et le modèle génère le mouvement entre les deux.

Gen-4 supporte first + last frame.

Gen-3 Alpha Turbo supporte first + last frame en modes horizontal et vertical.

Gen-3 Alpha permet de choisir si l’image agit comme première OU dernière frame.

Les keyframes sont particulièrement puissants pour les transitions, les loops vidéo (last frame = first frame), et les animations avec trajectoire précise.

5. Utiliser les References (Gen-4/4.5)

Les References sont la fonctionnalité qui a transformé Runway en outil de storytelling. Vous fournissez des images de référence pour vos personnages, lieux ou styles, et le modèle maintient leur cohérence à travers toutes vos générations. C’est essentiel pour créer des séquences narratives avec un même personnage dans des contextes différents.

Pour utiliser les References : uploadez votre image de référence (ex : un portrait de votre personnage), puis décrivez la nouvelle scène dans le prompt. Le modèle utilisera la référence pour maintenir l’apparence du personnage tout en l’intégrant dans le nouveau contexte. Consultez la documentation officielle de Runway pour le guide complet des References.

6. Générer et itérer

Cliquez sur « Generate ». Les résultats sont disponibles en 30 secondes (Turbo) à 2-3 minutes (Gen-4/4.5). Si le résultat n’est pas satisfaisant, ajustez d’abord le prompt (un seul changement à la fois), puis testez un modèle différent si nécessaire. Utilisez la fonction « Vary » pour explorer des variations sans changer le prompt.

Après génération, vous pouvez envoyer le clip vers Aleph (édition in-video), Act-Two (motion capture), l’upscaler en 4K, le retimer (changer la vitesse sans crédits), l’étendre, ou extraire une frame pour une nouvelle génération.


Cas d’usage concrets

Vidéos produit et e-commerce

L’image-to-video excelle pour animer des photos produit. Uploadez une photo de packshot, ajoutez un prompt de mouvement (« slow rotation on marble surface, studio lighting with soft reflections »), et obtenez un clip publicitaire en quelques secondes. Combinez avec Camera Control pour orbiter autour du produit. Le coût en Gen-4 Turbo : 25 crédits pour un clip de 5 secondes, soit environ 0,48 $ sur le plan Standard.

Storytelling et narration

Créez des séquences narratives cohérentes en combinant image-to-video et References. Générez d’abord votre personnage principal en image (via Gen-4 Image ou un outil externe). Utilisez cette image comme Reference. Puis générez chaque plan de votre histoire avec des prompts de mouvement différents, tout en maintenant l’apparence du personnage constante. Assemblez dans l’éditeur vidéo intégré.

Animation de concept art et illustrations

Runway peut animer n’importe quel style d’image : photoréaliste, illustration, aquarelle, anime, pixel art, rendu 3D. Les artistes et directeurs artistiques utilisent l’image-to-video pour donner vie à des concept arts statiques, créer des présentations animées, ou produire des teasers visuels à partir de leurs illustrations.

Contenu social

Transformez des photos Instagram en courtes vidéos pour Reels ou TikTok. Ajoutez un mouvement subtil (parallaxe, zoom lent, éléments animés) pour capter l’attention dans les feeds. L’aspect ratio 9:16 est nativement supporté sur Gen-4 Turbo.

Prévisualisation et storyboarding

Les agences et les réalisateurs utilisent l’image-to-video pour créer des storyboards animés à partir de croquis ou de rendus préliminaires. Un storyboard statique de 20 plans peut être transformé en un animatique complet en une heure, permettant de tester les mouvements de caméra et le rythme narratif avant un tournage réel.


Coût en crédits et optimisation

Modèle Clip 5 sec Clip 10 sec ~Clips avec 625 crédits ~Clips avec 2 250 crédits
Gen-4 Turbo 25 crédits 50 crédits 12-25 clips 45-90 clips
Gen-4 60 crédits 120 crédits 5-10 clips 18-37 clips
Gen-4.5 125 crédits 250 crédits 2-5 clips 9-18 clips
Gen-3 Alpha Turbo ~25 crédits ~40 crédits 15-25 clips 56-90 clips

Gen-4 Turbo est le champion du rapport qualité-prix pour l’image-to-video. À 25 crédits par clip de 5 secondes, vous pouvez produire ~25 clips par mois sur le plan Standard (625 crédits, 12 $/mois). C’est suffisant pour un workflow régulier si vous êtes discipliné sur vos itérations.

Stratégie d’optimisation : itérez en Gen-4 Turbo à 5 secondes (25 crédits). Quand le prompt fonctionne, passez à 10 secondes (50 crédits). Pour le rendu final client, utilisez Gen-4 (120 crédits/10 sec) ou Gen-4.5 (250 crédits/10 sec) si la qualité maximale est requise. Un clip finalisé vous coûte entre 25 et 300 crédits selon le modèle et le nombre d’itérations.

Pour le détail complet des plans et crédits, consultez notre page Runway prix.


Image-to-Video vs Text-to-Video : rappel

Les deux modes sont complémentaires. L’image-to-video est plus contrôlable (l’image fixe le visuel), plus économique (Gen-4 Turbo à 5 crédits/sec), et disponible sur plus de modèles. Le text-to-video est plus libre (pas de contrainte d’image), gère mieux les séquences complexes, mais coûte plus cher (Gen-4.5 minimum à 25 crédits/sec) et n’est disponible que sur Gen-4.5 et Gen-3 Alpha.

Le workflow professionnel typique combine les deux : Gen-4 Image pour créer la frame de départ parfaite, puis image-to-video (Gen-4 Turbo ou Gen-4) pour l’animer. Cette approche maximise le contrôle et minimise le coût.


Limites de l’image-to-video

Contrainte de composition. L’image d’entrée fixe la composition initiale. Si votre image est mal composée pour le mouvement souhaité (sujet centré quand vous voulez un pan, pas d’espace de respiration pour un mouvement de caméra), le résultat sera sous-optimal. Planifiez votre image en fonction du mouvement vidéo.

Cohérence de style. Le modèle peut légèrement modifier les couleurs, l’éclairage ou les textures par rapport à l’image d’entrée, surtout si le prompt demande un changement d’ambiance. Pour minimiser ce problème, gardez vos prompts simples et focalisés sur le mouvement.

Artefacts sur les mouvements extrêmes. Les mouvements très rapides, les rotations 360° ou les changements de perspective radicaux peuvent créer des artefacts, des distorsions ou des incohérences. Les mouvements lents et modérés produisent les meilleurs résultats.

Durée limitée. 10 secondes maximum par génération. Pour des séquences plus longues, utilisez le chaînage de clips (dernière frame → nouvelle image d’entrée) ou la fonction Extend (Gen-3 Alpha).

Pas d’audio. Comme pour le text-to-video, les clips sont générés sans son. L’audio doit être ajouté en post-production via les outils audio de Runway ou des outils tiers.


Questions fréquentes

Quels formats d’image Runway accepte-t-il pour l’image-to-video ?

Runway accepte les formats d’image courants (JPEG, PNG, WebP). L’image sera automatiquement recadrée si son ratio ne correspond pas au format de sortie sélectionné (16:9, 9:16, 1:1). Pour un résultat optimal, préparez votre image au bon ratio avant de l’uploader. La résolution n’a pas besoin d’être très élevée (le modèle travaille à sa propre résolution interne), mais une image nette et sans artefacts est essentielle.

Peut-on utiliser une image générée par Midjourney ou DALL-E comme entrée ?

Oui, et c’est un workflow très courant. Les images générées par Midjourney, DALL-E, Stable Diffusion, Ideogram ou le propre Gen-4 Image de Runway fonctionnent parfaitement comme entrées image-to-video. Beaucoup de créateurs utilisent un pipeline en deux étapes : génération d’image avec un outil spécialisé (pour un contrôle maximal sur le visuel), puis animation avec Runway (pour le mouvement). Le seul point d’attention : évitez les images avec des artefacts IA visibles (doigts déformés, texte illisible, textures incohérentes), car Runway les propagera dans la vidéo.

Comment maintenir la cohérence d’un personnage entre plusieurs clips ?

Utilisez les References de Gen-4 ou Gen-4.5. Uploadez une image de votre personnage comme référence, puis générez chaque plan avec une image d’entrée différente (décor, angle) et un prompt de mouvement adapté. Le modèle maintient l’apparence, les vêtements et les traits du personnage à travers les scènes. Cette fonctionnalité n’est pas disponible sur Gen-3 Alpha, ce qui est la raison principale pour laquelle les créateurs préfèrent Gen-4 pour le storytelling.

Quel est le modèle le plus économique pour l’image-to-video ?

Gen-4 Turbo à 5 crédits par seconde est le modèle le moins cher pour l’image-to-video. Un clip de 5 secondes coûte 25 crédits, un clip de 10 secondes 50 crédits. Sur le plan Standard (625 crédits/mois à 12 $), vous pouvez produire environ 12 clips de 10 secondes par mois. Gen-3 Alpha Turbo est au même prix (~5 crédits/sec) et est aussi inclus dans les générations illimitées du plan Unlimited (mode Explore). Pour un usage intensif à budget contrôlé, Gen-4 Turbo sur le plan Pro (2 250 crédits) offre le meilleur rapport production/prix.

L’image-to-video fonctionne-t-il avec des dessins ou des sketches ?

Oui. Runway peut animer des photos, des illustrations, des rendus 3D, des peintures, des dessins à la main, des croquis et même des gribouillis. Gen-4.5 est particulièrement performant pour transformer des images stylisées en vidéos dynamiques tout en préservant le style original. Le résultat dépend de la clarté de l’image et du prompt : un sketch propre avec un prompt de mouvement simple produira un meilleur résultat qu’un gribouillis ambigu avec un prompt complexe.

Polydesk.ai — Footer