Midjourney V7 : le guide complet des nouveautés

Midjourney V7 est le modèle de génération d’images par défaut de Midjourney, sorti le 3 avril 2025 et devenu le standard le 17 juin 2025. Il introduit le Draft Mode (10x plus rapide), l’Omni Reference (cohérence personnage/objet), la personnalisation par profil, le mode conversationnel vocal, et la génération vidéo image-to-video.

Sortie: 3 avril 2025 (alpha) · Défaut depuis le 17 juin 2025
Type: Modèle de diffusion propriétaire
Nouveautés clés: Draft Mode · Omni Reference · Personnalisation · Mode vocal · Vidéo (V1)
Successeur: V8 Alpha Mars 2026 sur alpha.midjourney.com
Accès: midjourney.com · Discord · Tout plan payant (à partir de 10 $/mois)
Documentation: docs.midjourney.com

Le contexte de la V7

La V7 est arrivée après un an sans nouveau modèle majeur. La V6.1 (juillet 2024) avait apporté des améliorations incrémentales en cohérence et vitesse par rapport à la V6 (décembre 2023), mais la communauté attendait un saut générationnel. Le lancement a coïncidé avec la sortie du générateur d’images natif de ChatGPT (le fameux « moment Ghibli »), ce qui a intensifié la compétition dans l’écosystème de la génération d’images IA.

L’accueil a été mitigé au départ. Certains utilisateurs ont jugé que les améliorations visuelles pures étaient incrémentales (un créateur influent a qualifié la V7 de « V6.2 »), tandis que d’autres ont salué les nouvelles fonctionnalités (Draft Mode, Omni Reference, personnalisation) comme transformatrices pour les workflows créatifs. Avec le recul et les mises à jour successives, la V7 s’est imposée comme un progrès significatif, surtout dans le suivi des prompts complexes, la cohérence anatomique, et les outils de contrôle créatif.

Les nouveautés majeures de la V7

Qualité d’image et compréhension des prompts

La V7 produit des images avec des textures plus riches, un éclairage plus réaliste, et une meilleure cohérence globale. Les progrès les plus visibles concernent le rendu des mains, des corps et des objets, trois points faibles historiques des générateurs d’images IA. Les détails fins comme les plis de peau, les reflets sur les surfaces, et les micro-textures de matériaux sont nettement plus authentiques.

Le suivi des prompts a fait un bond important. La V7 interprète les compositions multi-éléments avec plus de fidélité : si vous décrivez une scène avec un personnage spécifique, un environnement précis et des conditions d’éclairage détaillées, le modèle respecte davantage chaque instruction au lieu de n’en retenir que les éléments principaux, comme le faisait la V6.

Draft Mode : la vitesse au service de l’itération

Le Draft Mode est l’ajout le plus immédiatement utile pour le workflow quotidien. Il génère des images environ 10 fois plus vite que le mode standard, à la moitié du coût GPU.

Concrètement, une génération standard prend 30 à 60 secondes. En Draft Mode, vous obtenez un résultat en quelques secondes. La qualité est inférieure (moins de détails, textures plus lisses), mais c’est idéal pour les phases d’exploration et d’idéation rapide.

Le workflow recommandé est simple : explorez vos idées en Draft Mode pour tester des directions, des compositions et des styles sans consommer beaucoup de GPU, puis passez en mode standard (ou utilisez le bouton « Enhance ») pour régénérer en qualité complète les images qui vous plaisent.

Activation : cliquez sur le bouton Draft Mode (icône éclair) à côté de la barre Imagine sur le web, ou ajoutez --draft à la fin de votre prompt.

Astuce : Enhance sur les drafts Le bouton Enhance fonctionne directement sur les images Draft depuis une mise à jour d’avril 2025. Il régénère l’image exacte en qualité supérieure, pas une nouvelle interprétation du prompt. C’est beaucoup plus fiable que le comportement initial où Enhance produisait une image différente.

Omni Reference : cohérence personnage et objet

L’Omni Reference (--oref) remplace et étend le Character Reference (--cref) de la V6. Là où --cref se limitait aux visages, l’Omni Reference est universel : il fonctionne avec des personnes, des animaux, des véhicules, des logos, des produits, ou n’importe quel objet que vous souhaitez reproduire fidèlement dans différentes scènes.

Pour l’utiliser sur le web : cliquez sur l’icône image dans la barre Imagine, chargez votre image de référence, et placez-la dans la zone « Omni Reference ». Le paramètre --ow (Omni Weight, de 0 à 1000, défaut 100) contrôle la fidélité de la reproduction.

Omni Weight	Comportement	Usage type
`--ow 25-50`	Fidélité faible, transfert de style	Photo vers anime, changement de médium
`--ow 100` (défaut)	Équilibre ressemblance/liberté	Usage général, scènes variées
`--ow 200-400`	Forte ressemblance	Portraits, produits, cohérence de marque
`--ow 400-1000`	Fidélité maximale	Logos, détails précis, reproduction exacte

Quelques limitations importantes à connaître : l’Omni Reference ne supporte qu’une seule image de référence par prompt. Il n’est pas compatible avec l’inpainting, l’outpainting (qui utilisent encore la V6.1), le Fast Mode, le Draft Mode, le mode conversationnel, ni le paramètre --q 4. Chaque génération avec Omni Reference consomme 2x le temps GPU standard.

Astuce pour les images de référence Évitez les PNG avec fond transparent : Midjourney lit le canal alpha, ce qui peut fausser les résultats. Supprimez le fond de votre sujet avec un outil dédié, puis exportez en JPEG avec un fond uni. Cela isole mieux l’objet et donne de meilleurs résultats.

Personnalisation : le modèle s’adapte à votre goût

La V7 introduit un système de personnalisation activé par défaut. Avant même de pouvoir utiliser le modèle, vous devez noter environ 200 images pour construire un profil esthétique. Ce processus prend quelques minutes et influence la façon dont Midjourney interprète vos prompts.

Selon les données de Midjourney, 85 % des utilisateurs préfèrent les résultats personnalisés aux résultats non personnalisés. L’interface a été remaniée en février 2026 pour remplacer les comparaisons 1 contre 1 par un système de défilement et de clic plus rapide et agréable.

Vous pouvez créer plusieurs profils de personnalisation (un par projet, par style, par client) et basculer entre eux. Le paramètre --p active la personnalisation dans vos prompts, tandis que --profile [id] sélectionne un profil spécifique.

Les anciens profils de personnalisation V6 restent utilisables en V7, mais les moodboards créés sous V6 ont dû être recréés. Les profils V7 sont aussi compatibles avec la V8 Alpha.

Mode conversationnel et entrée vocale

La V7 permet d’interagir en langage naturel avec Midjourney. Au lieu de formuler des prompts techniques, vous pouvez simplement décrire ce que vous voulez dans un style conversationnel, et une IA reformule votre description en prompt optimisé.

Plus notable encore : l’entrée vocale. Si votre appareil dispose d’un micro, vous pouvez parler directement à l’interface web de Midjourney. Le système écoute, transcrit, interprète et génère les images correspondantes. C’est une façon plus intuitive de travailler, surtout en phase d’exploration créative.

Ce mode est accessible sur le site web principal (pas sur Discord) et fonctionne dans plusieurs langues.

Génération vidéo : image-to-video (V1 Video Model)

Lancé le 18 juin 2025, le modèle vidéo V1 de Midjourney transforme n’importe quelle image en vidéo de 5 secondes, extensible par segments de 4 secondes jusqu’à un maximum de 21 secondes. Vous pouvez animer des images générées par Midjourney ou des images uploadées depuis l’extérieur.

Quatre modes d’animation sont disponibles :

Auto Low Motion. Midjourney génère automatiquement le mouvement. Mouvements subtils, caméra relativement statique. Idéal pour les scènes ambiantes.

Auto High Motion. Même principe automatique, mais avec des mouvements de caméra et de sujets plus dynamiques.

Manual Low Motion. Vous écrivez un prompt décrivant le mouvement souhaité, avec des animations subtiles.

Manual High Motion. Vous décrivez le mouvement, avec des animations plus dynamiques.

Les deux paramètres de contrôle principaux sont --motion low / --motion high et --raw (qui réduit l’intervention stylistique de Midjourney sur le mouvement).

Coût et limitations de la vidéo La génération vidéo coûte environ 8x plus en GPU qu’une image. La résolution de sortie est de 480p, adaptée aux réseaux sociaux mais insuffisante pour du contenu haute définition. Pas de text-to-video direct : vous devez d’abord créer une image, puis l’animer. Le mode Relax pour les vidéos n’est disponible qu’à partir du plan Pro (60 $/mois).

Pour les extensions de vidéo, sélectionnez votre clip, choisissez « Extend Video » en mode Auto ou Manual, et ajoutez éventuellement un prompt décrivant la suite de l’action. La première partie reste identique, les secondes supplémentaires continuent la scène.

Paramètres spécifiques à la V7

La V7 conserve les paramètres standards (--ar, --s, --c, --no, --raw) et en ajoute ou modifie plusieurs :

Paramètre	Syntaxe	Description	Valeurs
Draft Mode	`--draft`	Génération 10x plus rapide, coût GPU divisé par 2, qualité réduite	On/Off
Omni Reference	`--oref [url]`	Référence universelle (personnage, objet, produit)	1 image max
Omni Weight	`--ow`	Poids de la référence Omni	0-1000 (défaut 100)
Personnalisation	`--p`	Active le profil de personnalisation	On/Off
Profile	`--profile [id]`	Sélectionne un profil spécifique	ID du profil
Experimental	`--exp [n]`	Curseur d’atmosphère expérimentale, modifie l’ambiance	0-100
Style Reference Version	`--sv`	Version de l’algorithme de Style Reference	4 (ancien) ou 6 (défaut V7)
Quality	`--q 4`	Qualité supérieure, cohérence accrue	1 (défaut), 4
Tile	`--tile`	Génère un motif répétable sans coutures visibles	On/Off

Le paramètre –exp (Experimental)

Le paramètre --exp est un curseur d’atmosphère expérimentale propre à la V7, similaire à --stylize mais agissant sur la dynamique et l’ambiance de l’image. À des valeurs basses (5-10), il apporte des modifications subtiles. À des valeurs élevées (50-100), il peut transformer radicalement l’angle, la palette, et l’ambiance générale.

Ce paramètre entre en compétition avec --s (stylize) et --p (personnalisation) pour influencer le résultat. Si vous l’utilisez, ajustez les autres paramètres en conséquence.

Style Reference en V7

Le système de Style Reference a été refondu pour la V7. Six versions différentes de l’algorithme sont disponibles via le paramètre --sv (de 1 à 6, défaut 6). Chaque version interprète les références de style différemment. Les codes de style anciens (V6) peuvent ne pas produire les mêmes résultats en V7 ; utilisez --sv 4 pour retrouver le comportement ancien.

Le paramètre --sw (style weight, 0-1000, défaut 100) contrôle l’intensité de l’influence du style. En V7, le poids a plus d’impact avec les codes de style qu’avec les images de référence.

Les codes de style aléatoires (--sref random) ne sont compatibles qu’avec --sv 4 et --sv 6.

V7 vs V6.1 : les différences concrètes

Critère	V6.1	V7
Qualité image	Bonne cohérence, bon rendu général	Textures plus riches, meilleure anatomie (mains, corps)
Suivi du prompt	Correct, difficultés avec les prompts multi-éléments	Nettement amélioré, meilleure précision
Draft Mode	❌	✅ 10x plus rapide, 0,5x coût
Omni Reference	Character Reference (`--cref`) uniquement	Universel : personnages, objets, produits (`--oref`)
Personnalisation	Basique, optionnelle	Profils avancés, activée par défaut, 85 % de préférence
Mode vocal	❌	✅ Entrée audio sur le web
Vidéo	❌	✅ Image-to-video (5 sec, extensible à 21 sec)
Experimental (`--exp`)	❌	✅ Curseur d’atmosphère 0-100
Style Reference	4 versions d’algorithme	6 versions d’algorithme (`--sv` 1-6)
Tile	✅	✅ Amélioré, motifs sans coutures
Inpainting natif	✅ Via éditeur V6	Partiellement (utilise encore V6.1 en backend)

V7 vs V8 Alpha : faut-il migrer ?

La V8 Alpha, lancée le 17 mars 2026 sur alpha.midjourney.com, n’est pas un remplacement de la V7 mais un preview d’une nouvelle architecture. Voici la comparaison objective :

Vitesse. La V8 est environ 5x plus rapide que la V7 en génération standard. C’est le progrès le plus immédiatement perceptible.

Résolution. La V8 introduit le mode --hd pour des images natives en 2K (2048×2048) sans upscaling. La V7 génère en résolution standard avec upscaling séparé.

Rendu de texte. La V8 rend le texte nettement mieux quand il est placé entre guillemets dans le prompt. La V7 reste médiocre sur ce point.

Suivi des prompts. La V8 interprète les prompts détaillés avec plus de précision. Les compositions complexes sont mieux respectées.

Fonctionnalités complètes. La V7 dispose de toutes les fonctionnalités : inpainting, outpainting, Pan, Zoom Out, Enhance, vidéo, Draft Mode, Omni Reference. La V8 Alpha n’a pas encore l’inpainting ni l’outpainting, et les features premium (sref, moodboards, HD, --q 4) coûtent 4x plus en GPU.

Esthétique par défaut. La V7 a une esthétique stable et calibrée. La V8 Alpha a une esthétique « en construction » que Midjourney recommande de compenser avec --raw, la personnalisation poussée à --s 1000, et des prompts plus longs.

Verdict V7 vs V8 Alpha Restez sur la V7 pour vos projets de production : elle est stable, complète, et son écosystème d’outils est mature. Utilisez la V8 Alpha pour expérimenter, tester la vitesse 5x, et évaluer la qualité d’image native 2K. Quand la V8 deviendra stable (probablement via une V8.1), la migration sera naturelle. Les profils de personnalisation, moodboards et srefs créés en V7 sont compatibles avec la V8.

Workflows recommandés avec la V7

Exploration rapide

1. Activez le Draft Mode et le Relax Mode (si votre plan le permet).

2. Montez le --chaos à 30-50 pour obtenir des variations diversifiées.

3. Testez plusieurs prompts courts avec des styles différents.

4. Quand une direction vous plaît, cliquez sur Enhance pour régénérer en qualité complète.

Cohérence de marque / personnage

1. Créez ou chargez votre image de référence (personnage, produit, logo).

2. Placez-la en Omni Reference avec un poids adapté (--ow 200-400 pour les visages, --ow 400+ pour les logos).

3. Combinez avec un Style Reference (--sref) pour maintenir la cohérence esthétique.

4. Renforcez dans le prompt textuel les caractéristiques que vous voulez préserver (« woman with short gray hair and red suspenders »).

Production vidéo

1. Générez votre image en V7 standard avec le ratio souhaité (16:9 pour les vidéos paysage).

2. Cliquez sur « Animate » et choisissez Auto (pour laisser Midjourney décider) ou Manual (pour décrire le mouvement).

3. Commencez en Low Motion pour des résultats plus fiables, puis testez High Motion pour plus de dynamisme.

4. Étendez la vidéo par segments de 4 secondes si besoin, en décrivant la suite de l’action en mode Manual.

5. Exportez et montez dans un éditeur externe (Premiere Pro, DaVinci Resolve) pour les projets multi-clips.

Limitations connues de la V7

Inpainting et outpainting partiellement en V6.1. Le système d’édition in-image de Midjourney utilise encore le modèle V6.1 en backend pour certaines opérations. Les résultats d’inpainting peuvent donc différer stylistiquement des images V7.

Omni Reference limité à une image. Vous ne pouvez utiliser qu’une seule image de référence par prompt. Pour des scènes avec plusieurs personnages, combinez-les en une seule image JPEG avant de l’utiliser comme référence.

Pas de text-to-video direct. La génération vidéo nécessite une image de départ. Vous ne pouvez pas créer une vidéo à partir d’un prompt textuel seul, contrairement à Runway Gen-3 ou Sora.

Rendu de texte médiocre. La V7 peine à générer du texte lisible dans les images. C’est l’un des points faibles les plus visibles par rapport à des concurrents comme DALL-E 3 ou Ideogram. La V8 Alpha améliore significativement ce point.

Résolution vidéo limitée à 480p. Suffisant pour les réseaux sociaux, mais insuffisant pour des usages professionnels en haute définition.

Coût GPU élevé pour la vidéo. 8x le coût d’une image standard. Les utilisateurs sur plan Basic ou Standard verront leurs heures GPU fondre rapidement.

Niji 7 : le modèle anime

Niji 7, lancé le 9 janvier 2026 en collaboration avec Spellbrush, est le pendant anime/illustration de la V7. Il améliore considérablement la cohérence des détails fins (yeux, reflets, éléments d’arrière-plan) par rapport à Niji 6. Depuis février 2026, Niji 7 supporte la personnalisation et les moodboards.

Niji dispose de son propre site web et serveur Discord dédiés. Activez-le via le paramètre --niji 7 ou dans les réglages de l’interface web.

Structurer vos prompts pour la V7

La V7 comprend mieux les prompts détaillés que ses prédécesseurs. Voici la structure optimale :

[Sujet] + [Action/Contexte] + [Style] + [Environnement/Éclairage] + [Paramètres techniques] --v 7

Exemples concrets :

a medieval blacksmith forging a sword in a dimly lit workshop, sparks flying, dramatic chiaroscuro lighting, oil painting style --v 7 --ar 16:9 --s 250

architectural visualization of modern home exterior, photorealistic rendering, golden hour lighting, landscaped environment, detailed materials and textures --v 7 --q 4

product photography of luxury watch, macro lens at f/2.8, studio lighting with soft boxes, focus on intricate dial details --v 7 --ar 2:3 --raw

Conseils spécifiques à la V7 : utilisez --raw quand vous voulez un rendu photographique neutre sans l’intervention stylistique de Midjourney. Activez votre profil de personnalisation (--p) pour que le modèle s’aligne avec vos préférences. Les prompts plus longs et plus descriptifs fonctionnent mieux en V7 qu’en V6, qui préférait les descriptions courtes et « vibes ».

Pour approfondir, consultez Midjourney Prompts : le guide complet.

Historique complet des versions Midjourney

Version	Date de sortie	Période par défaut	Innovation clé
V1	Février 2022	–	Premier modèle, génération basique depuis du texte
V2	Avril 2022	–	Amélioration qualité et performances
V3	Juillet 2022	–	Meilleure interprétation des prompts
V4	Novembre 2022	Nov 2022 – Mai 2023	Bond qualitatif majeur
V5 / V5.2	Mars / Juin 2023	Mai – Déc 2023	Photoréalisme, zoom out, variation
V6	Décembre 2023	Fév – Juil 2024	Prompts longs, remix, cohérence améliorée
V6.1	Juillet 2024	Juil 2024 – Juin 2025	25 % plus rapide, meilleur upscaling
V7	3 avril 2025	17 juin 2025 – actuel	Draft Mode, Omni Ref, personnalisation, vidéo
V8 Alpha	17 mars 2026	Preview uniquement	5x plus rapide, résolution 2K native, texte amélioré

Questions fréquentes

Comment activer Midjourney V7 ?

La V7 est le modèle par défaut depuis le 17 juin 2025 : vous n’avez rien à faire si vos paramètres sont sur « auto ». Pour forcer la V7 explicitement, ajoutez --v 7 à la fin de votre prompt ou sélectionnez V7 dans les réglages de la barre Imagine. Sur Discord, utilisez la commande /settings pour changer la version par défaut.

Le Draft Mode consomme-t-il des heures GPU ?

Oui, mais à la moitié du coût d’une génération standard. C’est le mode le plus économique de Midjourney. Un utilisateur sur le plan Standard (15 heures de GPU Fast) peut générer environ 1 800 images en Draft Mode contre 900 en mode standard. Combiné au Relax Mode (illimité sur Standard et au-dessus), c’est une combinaison très efficace pour l’exploration.

Quelle est la différence entre Omni Reference et Style Reference ?

L’Omni Reference (--oref) reproduit le contenu : un visage, un objet, un personnage spécifique. Le Style Reference (--sref) reproduit l’esthétique : la palette de couleurs, le style artistique, l’ambiance visuelle. Vous pouvez les combiner dans un même prompt pour maintenir à la fois la cohérence du sujet et du style. L’Omni Reference consomme 2x le GPU standard, tandis que le Style Reference est inclus dans le coût normal (sauf en V8 Alpha où il coûte 4x).

Midjourney V7 peut-il générer des vidéos ?

Oui, via le modèle V1 Video lancé en juin 2025. C’est un système image-to-video : vous créez d’abord une image, puis cliquez sur « Animate » pour la transformer en clip de 5 secondes, extensible jusqu’à 21 secondes. La vidéo coûte 8x plus que l’image en GPU, sort en 480p, et ne supporte pas le text-to-video direct. Le Relax Mode pour la vidéo est réservé aux plans Pro (60 $/mois) et Mega (120 $/mois).

Faut-il migrer vers la V8 Alpha ?

Pas encore pour la production. La V8 Alpha (disponible sur alpha.midjourney.com depuis le 17 mars 2026) est un modèle en preview : son esthétique par défaut est en cours de calibration, l’inpainting et l’outpainting ne sont pas disponibles, et les features premium coûtent 4x en GPU. En revanche, testez-la pour profiter de la vitesse 5x, de la résolution native 2K (--hd), et du rendu de texte amélioré. Les profils de personnalisation V7 sont compatibles avec la V8. Attendez la V8 stable (possiblement V8.1) pour une migration complète.