Leonardo AI : Guide Complet des Modèles Disponibles

Leonardo AI propose une dizaine de modèles de génération d’images, chacun optimisé pour un cas d’usage précis : photoréalisme, concept art cinématique, adhérence au prompt ou prototypage rapide.

Plateforme: Leonardo AI (filiale de Canva depuis 2024)
Modèle phare: Phoenix 1.0 (modèle fondationnel propriétaire)
Autres modèles: Lucid Origin, Lucid Realism, Kino XL, Flux Dev, Flux Schnell, Flux Kontext, GPT-Image-1, Nano Banana Pro
Spécialité: Génération d’images, textures 3D, vidéo (Motion), édition in-canvas
Plans: Free (150 tokens/jour) · Apprentice (12 $/mois) · Artisan (30 $/mois) · Maestro (60 $/mois)
API: Creative Engine API (lancée en février 2026)

Vue d’ensemble : pourquoi autant de modèles ?

Contrairement à Midjourney, qui fonctionne autour d’un seul modèle propriétaire, Leonardo AI adopte une approche multi-modèles. La plateforme combine des modèles développés en interne (Phoenix, Lucid, Kino) avec des modèles tiers (Flux de Black Forest Labs, GPT-Image-1 d’OpenAI, Nano Banana). L’idée est simple : chaque modèle excelle dans un domaine spécifique, et c’est à vous de choisir le bon outil pour le bon rendu.

Cette stratégie a un avantage réel : vous accédez à plusieurs moteurs de génération depuis une seule interface, avec les mêmes outils d’édition (AI Canvas, inpainting, outpainting, upscaling). Le revers de la médaille, c’est que le système de tokens rend le coût par image variable selon le modèle utilisé. Un rendu avec Lucid Realism consomme nettement plus de tokens qu’une génération rapide avec Flux Schnell.

Depuis le rachat par Canva en juillet 2024 et le rebranding « Yours to Create » début 2026, Leonardo a lancé sa Creative Engine API et intensifié l’intégration de ses modèles dans l’écosystème Canva (notamment via l’outil Dream Lab qui exploite le modèle Phoenix).

Phoenix 1.0 : le modèle fondationnel de Leonardo

Ce qu’il fait

Phoenix 1.0 est le premier modèle fondationnel développé entièrement en interne par Leonardo AI. Contrairement aux autres modèles de la plateforme (souvent des fine-tunes de Stable Diffusion ou des intégrations tierces), Phoenix est une architecture propriétaire pensée de zéro. Son point fort principal : l’adhérence au prompt. Quand vous demandez un objet rouge à gauche et un personnage bleu à droite, Phoenix place les éléments exactement là où vous les avez décrits.

Forces

L’adhérence au prompt est la qualité qui revient le plus souvent dans les retours utilisateurs. Phoenix interprète fidèlement les descriptions longues et détaillées, là où d’autres modèles résument ou ignorent certaines instructions. Le modèle sait aussi générer du texte lisible directement dans les images, ce qui est utile pour les maquettes marketing, les visuels publicitaires ou les logos. Phoenix gère des phrases entières, pas seulement des mots isolés.

Phoenix propose trois modes de génération : Fast (rapide, moindre qualité), Quality (équilibre idéal), et Ultra (résolution jusqu’à 5 mégapixels ou plus). Le mode Ultra est particulièrement utile pour les rendus destinés à l’impression ou aux affichages grand format.

Limites

Phoenix a une tendance à être « logiquement rigide ». Si vous demandez un scorpion à six pattes, le modèle risque de corriger votre prompt et de générer huit pattes, parce que ses données d’entraînement lui indiquent que c’est biologiquement correct. C’est un atout pour le réalisme, mais un frein pour les créations fantastiques ou les designs délibérément irréalistes.

L’autre limite : le photoréalisme pur. Phoenix produit des images très fidèles au prompt, mais le rendu final est souvent moins « cinématique » que celui de la suite Lucid. Pour du photoréalisme haut de gamme, Lucid Realism reste supérieur.

Conseil pro Utilisez Phoenix en mode Quality pour le meilleur rapport fidélité/rendu. Le mode Fast est acceptable pour du prototypage, mais les résultats sont visiblement moins détaillés. Phoenix excelle aussi en restyling : uploadez un croquis ou un block-out 3D et laissez Phoenix le transformer en asset fini tout en conservant la structure d’origine.

Cas d’usage idéaux

Maquettes publicitaires avec texte intégré, visuels pour réseaux sociaux, mockups de packaging, concept art structuré où le placement des éléments compte, restyling de croquis, assets de jeu nécessitant une cohérence de style.

Lucid Origin : le modèle polyvalent haut de gamme

Ce qu’il fait

Lucid Origin est un modèle développé en interne par Leonardo, positionné comme le modèle « quotidien » pour les créateurs exigeants. Son approche se distingue par ce que l’équipe appelle « model alchemy » : un processus d’entraînement qui mêle ingénierie technique et sensibilité artistique, avec des chercheurs ayant des backgrounds en art et en photographie.

Forces

Lucid Origin se classe parmi les meilleurs modèles disponibles sur la plateforme en termes de diversité et de richesse esthétique. Le modèle produit des images saturées, avec une profondeur visuelle marquée et un rendu dynamique. Il gère aussi bien le photoréalisme que les styles illustrés, l’anime ou le hand-drawn.

Le modèle rend correctement le texte dans les images et offre une bonne adhérence au prompt (inférieure à Phoenix sur les compositions très structurées, mais largement suffisante pour la majorité des cas). Selon l’Artificial Analysis Image Leaderboard, Lucid Origin se classe en 6e position parmi les modèles d’image les plus performants, au niveau de FLUX.1 Kontext.

Limites

La vitesse de génération est son principal défaut. En mode Ultra, Lucid Origin met environ 22 secondes pour produire une image, et environ 12 secondes en mode Fast. C’est nettement plus lent que des modèles comme FLUX.1 Kontext (environ 5 secondes) ou Imagen 4 Ultra (environ 12 secondes).

Bon à savoir Lucid Origin est exclusif à Leonardo AI. Vous ne le trouverez pas sur d’autres plateformes comme Replicate ou Hugging Face. Si vous quittez Leonardo, vous perdez l’accès à ce modèle.

Cas d’usage idéaux

Art digital polyvalent, contenu de marque, illustrations éditoriales, portraits créatifs, tout projet nécessitant un rendu esthétique soigné sans sacrifier l’adhérence au prompt.

Lucid Realism : le spécialiste du photoréalisme

Ce qu’il fait

Lucid Realism est une variante de la suite Lucid optimisée pour les rendus photographiques. Le modèle cible les sorties cinématiques avec une profondeur de champ, un éclairage et des textures proches de la photographie professionnelle.

Forces

C’est le modèle de référence sur Leonardo pour la photographie de produit, les scènes architecturales et tout visuel nécessitant un réalisme poussé. Le grain filmique, la gestion de la lumière naturelle et le rendu des textures (peau, tissu, métal, verre) sont d’un niveau élevé.

Limites

Lucid Realism a tendance à ajouter un grain filmique aux résultats, surtout quand le mot « analog » apparaît dans le prompt. Ce rendu vintage n’est pas toujours souhaité. Le modèle est aussi l’un des plus gourmands en tokens : comptez environ 66 crédits par image, ce qui limite rapidement le plan gratuit.

Autre point : Lucid Realism est un modèle payant. Il n’est pas accessible sur le plan Free, ce qui le réserve aux abonnés Apprentice et au-delà.

Cas d’usage idéaux

Photographie de produit, rendus architecturaux, portraits photoréalistes, visuels immobiliers, contenu publicitaire nécessitant un rendu « studio ».

Kino XL : le modèle cinématique

Ce qu’il fait

Kino XL est spécialisé dans les compositions cinématiques à éclairage dramatique. Il est calibré pour les formats larges (16:9 et au-delà) et produit des rendus qui évoquent des concept arts de film ou des storyboards professionnels.

Forces

Le modèle excelle dans les compositions à fort impact visuel : scènes de science-fiction, paysages épiques, ambiances dark fantasy, couvertures de livre. Kino XL fonctionne efficacement sans prompts négatifs, ce qui simplifie le workflow par rapport aux modèles basés sur Stable Diffusion qui nécessitent souvent une liste d’exclusions pour éviter les artefacts.

Limites

Kino XL n’est pas fait pour le photoréalisme pur ni pour les portraits précis. Son esthétique est assumée : cinématique et stylisée. Si vous cherchez une photo de produit réaliste, passez à Lucid Realism.

Cas d’usage idéaux

Concept art pour films et jeux, couvertures de livre, keyframes d’animation, storyboards, visuels marketing à forte identité visuelle.

Les modèles Flux (Black Forest Labs)

Leonardo intègre plusieurs modèles de la famille Flux, développés par Black Forest Labs (fondé par d’anciens créateurs de Stable Diffusion). Chaque variante cible un besoin différent.

Flux Dev

C’est le modèle de référence pour l’entraînement de modèles personnalisés (LoRA) sur Leonardo. Si vous devez reproduire un personnage, un mascotte de marque ou un style graphique spécifique de manière cohérente sur des centaines d’images, Flux Dev est le bon choix. Il permet de « verrouiller » un look que les modèles génériques ont du mal à maintenir.

Sa limite : le photoréalisme de base peut paraître légèrement artificiel ou « plastique » par rapport à la suite Lucid. L’autre piège courant lors de l’entraînement : si vos images de référence manquent de variété (mêmes arrière-plans, mêmes conditions d’éclairage), le modèle risque de coller le sujet à son fond, produisant un effet « incrusté ».

Attention à la variété du dataset Quand vous entraînez un LoRA sur Flux Dev, incluez votre sujet dans des conditions d’éclairage, des angles et des décors variés. Un dataset homogène produit un modèle qui sur-apprend l’arrière-plan en plus du sujet.

Flux Schnell

Le modèle le plus rapide de la gamme. Flux Schnell génère des images en quelques secondes mais avec une fidélité nettement inférieure. Les résultats sont plus plats, moins cohérents et manquent de détails texturaux. Ce n’est pas un modèle pour des rendus finaux.

Son vrai usage : le prototypage. Testez la structure de votre prompt (est-ce que l’IA comprend « homme debout à gauche de la voiture » ?) avant de passer à un modèle haute fidélité comme Flux Kontext ou Lucid Origin pour le rendu final.

Flux Kontext

Flux Kontext est un modèle d’édition avancé intégré dans l’éditeur inline de Leonardo. Il excelle dans la modification d’images existantes : ajout de texte, restyling, placement d’objets. C’est le modèle recommandé pour les modifications textuelles sur une image (par exemple, ajouter un slogan sur un visuel publicitaire).

Modèles tiers intégrés

En plus de ses modèles propriétaires, Leonardo intègre plusieurs modèles tiers dans son interface :

Modèle	Éditeur	Spécialité	Remarque
GPT-Image-1	OpenAI	Adhérence au prompt, imitation de styles artistiques	Aussi accessible via ChatGPT
Nano Banana / Nano Banana Pro	Tiers	Compréhension logique de scènes, édition précise	Disponible gratuitement ailleurs ; payant sur Leonardo
Veo 3	Google	Génération vidéo	Très gourmand en tokens
Sora 2	OpenAI	Génération vidéo	Accès via les tokens Leonardo
Kling	Kuaishou	Génération vidéo cinématique	Aussi disponible en standalone sur klingai.com
Seedance	ByteDance	Génération vidéo	Également accessible sur seedance.ai

Coût des modèles tiers Certains modèles comme Nano Banana Pro sont accessibles gratuitement ou à moindre coût sur d’autres plateformes. Sur Leonardo, vous les payez en tokens au même tarif que les modèles propriétaires. L’avantage, c’est l’unification de l’interface et des outils d’édition. L’inconvénient, c’est le surcoût potentiel.

Tableau comparatif des modèles Leonardo AI

Modèle	Type	Adhérence prompt	Photoréalisme	Vitesse	Texte dans l’image	Meilleur pour
Phoenix 1.0	Propriétaire	★★★★★	★★★☆☆	Moyen	Excellent	Maquettes, restyling, assets cohérents
Lucid Origin	Propriétaire	★★★★☆	★★★★☆	Lent	Bon	Art digital polyvalent, illustrations
Lucid Realism	Propriétaire	★★★☆☆	★★★★★	Lent	Moyen	Photo produit, architecture, portraits
Kino XL	Propriétaire	★★★★☆	★★★☆☆	Moyen	Moyen	Concept art, scènes cinématiques
Flux Dev	Black Forest Labs	★★★★☆	★★★☆☆	Moyen	Bon	Entraînement LoRA, cohérence de personnage
Flux Schnell	Black Forest Labs	★★★☆☆	★★☆☆☆	Très rapide	Faible	Prototypage rapide, tests de prompt
Flux Kontext	Black Forest Labs	★★★★★	★★★★☆	Moyen	Excellent	Édition d’images, ajout de texte
GPT-Image-1	OpenAI	★★★★★	★★★★☆	Lent	Bon	Styles artistiques, images de référence

Comment choisir le bon modèle

Le choix du modèle dépend de votre objectif, pas de vos préférences esthétiques. Voici un arbre de décision simple :

Vous avez besoin de texte lisible dans l’image

Utilisez Phoenix 1.0. C’est le meilleur modèle de la plateforme pour le rendu de texte cohérent. Si vous devez ensuite modifier ce texte, passez dans l’éditeur inline avec Flux Kontext.

Vous visez un rendu photo-réaliste

Lucid Realism est votre premier choix. Si vous n’avez pas d’abonnement payant, Lucid Origin offre un bon compromis entre réalisme et accessibilité.

Vous faites du concept art ou du storyboard

Kino XL pour les ambiances cinématiques. Lucid Origin si vous voulez plus de diversité stylistique.

Vous entraînez un modèle personnalisé

Flux Dev est le seul choix pertinent pour l’entraînement de LoRA sur la plateforme. Préparez un dataset varié (15-20 images minimum, avec des angles, éclairages et arrière-plans différents).

Vous testez rapidement un prompt

Flux Schnell pour valider la structure, puis passez à un modèle haute fidélité pour le rendu final.

Vous éditez une image existante

Flux Kontext pour les modifications textuelles, GPT-Image-1 quand vous incorporez des images de référence et que vous avez besoin de plus de contrôle.

Consommation de tokens par modèle

Le système de tokens de Leonardo est l’un des aspects les moins intuitifs de la plateforme. Chaque action consomme un nombre variable de tokens selon le modèle, la résolution, le nombre de variations et les fonctionnalités activées.

Voici les ordres de grandeur pour une génération standard en 1024×1024 :

Modèle	Tokens (estimation)	Remarque
Flux Schnell	~4-8	Le moins cher
Phoenix 1.0 (Quality)	~12-16	Bon rapport qualité/coût
Flux Dev	~12-16	Variable selon les paramètres
Kino XL	~16-20	Plus cher en formats larges
Lucid Origin	~20-30	Dépend du mode (Fast/Quality/Ultra)
Lucid Realism	~30-66	Le plus gourmand en tokens
Phoenix Ultra (5MP+)	~40-60	Haute résolution uniquement

Optimiser vos tokens Commencez vos explorations en 512×512 (environ 8 tokens) plutôt qu’en 1024×1024 (environ 16 tokens). Générez 4 variations en une seule fois plutôt que de lancer des générations unitaires successives. N’activez le Consistent Character Engine que sur les compositions finalisées : il ajoute environ 25 % au coût par génération.

Les Presets : des modèles pré-configurés

En plus des modèles de base, Leonardo propose des « Presets » qui sont des configurations pré-réglées ciblant un rendu spécifique : Anime, Stock Photography, Concept Art, Illustrative Albedo, Lifelike Vision, etc. Ces presets appliquent des paramètres optimisés (guidance scale, sampler, style tokens) par-dessus un modèle de base.

Attention : la qualité des presets est inégale. Les retours utilisateurs signalent que les presets Anime et Stock Photography produisent régulièrement des résultats avec des distorsions ou des aspects étranges. Testez chaque preset sur votre cas d’usage avant de l’adopter dans un workflow de production.

Entraînement de modèles personnalisés

L’une des fonctionnalités distinctives de Leonardo est la possibilité d’entraîner vos propres modèles (LoRA) directement depuis l’interface. C’est un avantage concret par rapport à Midjourney, qui ne propose pas d’entraînement custom.

Comment ça fonctionne

Uploadez 15 à 20 images variées de votre sujet (personnage, style, objet). Assignez un « trigger word » unique, c’est-à-dire un mot-clé que vous utiliserez dans vos prompts pour activer le style entraîné. L’entraînement prend environ 30 minutes. Le modèle résultant est un LoRA compatible avec les modèles Flux et SDXL.

Plans et limites

L’entraînement de LoRA est réservé aux plans payants. Le plan Apprentice (12 $/mois) permet 1 entraînement LoRA par mois. Les plans Artisan et Maestro offrent des quotas supérieurs. Le plan Free ne donne pas accès à cette fonctionnalité.

Pièges à éviter

Le piège le plus fréquent est le manque de diversité dans le dataset. Si toutes vos images montrent le sujet dans le même éclairage ou sur le même fond, le modèle apprendra le fond en même temps que le sujet. Résultat : le personnage semble « collé » à l’arrière-plan dans les nouvelles générations. Variez systématiquement les angles de vue, les conditions d’éclairage et les décors.

Creative Engine API

Lancée en février 2026, la Creative Engine API marque le passage de Leonardo d’un outil grand public vers une plateforme d’infrastructure pour développeurs. L’API donne accès aux modèles de génération d’images et aux outils d’édition de manière programmatique.

L’API utilise un système de crédits distinct des tokens de l’interface web :

Plan API	Prix/mois	Crédits API	Réduction recharges
Basic	9 $	3 500	Aucune
Standard	Variable	25 000	20 %
Pro	Variable	200 000	40 %
Custom	Sur devis	1M+	Sur mesure

L’API est encore récente et utilise un modèle de tarification basé sur des crédits dont le calcul n’est pas toujours transparent. Leonardo fournit un calculateur de pricing pour estimer le coût de chaque configuration. Comparé aux API concurrentes comme Replicate ou les SDK de Black Forest Labs, l’API Leonardo est plus opaque sur les coûts mais offre l’avantage d’un accès unifié à tous les modèles de la plateforme (propriétaires et tiers).

Modèles vidéo : Motion

Leonardo ne se limite pas aux images fixes. La plateforme intègre des capacités de génération vidéo sous le nom « Motion » :

Motion v3 permet de générer des clips vidéo HD de 10 secondes à partir d’images ou de prompts textuels, avec contrôle de la caméra (pan, zoom, tilt). Les modèles vidéo tiers (Veo 3, Sora 2, Kling, Seedance) sont aussi accessibles directement depuis l’interface.

Le principal frein reste la consommation de tokens : la génération vidéo est extrêmement gourmande. Un seul clip de 10 secondes peut consommer l’équivalent de dizaines d’images. Pour un usage intensif de la vidéo, comparez le coût avec les plateformes dédiées comme Runway ou Kling en accès direct.

Textures 3D

Leonardo possède une fonctionnalité unique parmi les générateurs d’images IA : la génération de textures 3D avec UV mapping. Le système produit des maps albedo, normal et roughness directement à partir de prompts textuels. C’est une fonctionnalité rare et précieuse pour les développeurs de jeux utilisant Unity ou Unreal Engine.

Aucun concurrent majeur (Midjourney, DALL-E, Ideogram) ne propose d’équivalent. C’est un argument de différenciation solide pour les studios de jeu et les artistes 3D.

Modèles Leonardo vs Midjourney : quelle approche ?

La comparaison la plus fréquente est avec Midjourney. Les deux plateformes ciblent des profils différents :

Critère	Leonardo AI	Midjourney
Approche modèles	Multi-modèles (10+)	Mono-modèle propriétaire
Interface	Web app complète	Web app + Discord
Entraînement custom	Oui (LoRA)	Non
Textures 3D	Oui	Non
Qualité artistique pure	Très bonne	Excellente
Plan gratuit	Oui (150 tokens/jour)	Non
Prix entrée de gamme	12 $/mois	10 $/mois
API	Creative Engine API	Non (pas d’API publique)
Vidéo	Oui (Motion + modèles tiers)	Non

Notre verdict : Midjourney reste supérieur en qualité artistique brute sur un modèle unique. Leonardo gagne sur la polyvalence (multi-modèles, LoRA, 3D, vidéo, API) et l’accessibilité (plan gratuit, interface web complète). Si votre priorité est la qualité visuelle maximale et que vous n’avez pas besoin de personnalisation, Midjourney est le meilleur choix. Si vous cherchez un écosystème complet avec un contrôle granulaire, Leonardo est plus adapté. Pour une comparaison détaillée, consultez notre page Leonardo vs Midjourney.

Questions fréquentes

Quel est le meilleur modèle Leonardo AI pour un débutant ?

Phoenix 1.0 en mode Quality. C’est le modèle le plus fiable en termes d’adhérence au prompt : ce que vous décrivez, vous l’obtenez. Il consomme un nombre raisonnable de tokens et gère bien le texte dans les images. Commencez par Phoenix, puis explorez Lucid Origin une fois que vous maîtrisez la rédaction de prompts.

Les modèles Leonardo AI sont-ils gratuits ?

Le plan Free donne accès à Phoenix et à certains modèles de base avec 150 tokens par jour (reset toutes les 24 heures, sans cumul). Les modèles premium comme Lucid Realism nécessitent un abonnement payant (à partir de 12 $/mois pour le plan Apprentice). Les modèles tiers gourmands en tokens (Veo 3, Sora 2) sont techniquement accessibles mais consomment rapidement l’allocation gratuite.

Phoenix ou Lucid Origin : lequel choisir ?

Phoenix si la précision du placement et le texte dans l’image sont prioritaires. Lucid Origin si vous cherchez un rendu esthétique plus riche et plus diversifié. Phoenix est plus « obéissant », Lucid Origin est plus « artistique ». Pour du concept art ou de l’illustration éditoriale, Lucid Origin. Pour des maquettes marketing structurées, Phoenix.

Peut-on entraîner un modèle sur son propre visage avec Leonardo ?

Oui. Utilisez l’onglet Training, uploadez 15 à 20 photos variées de vous-même, attribuez un trigger word unique, et attendez environ 30 minutes. Le résultat est un LoRA que vous pouvez réutiliser dans vos prompts. Cette fonctionnalité est réservée aux abonnés payants (Apprentice minimum, avec 1 entraînement par mois).

Leonardo AI a-t-il une API pour les développeurs ?

Oui, depuis février 2026. La Creative Engine API donne accès par programmation à tous les modèles et outils de la plateforme. Les plans API démarrent à 9 $/mois pour 3 500 crédits. L’API est encore récente et le modèle de tarification basé sur les crédits est moins transparent que celui de concurrents comme Replicate. Leonardo fournit un calculateur de pricing pour estimer les coûts avant de lancer des générations.