InvokeAI
InvokeAI est une interface web open source pour Stable Diffusion axée sur l’expérience utilisateur professionnelle, offrant un Canvas de composition avancé, une galerie organisée par projets, un Model Manager intégré et le support des modèles SD, SDXL, FLUX et Z-Image.
- Type
- Interface web (WebUI) pour modèles de diffusion
- Développeur
- Invoke-AI (équipe open source)
- Licence
- Open source (Apache 2.0)
- Version actuelle
- v6.11.x (février 2026), v6.12 RC (mars 2026)
- Modèles supportés
- SD 1.x, SD 2.x, SDXL, FLUX (Dev, Schnell, Klein), Z-Image
- Plateformes
- Windows, macOS (Apple Silicon), Linux
- GPU minimum
- 4 Go VRAM (NVIDIA, AMD via ROCm, Apple Silicon)
- Installation
- Invoke Launcher (one-click), pip, Docker
- URL
- invoke-ai.github.io/InvokeAI
Qu’est-ce qu’InvokeAI ?
InvokeAI se positionne comme le « studio créatif » de l’écosystème Stable Diffusion. Là où AUTOMATIC1111 expose tous les paramètres techniques dans une interface d’ingénieur, et où ComfyUI propose une programmation visuelle par nœuds, InvokeAI adopte une approche orientée workflow créatif : une interface soignée avec un Canvas de composition, une galerie organisée par projets (« Boards »), un gestionnaire de modèles intégré, et des fonctionnalités pensées pour les artistes et les professionnels de l’image.
Le projet a démarré en 2022 comme l’un des premiers forks communautaires de Stable Diffusion (alors sous le nom « lstein/stable-diffusion »). Il a depuis évolué en un produit indépendant avec une équipe dédiée, un site commercial (invoke.ai), et une base de code propre basée sur la bibliothèque Diffusers de Hugging Face. InvokeAI sert aussi de fondation à des produits commerciaux, ce qui garantit un développement actif et un niveau de finition supérieur à la moyenne des projets open source.
La version 6.11 (janvier 2026) a ajouté le support de FLUX.2 Klein, et la version 6.10 a introduit le support de Z-Image (ZiT), incluant les variantes Diffusers, safetensors, GGUF, FP8 et quantifiées. Le développement est actif avec des releases régulières.
L’interface : deux espaces de travail
Le panneau de génération (Gallery)
L’espace de travail principal pour la génération rapide d’images. Vous saisissez un prompt, sélectionnez un modèle, ajustez les paramètres (sampler, steps, CFG, seed, résolution), et générez. Les images s’affichent dans une galerie avec métadonnées complètes et possibilité de les organiser en « Boards » (dossiers de projet).
Un aspect distinctif d’InvokeAI : le système de paramètres par défaut par modèle. Quand vous installez un checkpoint, vous pouvez lui associer un sampler préféré, un prompt négatif par défaut, une résolution par défaut, et un CFG optimal. Ces paramètres s’appliquent automatiquement quand vous sélectionnez le modèle, ce qui élimine le besoin de reconfigurer manuellement l’interface à chaque changement de modèle.
Le Canvas (espace de composition)
Le Canvas est la fonctionnalité phare d’InvokeAI. C’est un espace de travail infini où vous pouvez composer des images en combinant génération, inpainting, outpainting et édition manuelle dans un seul environnement fluide. Vous pouvez :
Générer une image initiale, puis outpainter dans toutes les directions pour l’étendre. Masquer des zones spécifiques et les régénérer avec un prompt différent. Superposer des calques avec des références visuelles pour ControlNet ou IP-Adapter. Peindre directement sur le canvas pour guider la génération. Comparer des versions côte à côte avec l’outil de comparaison intégré.
Le Canvas d’InvokeAI se rapproche de l’expérience d’un éditeur d’images professionnel (comme Photoshop) avec la puissance génératrice de Stable Diffusion. C’est un avantage significatif par rapport à A1111, où l’inpainting et l’outpainting se font dans des onglets séparés sans vision globale de la composition. Pour les artistes habitués aux logiciels de création graphique, le Canvas offre un environnement familier enrichi par l’IA générative.
Le système de Control Layers dans le Canvas permet de superposer plusieurs conditions sur la même génération : un calque pour la carte de profondeur ControlNet, un calque pour l’image de référence IP-Adapter, un calque pour le masque d’inpainting. Chaque calque a son propre poids et sa propre plage de steps, ce qui offre un contrôle granulaire sur la composition finale. Ce système de calques est plus intuitif que la configuration des ControlNets multiples dans A1111 ou la construction de nœuds dans ComfyUI.
Backend et API
InvokeAI est construit sur la bibliothèque Diffusers de Hugging Face, ce qui lui confère une compatibilité native avec les derniers modèles publiés. Le backend utilise un système d’invocations (nodes) interne, similaire dans son concept aux nœuds de ComfyUI mais invisible pour l’utilisateur. Chaque action (génération, inpainting, upscaling) est une invocation exécutée par le backend.
Une API REST est exposée par défaut, permettant d’intégrer InvokeAI dans des pipelines automatisés. Vous pouvez soumettre des générations, récupérer des images, et gérer les modèles par programmation. L’API est documentée et accessible via l’interface web (onglet API).
La gestion mémoire est automatique : InvokeAI détecte le GPU disponible et choisit la stratégie d’optimisation appropriée (xFormers pour les anciens GPU NVIDIA avec CUDA ≤ 7, torch-sdp pour les RTX 30xx/40xx/50xx, attention slicing en fallback pour les GPU à faible VRAM). Le mode « Sequential Guidance » traite les passes de conditionnement une par une pour économiser la VRAM sur les configurations limitées.
Model Manager
InvokeAI intègre un gestionnaire de modèles complet qui va bien au-delà du simple chargement de fichiers :
Le Launchpad propose des « starter packs » thématiques (SDXL, FLUX.2 Klein, Z-Image) qui téléchargent en un clic le modèle principal et tous ses composants nécessaires (VAE, text encoders, ControlNets). Cela élimine la confusion du débutant qui ne sait pas quels fichiers complémentaires sont requis.
Le Starter Models tab liste tous les modèles compatibles avec possibilité de recherche et filtrage. Vous pouvez installer des modèles depuis Hugging Face ou importer des fichiers locaux.
La gestion des formats multiples est transparente : InvokeAI supporte les checkpoints Diffusers, safetensors, GGUF (quantifié), et FP8. Vous n’avez pas besoin de convertir manuellement les modèles entre formats.
Fonctionnalités principales
Text-to-Image
La génération txt2img standard avec tous les paramètres classiques. InvokeAI utilise le backend Diffusers, ce qui garantit une compatibilité native avec les derniers modèles publiés sur Hugging Face. Les samplers disponibles incluent les variantes DDIM, DDPM, DPM++, Euler, et plus.
Image-to-Image
Le mode img2img est intégré dans le Canvas et le panneau de génération. Uploadez une image, ajustez le denoising strength, et le modèle la transforme guidé par le prompt. L’intégration dans le Canvas permet d’itérer rapidement sur une image sans quitter l’espace de composition.
ControlNet et IP-Adapter
ControlNet est intégré nativement avec support des pré-processeurs les plus courants (Canny, Depth, OpenPose, MLSD, etc.). IP-Adapter permet de conditionner la génération par une image de référence (pour transférer un style ou des caractéristiques visuelles). Les deux sont configurables directement dans le panneau de génération avec des contrôles intuitifs pour le poids et la plage de steps.
Regional Guidance
InvokeAI supporte la guidance régionale : appliquer des prompts différents à des zones spécifiques de l’image. Dessinez des régions sur le Canvas, assignez un prompt à chaque région, et le modèle génère un contenu différent selon la zone. C’est l’équivalent natif de l’extension « Regional Prompter » d’A1111, mais intégré dans l’interface de manière plus fluide.
Boards (organisation par projet)
Les Boards sont des dossiers de projet qui organisent vos générations, images de référence et assets ControlNet/IP-Adapter en un seul endroit. Chaque Board a sa propre bibliothèque d’images, ce qui facilite le travail sur plusieurs projets en parallèle sans mélanger les fichiers. C’est une fonctionnalité de gestion de projet absente d’A1111 et ComfyUI.
Metadata Recall
Chaque image générée stocke ses métadonnées complètes (prompt, modèle, paramètres, seed). InvokeAI permet de « recall » (rappeler) n’importe quelle image : un clic recharge tous ses paramètres dans le panneau de génération pour la reproduire ou la modifier. Vous pouvez aussi comparer deux images côte à côte avec un outil de comparaison dédié.
Prompt Templates
InvokeAI propose un système de templates de prompt réutilisables. Enregistrez des prompts fréquemment utilisés comme templates, et appliquez-les en un clic. C’est particulièrement utile pour les workflows professionnels avec des prompts standardisés (style de marque, qualité photo, etc.).
Modèles supportés
| Architecture | Modèles | Formats supportés | VRAM minimum |
|---|---|---|---|
| SD 1.x | SD 1.4, SD 1.5, checkpoints communautaires | Diffusers, safetensors | 4 Go |
| SD 2.x | SD 2.0, SD 2.1 | Diffusers, safetensors | 4 Go |
| SDXL | SDXL Base, SDXL Refiner, checkpoints communautaires | Diffusers, safetensors | 6-8 Go |
| FLUX | FLUX.1 Dev, Schnell, FLUX.2 Klein 4B | Diffusers, GGUF (Q4, Q8), safetensors | 6 Go (GGUF Q4), 16 Go (full) |
| Z-Image (ZiT) | Z-Image Turbo, variantes quantifiées | Diffusers, safetensors, GGUF, FP8 | 6 Go (Q4), 16 Go (full/Q8) |
Le support des modèles GGUF quantifiés (Q4, Q8) est un atout important : il permet de faire tourner des modèles récents et lourds (FLUX.2 Klein, Z-Image) sur des GPU avec seulement 6-8 Go de VRAM, au prix d’une légère perte de qualité par rapport aux versions full-precision.
Installation
Invoke Launcher (recommandé)
Le moyen le plus simple d’installer InvokeAI. Le Launcher est un installateur graphique disponible pour Windows, macOS et Linux qui gère automatiquement Python, les dépendances et le téléchargement des modèles de base. L’installation prend environ 10-15 minutes selon la vitesse de connexion (10 Go de base + modèles).
Installation via pip
# Créer un environnement Python
python -m venv invokeai-env
source invokeai-env/bin/activate # Linux/Mac
# invokeai-envScriptsactivate # Windows
# Installer InvokeAI
pip install InvokeAI
# Lancer
invokeai-webL’interface s’ouvre dans votre navigateur à http://127.0.0.1:9090. Au premier lancement, le Model Manager propose d’installer des starter packs de modèles.
Configuration système
InvokeAI requiert : un GPU avec 4 Go de VRAM minimum (6-8 Go recommandé pour SDXL), 12 Go de RAM système, Python 3.10 ou 3.11, et 10-50 Go de disque selon les modèles installés. Les GPU NVIDIA (CUDA), AMD (ROCm, Linux uniquement) et Apple Silicon (Metal) sont supportés. InvokeAI optimise automatiquement l’utilisation de la mémoire selon le GPU détecté (xFormers pour les anciens GPU NVIDIA, torch-sdp pour les RTX 30xx/40xx, attention slicing en fallback).
InvokeAI vs les autres interfaces
| Critère | InvokeAI | A1111 | ComfyUI |
|---|---|---|---|
| Interface | Web UI soignée, Canvas + Gallery | Formulaire web classique | Nœuds visuels (graphe) |
| Public cible | Artistes, professionnels | Utilisateurs intermédiaires | Power users, développeurs |
| Canvas de composition | ✅ Natif, avancé | Limité (onglets séparés) | Via custom nodes |
| Model Manager | ✅ Intégré, starter packs | Basique (dossiers manuels) | Basique (dossiers manuels) |
| Organisation projets | ✅ Boards | Dossiers de sortie | Workflows JSON |
| Extensions | Intégrées (pas d’écosystème tiers) | Écosystème massif | 600+ custom nodes |
| Flexibilité | Modérée (features curées) | Haute (via extensions) | Maximale (tout est configurable) |
| Stabilité | Haute (pas d’extensions tierces qui cassent) | Variable (dépend des extensions) | Variable (dépend des custom nodes) |
| Support FLUX | Oui (Dev, Schnell, Klein, GGUF) | Non (via Forge) | Oui (natif) |
Le verdict : InvokeAI est le choix idéal pour les artistes et professionnels qui veulent une expérience soignée, stable et organisée. Le Canvas est sa killer feature : aucune autre interface n’offre un espace de composition aussi fluide. En revanche, InvokeAI ne propose pas d’écosystème d’extensions tierces, ce qui limite sa flexibilité par rapport à A1111 (extensions matures) ou ComfyUI (custom nodes infinis). Si vous avez besoin de fonctionnalités très spécifiques (samplers exotiques, techniques expérimentales), A1111 ou ComfyUI sont plus adaptés. Si vous voulez un outil fiable et productif pour le travail créatif quotidien, InvokeAI est excellent.
Cas d’usage professionnels
Concept art et illustration
Le Canvas d’InvokeAI est particulièrement adapté au concept art : générez une image de base, outpaintez pour étendre la scène, inpaintez pour ajuster des détails, et utilisez ControlNet pour verrouiller la composition. Le système de Boards permet de séparer les différentes itérations par projet ou par client.
Retouche créative d’images
La combinaison img2img + inpainting + Canvas fait d’InvokeAI un outil de retouche créative puissant : changer un arrière-plan, modifier un vêtement, ajouter des éléments, corriger des visages. Le Canvas permet de travailler zone par zone avec une vision globale de l’image.
Production de visuels marketing
Les Boards organisent les projets par campagne. Les prompt templates standardisent le style de la marque. Le Model Manager permet de pré-configurer des modèles avec les paramètres optimaux pour chaque type de contenu (photos produit, illustrations, bannières). L’API intégrée permet d’automatiser les générations en batch pour la production à grande échelle.
Limites
Pas d’écosystème d’extensions tierces
Contrairement à A1111 (centaines d’extensions) et ComfyUI (600+ custom nodes), InvokeAI n’offre pas de système d’extensions tierces. Toutes les fonctionnalités sont développées et maintenues par l’équipe InvokeAI. L’avantage : stabilité maximale, pas de conflit entre extensions. L’inconvénient : si une fonctionnalité n’est pas intégrée nativement, vous ne pouvez pas l’ajouter vous-même.
Courbe d’apprentissage du Canvas
Le Canvas est puissant mais son workflow n’est pas immédiatement évident pour un débutant. Les concepts de calques, masques, et régions demandent un peu de temps pour être maîtrisés. L’interface de génération simple (Gallery) est plus accessible pour commencer.
Communauté plus restreinte
A1111 et ComfyUI ont des communautés beaucoup plus grandes, ce qui signifie plus de tutoriels, plus de workflows partagés, et plus de solutions aux problèmes courants. La communauté InvokeAI est active (Discord dédié) mais plus petite. Les tutoriels spécifiques à InvokeAI sont moins abondants.
Questions fréquentes sur InvokeAI
InvokeAI est-il gratuit ?
Oui, InvokeAI est entièrement open source et gratuit (licence Apache 2.0). Le projet propose aussi des offres commerciales (invoke.ai) pour les entreprises, mais l’application locale est gratuite et sans restriction. Aucun abonnement, aucune limite de génération.
InvokeAI supporte-t-il FLUX ?
Oui. InvokeAI supporte FLUX.1 (Dev, Schnell) et FLUX.2 Klein 4B (depuis la v6.11). Les modèles quantifiés GGUF (Q4, Q8) sont supportés, ce qui permet de faire tourner FLUX sur des GPU avec 6-8 Go de VRAM. Le support inclut text-to-image, image-to-image, LoRA FLUX, ControlNet FLUX, et les fonctions Canvas. Les Image Prompts (IP) ne sont pas encore supportés pour FLUX mais devraient l’être avec Z-Image Edit.
Quelle est la différence entre InvokeAI et AUTOMATIC1111 ?
InvokeAI se concentre sur l’expérience utilisateur professionnelle (Canvas de composition, Boards, Model Manager avec starter packs) tandis qu’A1111 expose tous les paramètres techniques avec un écosystème d’extensions massif. InvokeAI est plus stable (pas d’extensions tierces qui cassent) et mieux organisé pour le travail par projet. A1111 est plus flexible et plus personnalisable. Choisissez InvokeAI si vous êtes artiste/professionnel cherchant un workflow soigné. Choisissez A1111 si vous voulez un maximum de contrôle technique et d’extensions.
InvokeAI fonctionne-t-il sur Mac ?
Oui, InvokeAI fonctionne nativement sur les Mac Apple Silicon (M1, M2, M3, M4) via Metal. L’Invoke Launcher gère automatiquement la configuration. Les performances sont correctes pour SD 1.5 et SDXL. Les modèles FLUX quantifiés (GGUF Q4) fonctionnent aussi sur les Mac avec 16 Go de RAM unifiée ou plus.
Puis-je utiliser mes modèles et LoRAs existants ?
Oui. InvokeAI accepte les checkpoints au format Diffusers et safetensors, les LoRAs, les embeddings, et les modèles ControlNet. Le Model Manager permet d’importer des modèles locaux ou de les télécharger directement depuis Hugging Face. La majorité des modèles communautaires disponibles sur Civitai fonctionnent dans InvokeAI, à condition d’être au format safetensors ou Diffusers (les formats .ckpt sont aussi supportés mais le format safetensors est recommandé).