AUTOMATIC1111 (Stable Diffusion WebUI)
AUTOMATIC1111 (souvent abrégé A1111) est une interface web open source basée sur Gradio qui permet de générer, éditer et transformer des images avec Stable Diffusion via un navigateur web, sans écrire de code.
- Type
- Interface web (WebUI) pour Stable Diffusion
- Développeur
- AUTOMATIC1111 (développeur pseudonyme)
- Licence
- Open source (AGPL-3.0)
- Framework UI
- Gradio
- Plateformes
- Windows, Linux, macOS (Apple Silicon), Google Colab
- Modèles supportés
- SD 1.x, SD 2.x, SDXL (FLUX via Forge)
- Version actuelle
- v1.10.x (branche master)
- Python requis
- 3.10.6 (recommandé)
- GitHub
- github.com/AUTOMATIC1111/stable-diffusion-webui
Qu’est-ce qu’AUTOMATIC1111 ?
AUTOMATIC1111 est l’interface graphique la plus populaire et la plus établie pour Stable Diffusion. Lancée fin 2022, elle a rapidement accumulé plus de 140 000 étoiles sur GitHub et reste, début 2026, le point d’entrée le plus courant pour les utilisateurs qui veulent générer des images avec Stable Diffusion localement. Son interface web, accessible via navigateur à l’adresse http://127.0.0.1:7860, expose chaque paramètre du pipeline de diffusion dans des onglets thématiques : txt2img, img2img, inpainting, Extras (upscaling), etc.
Le principal atout d’A1111 est son écosystème : des centaines d’extensions communautaires couvrent tous les cas d’usage imaginables (ControlNet, LoRA, ADetailer, Regional Prompter, Ultimate SD Upscale…). Cette richesse d’extensions, combinée à une documentation communautaire abondante (tutoriels, guides, vidéos), en fait le choix le plus sûr pour un débutant qui veut apprendre Stable Diffusion.
Le compromis à connaître : A1111 est plus lent et plus gourmand en VRAM que ComfyUI ou Forge, et ne supporte pas nativement les modèles récents comme FLUX ou SD 3.5. Pour ces modèles, la communauté recommande Forge (fork d’A1111) ou ComfyUI.
Fonctionnalités principales
Txt2img (Text-to-Image)
L’onglet principal. Vous saisissez un prompt positif et un prompt négatif, choisissez un checkpoint, réglez les paramètres (sampler, steps, CFG scale, seed, résolution), et cliquez Generate. L’interface affiche les images générées avec leurs métadonnées (prompt, seed, paramètres) sauvegardées dans les fichiers PNG.
A1111 supporte le prompt weighting (pondération par parenthèses : (mot important:1.3) pour augmenter l’influence, [mot:0.5] pour la réduire), le prompt editing (changer de prompt en cours de génération : [prompt1:prompt2:0.5]), et les prompt templates pour le batch processing.
Img2img (Image-to-Image)
L’onglet img2img permet de transformer une image existante guidée par un prompt. Il inclut plusieurs sous-onglets : img2img classique, Sketch (dessiner sur un canvas), Inpaint (masquer et régénérer), Inpaint Sketch (dessiner le masque), et Inpaint Upload (uploader un masque externe). Le denoising strength contrôle l’intensité de la transformation.
Inpainting et Outpainting
L’inpainting intégré permet de peindre un masque directement sur l’image et de régénérer la zone masquée. Les scripts d’outpainting (Poor Man’s Outpainting, Outpainting mk2) étendent l’image au-delà de ses bordures. Les paramètres de masque (masked content, mask blur, inpaint area) offrent un contrôle fin sur le résultat.
Extras (Upscaling)
L’onglet Extras offre un upscaling dédié avec les principaux modèles (Real-ESRGAN, ESRGAN, SwinIR, LDSR). Vous pouvez combiner deux upscalers avec un ratio ajustable (ex. : 70% Real-ESRGAN + 30% SwinIR). L’option « Restore faces » (CodeFormer/GFPGAN) corrige automatiquement les visages pendant l’upscale.
Hires Fix
Le Hires Fix est une fonctionnalité intégrée au txt2img qui génère d’abord à résolution native, upscale avec un algorithme au choix (Latent, R-ESRGAN, etc.), puis fait un second passage img2img à faible denoising. C’est la méthode la plus simple pour produire des images haute résolution sans artefacts de composition.
Scripts intégrés
Le menu Script en bas des onglets txt2img et img2img donne accès à des fonctionnalités avancées : X/Y/Z Plot (comparer systématiquement des combinaisons de paramètres), Prompt Matrix (tester toutes les combinaisons de termes), SD Upscale (upscaling par tuiles avec diffusion), et les scripts d’outpainting. Ces scripts sont un puissant outil d’exploration et de comparaison.
PNG Info
Une fonctionnalité souvent sous-estimée : glissez n’importe quelle image PNG générée par A1111 sur l’onglet PNG Info, et l’interface extrait automatiquement le prompt, le prompt négatif, le checkpoint, le sampler, les steps, le CFG, la seed, et tous les autres paramètres. Vous pouvez ensuite renvoyer ces paramètres vers txt2img ou img2img pour reproduire ou affiner l’image.
Fonctionnalités avancées de prompt
A1111 offre des capacités de prompt qui vont bien au-delà du texte simple. Le prompt weighting permet d’augmenter ou de réduire l’influence d’un terme : (beautiful eyes:1.4) renforce l’attention sur les yeux, (background:0.6) la réduit sur l’arrière-plan. Les parenthèses imbriquées multiplient l’effet : ((important)) équivaut à environ 1.21×. Le prompt editing change le prompt en cours de génération : [cyberpunk city:fantasy village:0.5] commence avec « cyberpunk city » puis bascule vers « fantasy village » à mi-chemin du débruitage, ce qui crée des mélanges intéressants entre les deux concepts.
L’alternating prompt (syntaxe [mot1|mot2]) alterne entre deux termes à chaque step, ce qui permet de fusionner deux concepts. Ces techniques de prompt avancées sont documentées dans le wiki d’A1111 et constituent un avantage significatif par rapport aux interfaces plus simples.
API REST
En lançant A1111 avec le flag --api, une API REST est exposée à http://127.0.0.1:7860/sdapi/v1/. Elle permet de soumettre des générations par programme, de récupérer les images, et de contrôler tous les paramètres. C’est la base pour intégrer A1111 dans des pipelines automatisés, des bots Discord, des applications web, ou des scripts de batch processing. L’API est documentée automatiquement via Swagger à l’adresse /docs.
Gestion des modèles et Extra Networks
L’interface Extra Networks (icône sous le bouton Generate) fournit un navigateur visuel pour vos checkpoints, LoRAs, embeddings, et hypernetworks. Vous pouvez voir les thumbnails, trier par nom ou date, et cliquer pour insérer un LoRA ou un embedding directement dans le prompt. La vue en arbre permet d’organiser les modèles en sous-dossiers thématiques.
L’écosystème d’extensions
Les extensions sont le principal avantage concurrentiel d’A1111. L’onglet Extensions (dans Settings) permet d’installer des extensions depuis l’URL d’un dépôt Git ou depuis la liste intégrée. Voici les extensions les plus populaires et les plus utiles :
| Extension | Fonction | Indispensable ? |
|---|---|---|
| ControlNet | Conditionnement structurel (contours, profondeur, pose) | Oui |
| ADetailer (After Detailer) | Détection et correction automatique des visages/mains | Oui |
| Ultimate SD Upscale | Upscaling par tuiles avec diffusion | Recommandé |
| Regional Prompter | Appliquer des prompts différents par zone de l’image | Utile |
| Infinite Image Browsing | Galerie avancée pour naviguer dans les images générées | Recommandé |
| Civitai Helper | Télécharger des modèles depuis Civitai directement dans l’interface | Pratique |
| Dynamic Prompts | Wildcards et prompts aléatoires pour la variété | Utile |
| Roop / IP-Adapter | Transfert de visage ou de style depuis une image de référence | Cas par cas |
--disable-all-extensions au lancement) pour identifier la cause. Gardez une version stable qui fonctionne et ne mettez à jour que si vous avez besoin d’une nouvelle fonctionnalité.
Installation
Prérequis
Un GPU NVIDIA avec au moins 6 Go de VRAM (RTX 2060 ou supérieur). Python 3.10.6 (cette version spécifique est importante, les versions plus récentes causent des incompatibilités). Git pour cloner le dépôt et le maintenir à jour. Environ 10-15 Go d’espace disque pour l’installation de base, plus l’espace pour les modèles (2-7 Go par checkpoint).
Installation Windows
# 1. Installer Python 3.10.6 (cocher "Add Python to PATH")
# 2. Installer Git
# 3. Cloner le dépôt
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
# 4. Lancer (première exécution : 20-30 minutes)
cd stable-diffusion-webui
webui-user.batLa première exécution télécharge automatiquement les dépendances Python, PyTorch, et le modèle de base SD 1.5. L’interface s’ouvre ensuite dans votre navigateur à http://127.0.0.1:7860.
Installation Linux
# Dépendances système (Debian/Ubuntu)
sudo apt install wget git python3 python3-venv libgl1 libglib2.0-0
# Cloner et lancer
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui
bash webui.shInstallation macOS (Apple Silicon)
A1111 fonctionne sur les Mac M1/M2/M3/M4 via Metal. L’installation suit le même processus que Linux (webui.sh). Les performances sont correctes sur M1 Pro/Max et supérieures, mais inférieures aux GPU NVIDIA équivalents. Assurez-vous d’avoir installé PyTorch avec le support Metal.
Google Colab
Pour les utilisateurs sans GPU local, des notebooks Colab permettent d’exécuter A1111 gratuitement (GPU T4) ou avec un abonnement Pro (GPU A100/V100). Le notebook lance A1111 avec un tunnel Gradio accessible depuis n’importe quel navigateur.
venv et de relancer webui-user.bat / webui.sh. Cela résout environ 80% des problèmes d’installation en recréant l’environnement Python proprement.
AUTOMATIC1111 vs ComfyUI
C’est le débat central de la communauté Stable Diffusion. Les deux outils ont des philosophies différentes :
| Critère | AUTOMATIC1111 | ComfyUI |
|---|---|---|
| Interface | Formulaire web classique (onglets) | Nœuds visuels (graphe) |
| Prise en main | Rapide (minutes) | Longue (jours à semaines) |
| Vitesse | Standard | ~2× plus rapide sur workflows complexes |
| VRAM | Standard | ~2,5 Go de moins pour SDXL |
| Support FLUX | Non natif (Forge nécessaire) | Natif |
| Extensions | Écosystème mature et massif | 600+ custom nodes, en croissance |
| Documentation | Abondante (wiki, tutoriels, vidéos) | En croissance, plus technique |
| Reproductibilité | Bonne (PNG metadata) | Excellente (workflow JSON complet) |
| Recommandé pour | Débutants, usage quotidien, prototypage | Power users, automatisation, pipelines |
Le verdict : A1111 reste le meilleur choix pour la majorité des utilisateurs grâce à sa simplicité et son écosystème. Commencez par A1111 pour apprendre Stable Diffusion, puis migrez vers ComfyUI quand vous atteignez les limites de l’interface classique. Si vous avez besoin de FLUX ou de performances maximales dès le départ, préférez ComfyUI ou Forge.
Forge : le fork optimisé
Forge (Stable Diffusion WebUI Forge) est un fork d’A1111 créé par Lvmin Zhang, le créateur de ControlNet et Fooocus. Son objectif initial : améliorer les performances d’A1111 sans changer l’interface. Les gains sont significatifs : 30-75% de vitesse en plus selon le GPU, et un usage VRAM réduit qui permet aux GPU 6-8 Go de générer à des résolutions auparavant inaccessibles.
Forge a aussi ajouté le support de FLUX (août 2024), ce qu’A1111 ne supporte pas nativement. Pour les utilisateurs qui veulent rester dans l’écosystème A1111 (même interface, mêmes extensions) tout en bénéficiant de FLUX et de meilleures performances, Forge est le choix naturel.
Bonnes pratiques
Organisation des modèles
Les modèles sont stockés dans des sous-dossiers de models/ : Stable-diffusion/ pour les checkpoints, Lora/ pour les LoRAs, embeddings/ pour les Textual Inversions, VAE/ pour les VAE, ControlNet/ pour les modèles ControlNet. A1111 supporte les sous-dossiers dans chaque catégorie, ce qui permet de trier par style, architecture ou projet.
Arguments de ligne de commande utiles
Le fichier webui-user.bat (Windows) ou webui-user.sh (Linux/Mac) contient la variable COMMANDLINE_ARGS où vous pouvez ajouter des options : --medvram (réduit l’usage VRAM au prix d’une vitesse légèrement réduite), --lowvram (mode ultra-économe, beaucoup plus lent), --xformers (optimisations d’attention mémoire-efficiente, recommandé pour NVIDIA), --api (active l’API REST pour l’automatisation externe), --listen (rend l’interface accessible sur le réseau local).
Workflow efficace
Générez en batch (4-8 images) pour multiplier vos chances de trouver un bon résultat. Notez la seed des images que vous aimez pour les reproduire et les affiner. Utilisez X/Y/Z Plot pour comparer systématiquement les samplers, les steps ou les CFG. Envoyez les résultats prometteurs en img2img ou inpainting pour les affiner. Terminez par un upscale via Extras ou Hires Fix pour la résolution finale.
Problèmes courants
CUDA out of memory
Ajoutez --medvram ou --lowvram aux arguments de lancement. Réduisez la résolution ou le batch size. Assurez-vous qu’aucune autre application n’utilise le GPU. Activez --xformers pour réduire la consommation mémoire de l’attention.
Page blanche ou interface qui ne charge pas
Vérifiez la console pour les messages d’erreur. Le problème le plus fréquent est un conflit de version Python. Utilisez Python 3.10.6 spécifiquement. Si le problème persiste, supprimez le dossier venv et relancez.
Une extension casse l’interface
Lancez avec --disable-all-extensions pour vérifier que le problème vient d’une extension. Si c’est le cas, réactivez-les une par une pour identifier la coupable. Mettez à jour l’extension ou désinstallez-la.
Erreur « stable-diffusion repo not found »
Le dépôt Stability-AI/stablediffusion original a été supprimé ou rendu privé. La branche dev d’A1111 corrige ce problème en utilisant un fork communautaire. Clonez avec git clone -b dev ou mettez à jour votre installation existante vers la branche dev.
Questions fréquentes sur AUTOMATIC1111
AUTOMATIC1111 est-il gratuit ?
Oui, entièrement gratuit et open source (licence AGPL-3.0). Aucun abonnement, aucune limite de génération. Vous n’avez besoin que d’un GPU compatible et d’un espace disque suffisant pour les modèles. L’utilisation via Google Colab est aussi possible (gratuit avec un GPU T4, ou payant avec Colab Pro pour un GPU plus puissant).
AUTOMATIC1111 supporte-t-il FLUX ?
Non, pas nativement. A1111 supporte SD 1.x, SD 2.x et SDXL, mais pas FLUX ni SD 3.5. Pour utiliser FLUX avec une interface similaire à A1111, installez Forge (fork d’A1111 qui ajoute le support FLUX) ou ComfyUI (support natif de FLUX). Forge conserve la même interface qu’A1111, ce qui rend la transition transparente.
Quel GPU faut-il pour AUTOMATIC1111 ?
Un GPU NVIDIA avec 6 Go de VRAM minimum (RTX 2060 ou supérieur). 8-12 Go de VRAM est recommandé pour SDXL et les extensions gourmandes (ControlNet, ADetailer). Avec le flag --medvram, un GPU 4 Go peut fonctionner pour SD 1.5 à 512×512. Les GPU AMD sont supportés via ROCm (Linux) mais l’expérience est moins fluide. Apple Silicon fonctionne via Metal.
Comment migrer d’AUTOMATIC1111 vers ComfyUI ?
Vos modèles (checkpoints, LoRAs, embeddings, VAE) sont directement réutilisables : configurez le fichier extra_model_paths.yaml de ComfyUI pour pointer vers vos dossiers A1111. Pas besoin de copier les fichiers. L’apprentissage de l’interface nodale prend quelques jours à quelques semaines selon votre niveau technique. Commencez par les templates txt2img et img2img fournis avec ComfyUI.
Faut-il encore utiliser AUTOMATIC1111 en 2026 ?
A1111 reste pertinent pour les utilisateurs de SD 1.5 et SDXL qui veulent une interface simple et un écosystème d’extensions mature. Mais la tendance est claire : les utilisateurs avancés migrent vers ComfyUI (flexibilité, performances, FLUX natif) ou Forge (même interface qu’A1111 mais plus rapide et compatible FLUX). Si vous débutez en 2026, A1111 reste un excellent choix d’apprentissage. Si vous avez besoin de FLUX ou de performances optimales, privilégiez Forge ou ComfyUI.