Flux : guide complet du générateur d’images IA open source

Flux est une famille de modèles de génération d’images développée par Black Forest Labs, fondée par les créateurs de Stable Diffusion. FLUX.2, le modèle flagship de 32 milliards de paramètres, produit des images photoréalistes jusqu’à 4 mégapixels avec un rendu de texte précis et une cohérence d’identité entre images.

Quand Robin Rombach, Andreas Blattmann et Patrick Esser ont quitté Stability AI pour fonder Black Forest Labs (BFL) en 2024, ils ont emporté l’expertise qui avait fait de Stable Diffusion le modèle open source de référence. Le résultat : Flux, une nouvelle génération de modèles qui surpasse Stable Diffusion sur quasiment tous les critères. La famille Flux combine des modèles open-weight (exécutables localement, gratuitement) et des modèles propriétaires accessibles via API. Que vous soyez développeur, artiste, marketeur ou simplement curieux, ce guide couvre tout ce que vous devez savoir pour démarrer avec Flux.

Développeur: Black Forest Labs (Freiburg, Allemagne)
Fondateurs: Robin Rombach, Andreas Blattmann, Patrick Esser (ex-Stability AI / créateurs de Stable Diffusion)
Architecture: Rectified Flow Transformer (latent flow matching)
Modèles: FLUX.1 (schnell, dev, pro) | FLUX.1 Kontext | FLUX.2 (klein, dev, max, pro)
Paramètres: 12B (FLUX.1) à 32B (FLUX.2)
Résolution max: 4 mégapixels (FLUX.2)
Financement: Series B de 300 M$ (décembre 2025)
Prix API: À partir de 0,014 $/image (klein) | 1 crédit = 0,01 $
URL: bfl.ai

La famille de modèles Flux

Flux n’est pas un modèle unique mais une famille complète, chaque variante ciblant un cas d’usage différent. Voici la cartographie complète.

FLUX.1 : la première génération

Lancée en août 2024, la série FLUX.1 a immédiatement rivalisé avec Midjourney V6 et DALL-E 3 sur les benchmarks de fidélité au prompt et de photoréalisme.

Modèle	Params	Licence	Cas d’usage	Points forts
FLUX.1 [schnell]	12B	Apache 2.0 (open source)	Prototypage rapide, usage local	1 à 4 steps, très rapide, gratuit
FLUX.1 [dev]	12B	Non-commercial (open-weight)	Recherche, art, workflows custom	Qualité proche de Pro, fine-tunable, LoRA
FLUX.1 [pro]	12B	Propriétaire (API)	Production commerciale	Meilleure qualité FLUX.1, modes Ultra et Raw

FLUX.1 [schnell] (« rapide » en allemand) est le modèle à tester en premier. Sous licence Apache 2.0, il est totalement gratuit pour un usage personnel et commercial. Il génère des images en 1 à 4 étapes d’inférence, ce qui le rend extrêmement rapide. La qualité est inférieure à Pro mais largement suffisante pour du prototypage et des usages courants.

FLUX.1 [dev] est le modèle de la communauté. Open-weight mais sous licence non-commerciale (sauf achat de licence commerciale à 999 $/mois), il offre une qualité proche de Pro tout en étant fine-tunable. C’est le modèle de choix pour créer des LoRA custom, expérimenter avec ControlNet ou développer des workflows ComfyUI avancés.

FLUX.1 [pro] est le modèle premium, accessible uniquement via API. Il inclut le mode Ultra (résolution jusqu’à 4 mégapixels) et le mode Raw (photoréalisme style photographie candide). C’est la référence qualité de la première génération.

FLUX.1 Kontext : l’édition contextuelle

Lancé en mai 2025, Kontext est la suite d’outils d’édition d’images de BFL. Contrairement aux modèles text-to-image classiques, Kontext permet de modifier des images existantes avec des instructions en langage naturel.

Kontext [pro] : équilibre qualité/vitesse, peut référencer des images existantes pour maintenir la cohérence.
Kontext [max] : qualité maximale, édition itérative d’images avec préservation d’identité.
Kontext [dev] : open-weight (non-commercial), pour la recherche et les workflows custom.

Cas d’usage typiques : changer le fond d’une photo produit, modifier les vêtements d’un personnage tout en gardant son visage identique, adapter un visuel marketing pour différents marchés. En septembre 2025, Adobe a intégré Kontext Pro dans l’outil Generative Fill de Photoshop (beta).

FLUX.2 : la nouvelle référence

Annoncé en novembre 2025, FLUX.2 est un saut générationnel. L’architecture combine un modèle vision-langage basé sur Mistral-3 (24B paramètres) avec un rectified flow transformer, pour un total de 32 milliards de paramètres.

Modèle	Params	Licence	Cas d’usage	Points forts
FLUX.2 [klein]	Variable	Apache 2.0 / open-weight	Temps réel, interactif	Inférence sub-seconde, fine-tunable, dès 0,014 $/image
FLUX.2 [dev]	32B	Non-commercial (open-weight)	Recherche, workflows avancés	Qualité FLUX.2 complète, JSON prompting
FLUX.2 [max]	32B	Propriétaire (API)	Édition multi-référence, production haut de gamme	Jusqu’à 10 images de référence simultanées
FLUX.2 [pro]	32B	Propriétaire (API)	Production commerciale à grande échelle	4 MP, texte précis, cohérence d’identité, multi-référence

Les améliorations clés de FLUX.2 par rapport à FLUX.1 :

Photoréalisme amélioré : éclairage réaliste, ombres, reflets, profondeur de champ. Les mains, visages, tissus et petits objets sont rendus avec une précision accrue.
Multi-référence : FLUX.2 peut prendre jusqu’à 10 images de référence simultanément pour maintenir la cohérence d’identité, de produit et de style entre les générations. Les 6 premières images reçoivent un traitement haute-fidélité.
Rendu de texte : les polices, logos et textes dans les images sont nettement plus lisibles et précis qu’avec FLUX.1.
JSON prompting : possibilité de structurer les prompts en JSON pour un contrôle plus précis sur la composition.
Compréhension multilingue : FLUX.2 comprend les prompts dans plusieurs langues, y compris le français.

VRAM requise pour FLUX.2 Le modèle FLUX.2 complet nécessite 90 Go de VRAM, ce qui le met hors de portée des GPU grand public. En mode lowVRAM, il faut encore 64 Go. La version FP8 quantifiée (collaboration BFL + NVIDIA) réduit les besoins de 40 % (≈ 38 Go en lowVRAM) et est disponible dans ComfyUI. Pour un usage local accessible, FLUX.2 [klein] ou FLUX.1 [schnell/dev] sont les options réalistes sur des GPU de 12 à 24 Go.

Comment utiliser Flux

Option 1 : le Playground BFL (en ligne, gratuit pour tester)

Le moyen le plus simple de tester Flux. Rendez-vous sur bfl.ai, créez un compte, et accédez au Playground. Vous pouvez tester les différents modèles (FLUX.2, Kontext, FLUX.1) directement dans votre navigateur sans rien installer. Le Playground utilise le système de crédits BFL (1 crédit = 0,01 $). Des crédits gratuits sont offerts à l’inscription pour les premiers tests.

Option 2 : l’API BFL (production)

Pour intégrer Flux dans vos applications, l’API BFL est le chemin direct. L’intégration est simple : REST API avec clé d’authentification, réponse en base64 ou URL d’image. La tarification est au crédit (1 crédit = 0,01 $), avec un coût par image variable selon le modèle et la résolution.

Tarifs API indicatifs (1 crédit = 0,01 $) :

FLUX.2 [klein] : à partir de 1,4 crédit/image (0,014 $)
FLUX.2 [pro/max] : tarification au mégapixel (coût croissant avec la résolution)
FLUX.1 Kontext [pro] : par image, avec coût supplémentaire pour les images batch
FLUX.1 [pro] : environ 4-5 crédits/image (0,04-0,05 $)

Les alternatives API tierces (Replicate, Fal.ai, Cloudflare Workers AI) hébergent aussi les modèles Flux, parfois à des prix compétitifs. FLUX.1 [dev] coûte environ 0,025 $ par image sur Replicate.

Option 3 : exécution locale (gratuit)

C’est l’avantage majeur de Flux par rapport à Midjourney : vous pouvez exécuter les modèles open-weight localement, gratuitement, sur votre propre GPU. Les deux interfaces les plus utilisées :

ComfyUI : l’interface de choix pour les workflows avancés. BFL collabore directement avec ComfyUI pour fournir des templates FLUX.2 optimisés. ComfyUI gère le weight streaming (chargement progressif du modèle en RAM), ce qui permet de faire tourner FLUX.2 en FP8 sur des GPU avec 24 Go de VRAM.

Automatic1111 / Forge : compatible avec les modèles FLUX.1, mais le support FLUX.2 est moins mature que sur ComfyUI. Forge (fork optimisé d’Automatic1111) offre un meilleur support mémoire.

Pour l’installation locale détaillée, consultez notre page Flux installation.

GPU recommandés

Modèle Flux	VRAM minimum	GPU recommandé	Temps/image (estimé)
FLUX.1 [schnell]	≈ 8-12 Go	RTX 3060 12 Go, RTX 4060 Ti 16 Go	5-15 sec
FLUX.1 [dev]	≈ 12-16 Go	RTX 4070 Ti 16 Go, RTX 3090 24 Go	15-30 sec
FLUX.2 [klein] (FP8)	≈ 12 Go	RTX 4060 Ti 16 Go	Sub-seconde à quelques secondes
FLUX.2 [dev] (FP8)	≈ 24 Go	RTX 4090 24 Go	15-45 sec
FLUX.2 complet	≈ 64-90 Go	A100 80 Go, multi-GPU	Variable

Fine-tuning et LoRA

L’un des avantages majeurs de Flux sur les modèles fermés (Midjourney, DALL-E) est la possibilité de fine-tuner les modèles open-weight.

LoRA (Low-Rank Adaptation) est la méthode la plus utilisée. Vous entraînez un petit adaptateur (quelques Mo) sur vos propres images pour spécialiser le modèle dans un style, un personnage ou un type de contenu spécifique. Le LoRA se charge ensuite par-dessus le modèle de base sans le modifier. L’écosystème de LoRA pour Flux est actif : des milliers de LoRA communautaires sont disponibles sur Hugging Face et CivitAI.

BFL propose aussi une API de fine-tuning pour Flux Pro, permettant de personnaliser le modèle propriétaire via API sans avoir à gérer l’infrastructure GPU. Cette API est payante et cible les entreprises qui veulent un modèle adapté à leur marque ou leurs produits.

Cas d’usage du fine-tuning : générer des photos produit cohérentes pour un e-commerce, créer un personnage récurrent pour une série d’illustrations, reproduire un style artistique spécifique, générer des mockups architecturaux dans un style défini.

Flux face à la concurrence

Critère	Flux (FLUX.2)	Midjourney V6/V7	DALL-E (OpenAI)	Stable Diffusion XL
Open source / local	Oui (schnell, klein, dev)	Non	Non	Oui
Photoréalisme	Excellent	Excellent	Très bon	Bon
Rendu de texte	Très bon (FLUX.2)	Correct	Bon	Faible
Fine-tuning / LoRA	Oui (dev, klein)	Non	Non	Oui
Multi-référence	Oui (jusqu’à 10 images)	Limité (–sref)	Non	Via ControlNet
Prix API/image	Dès 0,014 $	Abonnement (10-120 $/mois)	Inclus ChatGPT / API séparée	Gratuit (local)
Édition d’images	Oui (Kontext, Fill, Depth, Canny)	Limité (inpainting basique)	Oui (DALL-E editor)	Oui (ControlNet, inpainting)

Verdict rapide : Flux est le meilleur choix pour les utilisateurs qui veulent combiner qualité professionnelle et contrôle total (exécution locale, fine-tuning, intégration API). Midjourney reste supérieur pour les artistes qui veulent le meilleur rendu esthétique sans se soucier de l’infrastructure technique. SDXL est dépassé par Flux sur quasiment tous les critères. Pour un comparatif détaillé, consultez notre page Flux vs SDXL.

Cas d’usage

E-commerce et produits. La multi-référence de FLUX.2 permet de photographier un produit une fois, puis de générer des dizaines de variantes (fonds différents, éclairages, mises en scène) tout en préservant l’identité visuelle du produit. C’est un gain de temps et de coût considérable face à des séances photo traditionnelles.

Marketing et publicité. Flux génère des visuels publicitaires de qualité professionnelle à une fraction du coût d’une production classique. Le support multilingue de FLUX.2 permet de créer des visuels avec du texte intégré dans différentes langues pour des campagnes internationales.

Art et illustration. L’écosystème LoRA et la compatibilité ComfyUI font de Flux un outil de choix pour les artistes numériques. Vous pouvez développer un style personnel via fine-tuning, construire des workflows reproductibles et itérer rapidement sur des concepts.

Développement et intégration. L’API BFL et la disponibilité sur Replicate, Fal.ai et Cloudflare Workers AI permettent d’intégrer Flux dans n’importe quelle application. Les développeurs l’utilisent pour des éditeurs d’images, des générateurs de contenu, des outils de design automatisé et des pipelines de production visuelle.

Limites et points faibles

VRAM gourmande. FLUX.2 complet (32B paramètres) est extrêmement exigeant en VRAM. La version FP8 quantifiée a rendu le modèle accessible sur des GPU 24 Go, mais la qualité full-precision nécessite des GPU professionnels (A100, H100).

Éthique des données d’entraînement. BFL n’a pas divulgué les données exactes utilisées pour entraîner Flux. Ars Technica et d’autres sources suspectent que le modèle a été entraîné sur un large corpus d’images collectées sur Internet, une pratique controversée qui soulève des questions de droit d’auteur similaires à celles de Stable Diffusion.

Licence Dev complexe. FLUX.1 [dev] et FLUX.2 [dev] sont sous licence non-commerciale. Pour un usage commercial, vous devez soit passer par l’API (modèles Pro), soit acheter une licence commerciale à 999 $/mois (incluant 100 000 images). Cette dualité open-weight / licence commerciale peut prêter à confusion.

Génération de visages réalistes. Flux génère des visages très réalistes, ce qui soulève des préoccupations concernant les deepfakes et la désinformation. BFL a été critiqué pour le manque de garde-fous dans les modèles open-source.

Questions fréquentes sur Flux

Flux est-il gratuit ?

Partiellement. FLUX.1 [schnell] est entièrement gratuit et open source (Apache 2.0), utilisable localement pour un usage personnel et commercial. FLUX.2 [klein] est aussi disponible sous Apache 2.0. Les modèles [dev] sont open-weight mais sous licence non-commerciale (licence commerciale à 999 $/mois). Les modèles [pro] et [max] sont accessibles uniquement via API payante (à partir de 0,014 $/image pour klein, 0,04-0,05 $ pour FLUX.1 Pro).

Quel GPU faut-il pour faire tourner Flux localement ?

Pour FLUX.1 [schnell], un GPU avec 8 à 12 Go de VRAM suffit (RTX 3060, RTX 4060 Ti). Pour FLUX.1 [dev], comptez 12 à 16 Go (RTX 4070 Ti, RTX 3090). Pour FLUX.2 en FP8, il faut au minimum 24 Go (RTX 4090). Le modèle FLUX.2 complet nécessite 64 à 90 Go de VRAM (GPU professionnels uniquement). ComfyUI avec weight streaming est l’interface recommandée pour optimiser l’utilisation mémoire.

Flux est-il meilleur que Midjourney ?

Ça dépend du critère. Flux surpasse Midjourney sur le rendu de texte dans les images, la multi-référence (jusqu’à 10 images), le fine-tuning (LoRA) et l’accessibilité (exécution locale gratuite, API pay-per-use). Midjourney conserve un avantage esthétique sur certains styles artistiques et offre une expérience plus simple (pas d’installation). Pour les développeurs et les utilisateurs techniques, Flux est le meilleur choix. Pour les artistes qui veulent un résultat beau sans effort technique, Midjourney reste pertinent.

Quelle est la différence entre FLUX.1 et FLUX.2 ?

FLUX.2 est un saut générationnel. Il passe de 12B à 32B paramètres, intègre un modèle vision-langage Mistral-3 (24B), supporte la multi-référence (jusqu’à 10 images), améliore significativement le photoréalisme (éclairage, ombres, textures) et le rendu de texte, et ajoute le JSON prompting pour un contrôle structuré. FLUX.2 est plus exigeant en VRAM (64-90 Go complet, 24 Go en FP8) que FLUX.1 (12-16 Go). Pour un usage local sur GPU grand public, FLUX.1 [dev] ou FLUX.2 [klein] sont les options les plus réalistes.

Peut-on utiliser Flux pour un usage commercial ?

Oui, via plusieurs chemins. FLUX.1 [schnell] et FLUX.2 [klein] sont sous Apache 2.0 et libres pour tout usage commercial. Les modèles [pro] et [max] via API incluent les droits commerciaux dans le prix. Les modèles [dev] nécessitent l’achat d’une licence commerciale à 999 $/mois (incluant 100 000 images) pour un usage commercial en auto-hébergement. Pour la plupart des usages commerciaux, l’API BFL (pay-per-image) est le chemin le plus simple.