MetaGPT

MetaGPT est un framework open source de méta-programmation multi-agents qui simule une entreprise logicielle complète en assignant des rôles spécialisés (product manager, architecte, chef de projet, ingénieur) à des agents IA qui collaborent selon des procédures opérationnelles standardisées (SOPs).

La promesse est radicale : vous donnez un requirement en une seule ligne (« Crée un jeu 2048 »), et MetaGPT produit des user stories, une analyse concurrentielle, un cahier des charges, des structures de données, des APIs, de la documentation, et du code exécutable. La philosophie centrale est résumée par la formule Code = SOP(Team) : le code est le résultat direct de procédures opérationnelles standardisées appliquées par une équipe coordonnée d’agents IA. C’est l’un des projets IA les plus populaires sur GitHub avec ~59 000 stars, et le papier de recherche a été accepté en présentation orale (top 1,2 %) à ICLR 2024.

Catégorie: Framework open source multi-agents pour la génération logicielle
Développeur: DeepWisdom (Shenzhen, Chine), fondé par Chenglin Wu
Langage: Python (>=3.9)
GitHub: ~59 000 stars (MetaGPT seul). Foundation Agents (organisation) : 150 000+ stars cumulées
Financement: ~220 M RMB (~31 M$, deux tours en 2025 : Ant Group, Cathay Capital, Baidu Ventures, etc.)
Produit commercial: MGX (MetaGPT X) → rebaptisé Atoms (janvier 2026) : plateforme de vibe coding
Publication: ICLR 2024 (oral, top 1,2 %, #1 catégorie LLM-based Agent). AFlow : ICLR 2025 (oral, top 1,8 %)
Licence: MIT
Verdict: Le framework multi-agents le plus ambitieux pour la génération logicielle end-to-end. Plus orienté recherche que production enterprise par rapport à CrewAI
URL: deepwisdom.ai/metagpt

La philosophie : Code = SOP(Team)

Le problème que MetaGPT cherche à résoudre est précis : les systèmes multi-agents basés sur des conversations libres entre LLM produisent des résultats incohérents à cause des hallucinations en cascade. Quand un agent génère une erreur, l’agent suivant la propage et l’amplifie, créant un effet boule de neige qui dégrade la qualité du résultat final.

La solution de MetaGPT : encoder des procédures opérationnelles standardisées (SOPs) humaines dans les séquences de prompts des agents. Au lieu de laisser les agents discuter librement, MetaGPT structure leur collaboration comme une chaîne de montage. Chaque agent a un rôle défini, des inputs attendus, des outputs standardisés, et des critères de validation. L’agent « Product Manager » produit un PRD (Product Requirements Document). L’agent « Architecte » le transforme en design technique. L’agent « Chef de projet » en extrait les tâches. L’agent « Ingénieur » code les fonctionnalités. Chaque étape vérifie les résultats intermédiaires pour réduire les erreurs.

Ce paradigme de « ligne d’assemblage » distingue MetaGPT des frameworks multi-agents conversationnels comme AutoGen (conversations libres entre agents) ou CrewAI (rôles avec objectifs, mais collaboration plus flexible).

Architecture et rôles

Les rôles pré-définis

MetaGPT inclut des agents pré-configurés qui simulent les rôles d’une entreprise logicielle :

Product Manager : analyse le requirement, génère des user stories, une analyse concurrentielle, et un PRD structuré. Architect : conçoit l’architecture technique, les structures de données, les APIs, et les diagrammes de séquence (via Mermaid). Project Manager : décompose le design en tâches concrètes et planifie l’exécution. Engineer : code les fonctionnalités en suivant les spécifications, avec génération de tests. QA Engineer : teste le code et remonte les bugs pour correction.

Chaque rôle produit des artefacts structurés (documents, diagrammes, code) qui servent d’input au rôle suivant. Cette chaîne de production est ce qui rend MetaGPT plus déterministe que les frameworks multi-agents conversationnels : les outputs intermédiaires sont vérifiables et corrigeables.

Actions et environnement

Chaque rôle exécute des Actions (fonctions spécialisées) et interagit avec un Environnement partagé. L’environnement gère la communication entre agents via un système de publication/souscription (les agents s’abonnent à des « tags » pour recevoir les messages pertinents). Ce système évite les conversations en boucle et garantit que chaque agent ne reçoit que les informations nécessaires à son travail.

Data Interpreter

Le Data Interpreter est un agent autonome puissant intégré à MetaGPT depuis la v0.7. Il utilise des notebooks Jupyter, un navigateur web, un shell, Stable Diffusion, et des outils personnalisés pour résoudre des tâches complexes. Il a atteint des scores state-of-the-art en machine learning, raisonnement mathématique et tâches ouvertes. Il peut analyser des actions boursières, imiter des sites web, entraîner des modèles ML, et déboguer son propre code de manière autonome.

RAG intégré

MetaGPT intègre un module RAG depuis la v0.8, avec des fonctionnalités d’indexation, de retrieval et de re-ranking. Cela permet aux agents d’accéder à des bases de connaissances documentaires pendant leur travail, améliorant la pertinence des spécifications et du code généré. Par exemple, un agent « Product Manager » peut consulter des documents de spécifications existants, des rapports de marché, ou des guidelines internes avant de rédiger son PRD.

Multi-modalité et vision

MetaGPT a intégré la multi-modalité dès la v0.7, avec un agent de vision basé sur GPT-4V. Cet agent peut analyser des captures d’écran, des maquettes UI, des diagrammes, et des images pour enrichir le contexte de développement. Combiné avec les agents de code, cela permet des workflows comme « voici une capture d’écran d’un design, reproduis-le en code » ou « analyse cette architecture en diagramme et propose des améliorations ».

Développement incrémental

Depuis la v0.5, MetaGPT supporte le développement incrémental : au lieu de générer un projet from scratch à chaque prompt, vous pouvez itérer sur un projet existant en ajoutant des fonctionnalités, en corrigeant des bugs, ou en refactorant du code. Le framework maintient le contexte du projet entre les itérations, ce qui le rapproche d’un véritable workflow de développement logiciel avec versioning.

Cas d’usage concrets

Génération de projets complets : Le cas d’usage phare. Vous décrivez un projet (« Crée un système de recommandation type Toutiao ») et MetaGPT produit les spécifications, l’architecture, le code, et les tests. Le résultat est un repository structuré avec tous les fichiers nécessaires.

Analyse de données autonome : Le Data Interpreter analyse des datasets (sklearn, pandas, fichiers CSV), entraîne des modèles ML, génère des visualisations, et produit des rapports. Il excelle particulièrement pour le prototypage de pipelines d’analyse de données.

Prototypage d’applications web : Via Atoms (ex-MGX), création rapide d’applications web fonctionnelles (dashboards, formulaires, outils internes) avec backend, authentification et déploiement intégrés.

Recherche et rédaction automatisée : Des agents multi-rôles (chercheur, rédacteur, éditeur) produisent des rapports de recherche, des articles techniques, ou des analyses concurrentielles en collaborant via les SOPs.

Imitation de sites web : Le Data Interpreter peut analyser un site web existant et en reproduire la structure et le design, ce qui accélère le prototypage de landing pages et d’interfaces.

De MGX à Atoms : la commercialisation

En février 2025, DeepWisdom a lancé MGX (MetaGPT X), une plateforme de programmation en langage naturel basée sur MetaGPT. MGX est devenu #1 Product of the Day et Product of the Week sur Product Hunt. Sans budget marketing, la plateforme a atteint 500 000 utilisateurs enregistrés en un mois et dépassé 1 M$ d’ARR (revenu récurrent annuel) uniquement par le bouche-à-oreille de la communauté.

En janvier 2026, DeepWisdom a rebaptisé MGX en Atoms, avec un repositionnement vers le vibe coding commercial. Contrairement aux concurrents qui génèrent des « jouets » (selon le CEO Wu Chenglin), Atoms intègre des systèmes complets de login, base de données, authentification utilisateur, déploiement, et paiement. L’objectif est de livrer un site web prêt à mettre en production en 5 minutes.

DeepWisdom revendique que Atoms atteint des résultats supérieurs de 45 % aux concurrents (Lovable, Replit) avec seulement 20 % du coût. Ces chiffres sont des revendications du fournisseur et n’ont pas été vérifiés de manière indépendante.

DeepWisdom a levé environ 220 millions de RMB (~31 M$) lors de deux tours de financement en 2025, avec Ant Group, Cathay Capital, Jinqiu Capital, Baidu Ventures, et d’autres investisseurs. C’est le plus gros financement dans le segment des Coding Agents en Chine. L’entreprise compte environ 82 employés et se positionne à l’intersection de la recherche académique et de la commercialisation. Avant de se concentrer sur la commercialisation, DeepWisdom fonctionnait davantage comme un laboratoire universitaire : publication de papiers, code accessible à tous les membres, et séminaires réguliers sur le Self-play et les Reward Models.

La trajectoire de DeepWisdom illustre un pattern émergent dans l’IA : des projets open source de recherche qui accumulent une communauté massive, puis commercialisent leur technologie via des produits SaaS. MetaGPT (framework open source, 59K stars) a donné naissance à MGX/Atoms (produit commercial, 500K+ utilisateurs), tout comme LangChain (framework open source, 118K stars) a donné naissance à LangSmith (plateforme commerciale).

Impact académique

MetaGPT est l’un des projets multi-agents les plus cités dans la littérature académique :

MetaGPT (ICLR 2024) : papier principal accepté en présentation orale (top 1,2 %), #1 dans la catégorie LLM-based Agent. Il formalise l’approche SOP pour la collaboration multi-agents et démontre des résultats supérieurs aux systèmes multi-agents conversationnels sur les benchmarks d’ingénierie logicielle collaborative.

AFlow (ICLR 2025) : automatisation de la génération de workflows agentiques, accepté en présentation orale (top 1,8 %), #2 dans la catégorie LLM-based Agent.

SPO (Self-Supervised Prompt Optimization) et AOT (Atom of Thoughts) : deux papiers de recherche introduits en février 2025, explorant respectivement l’optimisation auto-supervisée de prompts et le raisonnement par « atomes de pensée » pour le scaling au moment de l’inférence.

L’organisation open source Foundation Agents (qui héberge MetaGPT et d’autres projets comme OpenManus) cumule plus de 150 000 stars sur GitHub.

MetaGPT vs. alternatives

Critère	MetaGPT	CrewAI	AutoGen
Approche	SOPs + chaîne de montage	Rôles + collaboration flexible	Conversations entre agents
Focus	Génération logicielle end-to-end	Multi-agents généralistes	Recherche + multi-agents
Déterminisme	Élevé (outputs structurés vérifiables)	Moyen (autonomie des agents)	Variable (conversations libres)
GitHub Stars	~59 000	45 900+	50 400+
Produit commercial	Atoms (vibe coding)	CrewAI AMP	Microsoft Agent Framework
Enterprise	Limité (orienté recherche)	SOC2, SSO, FedRAMP	Azure, SSO, SLA
Licence	MIT	MIT	MIT

MetaGPT excelle dans la génération logicielle structurée grâce à ses SOPs. Pour les cas d’usage multi-agents généralistes (support client, analyse de données, automatisation métier), CrewAI est plus flexible et mieux outillé pour la production. Pour l’orchestration d’agents avec contrôle fin, LangGraph reste la référence.

Prise en main

pip install –upgrade metagpt
metagpt –init-config  # Crée ~/.metagpt/config2.yaml

Configurez votre clé API dans ~/.metagpt/config2.yaml (OpenAI, Azure, Ollama, Groq, ou autre fournisseur), puis lancez :

from metagpt.software_company import generate_repo
from metagpt.utils.project_repo import ProjectRepo

repo: ProjectRepo = generate_repo(« Crée un jeu 2048 »)
print(repo)  # Affiche la structure du repo avec les fichiers générés

MetaGPT génère un projet complet : spécifications, architecture, code, et tests. Le coût API est d’environ 0,20 $ pour une analyse avec design (GPT-4) et environ 2 $ pour un projet complet. MetaGPT est aussi disponible via Docker pour une installation isolée.

Pour le Data Interpreter (analyse de données autonome) :

import asyncio
from metagpt.roles.di.data_interpreter import DataInterpreter

async def main():
    di = DataInterpreter()
    await di.run(« Analyse le dataset Iris de sklearn, inclus un graphique »)

asyncio.run(main())

LLMs supportés MetaGPT supporte OpenAI (GPT-4, GPT-5.4), Azure OpenAI, Anthropic (Claude), Ollama (modèles locaux), Groq, DashScope (Alibaba), QianFan (Baidu), Yi, et d’autres. Depuis la v0.7, vous pouvez assigner des LLM différents à chaque rôle pour optimiser le rapport coût/qualité.

Forces et faiblesses

Forces	Faiblesses
Génération logicielle end-to-end en une commande	Orienté recherche, moins mature pour la production enterprise que CrewAI
SOPs qui réduisent les hallucinations en cascade	Coûts API élevés pour les projets complets (~2 $ par projet GPT-4)
Data Interpreter state-of-the-art	Qualité du code généré variable selon la complexité du projet
~59 000 GitHub stars, publications ICLR top-tier	Documentation principalement en anglais/chinois, moins accessible
Multi-LLM (assigner des modèles différents par rôle)	Moins d’intégrations d’outils que CrewAI ou LangChain
RAG intégré, multi-modalité (vision agent GPT-4V)	Communauté plus petite que LangChain ou CrewAI en Occident
Atoms (vibe coding) pour la commercialisation	Écosystème centré sur la Chine (DeepWisdom, Shenzhen)

Verdict

MetaGPT est le framework multi-agents le plus ambitieux pour la génération logicielle automatisée. Son approche SOP, où des agents IA jouent les rôles d’une entreprise logicielle complète, produit des résultats structurés et vérifiables qui surpassent les approches conversationnelles libres sur les benchmarks académiques.

Pour les développeurs et chercheurs qui veulent explorer la programmation en langage naturel, MetaGPT (framework) et Atoms (plateforme commerciale) sont des outils fascinants. Le Data Interpreter est particulièrement impressionnant pour l’analyse de données et le prototypage ML. L’impact académique du projet (deux papiers ICLR en oral, top 1-2 %) confère une crédibilité scientifique que peu de frameworks concurrents peuvent revendiquer.

Pour les équipes enterprise qui ont besoin d’agents multi-agents fiables en production avec observabilité, sécurité et support, CrewAI ou LangGraph sont des choix plus matures et mieux outillés. MetaGPT excelle comme outil de prototypage rapide, comme moteur de génération logicielle, et comme plateforme de recherche sur les systèmes multi-agents, mais ses fonctionnalités enterprise (gouvernance, tracing, RBAC, compliance) sont moins développées que chez les concurrents orientés production.

Questions fréquentes sur MetaGPT

MetaGPT est-il gratuit ?

Le framework open source MetaGPT est entièrement gratuit sous licence MIT. Vous payez uniquement les API LLM que vous utilisez (environ 0,20 $ pour une analyse simple avec GPT-4, ~2 $ pour un projet complet). Atoms (ex-MGX), le produit commercial de DeepWisdom, propose un plan gratuit et des plans payants pour un usage plus intensif.

Quelle est la différence entre MetaGPT et CrewAI ?

MetaGPT encode des procédures opérationnelles standardisées (SOPs) dans une chaîne de montage structurée, ce qui réduit les hallucinations et produit des résultats plus déterministes. CrewAI donne plus d’autonomie aux agents avec des rôles et objectifs flexibles, ce qui le rend plus adapté aux cas multi-agents variés (pas seulement le développement logiciel). MetaGPT est plus orienté recherche et génération de code. CrewAI est plus orienté production enterprise avec un écosystème d’outils plus riche.

Qu’est-ce que MGX / Atoms ?

MGX (MetaGPT X) est le produit commercial lancé par DeepWisdom en février 2025, basé sur le framework MetaGPT. C’est une plateforme de programmation en langage naturel (vibe coding) qui permet de créer des applications complètes par prompt, sans écrire de code. En janvier 2026, MGX a été rebaptisé Atoms avec un positionnement vers la création d’applications commerciales prêtes à la production (avec login, base de données, authentification, paiement intégrés). Atoms revendique 500 000+ utilisateurs et plus de 10 000 applications générées par jour.

MetaGPT peut-il utiliser d’autres modèles que GPT-4 ?

Oui. Depuis la v0.7, MetaGPT supporte de multiples LLMs : OpenAI (GPT-4, GPT-5.4), Anthropic (Claude), Azure OpenAI, Ollama (modèles locaux), Groq, DashScope (Alibaba), QianFan (Baidu), Yi, et d’autres via des interfaces compatibles OpenAI. Vous pouvez aussi assigner des modèles différents à chaque rôle pour optimiser le rapport coût/qualité (un modèle économique pour le Product Manager, un modèle premium pour l’Ingénieur).

MetaGPT est-il adapté à la production ?

Pour le prototypage rapide et la génération de MVPs, oui. Pour les déploiements enterprise à grande échelle, MetaGPT est moins outillé que CrewAI (SOC2, SSO, RBAC, tracing) ou le Microsoft Agent Framework (Azure, SLA). La qualité du code généré varie selon la complexité du projet, et une revue humaine reste nécessaire avant tout déploiement en production. Le Data Interpreter est fiable pour l’analyse de données et le ML automatisé.