LangChain
LangChain est un framework open source (Python et JavaScript) conçu pour construire des applications et des agents IA alimentés par des modèles de langage (LLM), en fournissant des abstractions standardisées pour connecter les modèles à des outils, des données et des APIs.
En pratique, LangChain est le « tissu connectif » entre un LLM (GPT-5.4, Claude Opus 4.6, Gemini, Mistral, etc.) et le monde réel. Vous voulez que votre IA consulte une base de données, fasse une recherche web, appelle une API, et génère un rapport structuré ? LangChain fournit les briques pour assembler tout cela sans repartir de zéro à chaque projet. Avec plus de 90 millions de téléchargements mensuels (combiné avec LangGraph) et 118 000+ stars sur GitHub, c’est le framework d’IA le plus utilisé au monde.
- Catégorie
- Framework open source pour agents IA et applications LLM
- Fondateur
- Harrison Chase, 2022
- Entreprise
- LangChain Inc., San Francisco (licorne, valorisation 1,25 milliard $)
- Financement
- 260 M$ au total (Series B : 125 M$, oct. 2025, mené par IVP)
- Langages
- Python (langchain), JavaScript/TypeScript (LangChain.js)
- GitHub
- 118 000+ stars, 19 400+ forks
- Intégrations
- 1 000+ (modèles, outils, vector stores, retrievers)
- Version actuelle
- langchain 1.0.3 / langchain-core 1.2.19 (mars 2026)
- Écosystème
- LangChain (framework) + LangGraph (orchestration) + LangSmith (observabilité) + LangServe (déploiement)
- Licence
- MIT
- Verdict
- Le framework de référence pour construire des agents IA en production. Indispensable pour les équipes qui veulent itérer vite avec un maximum d’intégrations
- URL
- langchain.com
De wrapper LLM à plateforme d’agents
LangChain a démarré fin 2022 comme un projet personnel de Harrison Chase, alors ingénieur ML. Le problème qu’il cherchait à résoudre était simple : les LLM de l’époque pouvaient générer du texte, mais ne savaient ni chercher sur le web, ni appeler des APIs, ni interagir avec des bases de données. Chase a construit les premières abstractions pour combler ce fossé.
Le projet est devenu viral. En avril 2023, Benchmark menait un seed de 10 M$. Une semaine plus tard, Sequoia Capital menait un Series A de 25 M$ à une valorisation de 200 M$. En octobre 2025, LangChain bouclait un Series B de 125 M$ mené par IVP (avec CapitalG, Sapphire Ventures, Sequoia, Benchmark), atteignant une valorisation de 1,25 milliard de dollars et le statut de licorne. 35 % des entreprises du Fortune 500 utilisent les produits LangChain.
Depuis, le framework a radicalement évolué. La version 1.0 (sortie fin 2025) a été entièrement réécrite pour se concentrer sur la construction d’agents IA, avec des architectures pré-construites (comme create_agent), un système de middleware, et une intégration native avec LangGraph pour l’orchestration.
Architecture et composants
L’écosystème LangChain se compose de quatre couches complémentaires :
LangChain (le framework)
C’est la bibliothèque principale. Elle fournit :
Modèles de chat : une interface unifiée pour tous les fournisseurs de LLM. Vous initialisez un modèle avec init_chat_model("openai:gpt-5.4") ou init_chat_model("anthropic:claude-opus-4-6"), et vous changez de fournisseur en modifiant une seule ligne. Depuis la version récente, les modèles exposent leurs capacités via un attribut .profile (données issues de models.dev), ce qui permet à votre code de s’adapter automatiquement aux fonctionnalités supportées.
Outils et toolkits : LangChain intègre 1 000+ outils (recherche web, calculatrices, APIs, bases de données, systèmes de fichiers) que vos agents peuvent utiliser. Le pattern function calling / tool use est supporté nativement.
Prompt templates : des modèles de prompts structurés avec gestion des variables, des messages système, et du formatage conditionnel. Les ChatPromptTemplate gèrent les conversations multi-tours avec messages système, utilisateur et assistant.
Output parsers : extraction et validation des sorties LLM en données structurées (Pydantic, JSON, listes, etc.).
Middleware : un système de hooks composables pour étendre le comportement des agents sans réécrire la logique centrale. Vous pouvez ajouter du human-in-the-loop, de la compression de conversation, de la modération de contenu, ou du retry automatique via des middleware empilables.
LangGraph (orchestration d’agents)
LangGraph est le framework d’orchestration bas-niveau pour les agents complexes. Il représente l’état de l’agent comme un dictionnaire typé qui circule dans un graphe orienté. Les nœuds lisent et écrivent l’état, les arêtes sont conditionnelles. C’est LangGraph qui fournit la persistance (checkpointing), le time travel (retour à un état précédent), le human-in-the-loop, et l’exécution durable pour les tâches longues.
Depuis la version v2 (mars 2026), LangGraph propose un streaming type-safe et un invoke type-safe avec coercion automatique vers vos modèles Pydantic ou dataclass. LangChain 1.0 tourne nativement sur le runtime de LangGraph.
LangSmith (observabilité et évaluation)
LangSmith est la plateforme commerciale de LangChain pour l’observabilité, l’évaluation et le déploiement d’agents. Elle capture automatiquement les traces de chaque exécution (appels LLM, utilisations d’outils, étapes de chaîne) et les présente dans une timeline structurée pour le débogage. LangSmith propose aussi :
Un Insights Agent qui analyse automatiquement vos traces pour détecter les patterns de comportement, les modes de défaillance et les anomalies. Un Agent Builder (no-code) qui permet de construire des agents en langage naturel, avec sélection automatique de prompt, outils, sous-agents et compétences. Un système d’évaluation avec datasets, scoring automatisé et humain, et comparaison d’expériences côte à côte.
LangSmith n’est pas gratuit pour un usage intensif. Le plan Developer offre 5 000 traces/mois gratuites. Le plan Plus coûte 39 $/utilisateur/mois avec 100 000 traces incluses (au-delà : 0,50 $/1 000 traces). L’Enterprise est sur devis (self-hosted disponible, HIPAA, SOC 2 Type II).
LangServe et déploiement
LangServe convertit n’importe quelle application LangChain en serveur FastAPI avec une seule ligne de code, générant automatiquement les endpoints REST et la documentation. LangSmith Deployment (anciennement LangGraph Cloud) permet de déployer et scaler des agents avec persistance, threads conversationnels, et checkpointing durable sur une infrastructure managée.
Intégrations
LangChain se distingue par l’étendue de son écosystème d’intégrations (1 000+), organisé en catégories :
Fournisseurs de modèles : OpenAI (GPT-5.4, o3), Anthropic (Claude Opus 4.6, Sonnet 4.6), Google (Gemini 3.1), Mistral, Cohere, Hugging Face, Ollama (modèles locaux), et des dizaines d’autres. L’API Responses d’OpenAI est supportée nativement avec désactivation optionnelle de la rétention de données.
Vector stores : Pinecone, Weaviate, Qdrant, Chroma, FAISS, pgvector, Milvus, et plus. C’est la base du RAG (Retrieval-Augmented Generation).
Outils : recherche web (Tavily, SerpAPI, Brave Search), navigateurs (Playwright, Selenium), bases de données (SQL, MongoDB), APIs (GitHub, Jira, Slack, Gmail), calculatrices, systèmes de fichiers, etc.
Document loaders : PDF, Word, HTML, CSV, JSON, Notion, Google Drive, S3, et plus. Ces loaders découpent les documents en chunks via des text splitters configurables (récursif, par tokens, par sentences).
Sandboxes : depuis février 2026, LangChain propose des packages d’intégration pour des sandboxes d’exécution sécurisées (langchain-modal, langchain-daytona, langchain-runloop), permettant aux agents d’exécuter du code dans des environnements isolés.
Construire un agent avec LangChain
Depuis la version 1.0, LangChain propose create_agent, une fonction qui crée un agent basé sur le pattern ReAct (Reasoning + Acting) sur le runtime durable de LangGraph. Voici le flux typique :
1. Initialiser le modèle : choisissez votre fournisseur via init_chat_model(). Changez de modèle à tout moment sans réécrire votre code.
2. Définir les outils : créez ou importez les outils que l’agent peut utiliser (recherche web, accès base de données, appel API, etc.).
3. Créer l’agent : create_agent(model, tools, system_prompt) instancie un agent avec persistance, streaming, et human-in-the-loop intégrés.
4. Ajouter des middleware : empiler des couches de comportement (compression de conversation pour les longues sessions, modération de contenu, retry automatique avec backoff exponentiel, etc.) sans modifier la logique de l’agent.
5. Déployer : via LangServe (FastAPI) ou LangSmith Deployment pour un agent en production avec scaling automatique.
.profile. Votre code peut automatiquement détecter si un modèle supporte le structured output, le function calling, le streaming, etc. C’est particulièrement utile quand vous construisez des agents qui doivent fonctionner avec différents fournisseurs de modèles.
RAG avec LangChain
Le RAG (Retrieval-Augmented Generation) reste l’un des cas d’usage principaux. LangChain fournit toute la chaîne : document loaders pour ingérer vos données, text splitters pour les découper, embeddings pour les vectoriser, vector stores pour les stocker, et retrievers pour les rechercher. Le tout s’intègre dans un agent qui combine recherche documentaire et génération augmentée.
Par rapport à LlamaIndex (l’autre grand framework RAG), LangChain offre plus de flexibilité dans l’assemblage des composants, mais demande plus de code pour atteindre le même résultat. LlamaIndex a plus de stratégies de chunking et d’index pré-construites. Le choix dépend de votre priorité : contrôle fin (LangChain) ou productivité RAG out-of-the-box (LlamaIndex).
Deep Agents
Depuis février 2026, LangChain propose « Deep Agents » (deepagents), un package qui permet de construire des agents capables d’exécuter des tâches complexes dans des sandboxes isolées. La version 0.4 (février 2026) ajoute la prise en charge de sandboxes pluggables (Modal, Daytona, Runloop), la résumation automatique de l’historique de conversation (déclenchée quand le modèle lève une ContextOverflowError), et le support par défaut de l’API Responses d’OpenAI pour les modèles préfixés « openai: ».
Les Deep Agents représentent l’évolution vers des agents plus autonomes, capables de raisonner sur de longues périodes, d’exécuter du code, et de s’adapter aux erreurs, le tout dans des environnements sécurisés et isolés.
L’écosystème complet
| Produit | Rôle | Licence / Prix |
|---|---|---|
| LangChain (Python/JS) | Framework : modèles, outils, prompts, agents pré-construits | MIT |
| LangGraph | Orchestration : graphes d’état, persistance, human-in-the-loop | MIT |
| LangSmith | Observabilité : traces, évaluation, Agent Builder, déploiement | Free (5K traces) / Plus 39 $/user/mois / Enterprise sur devis |
| LangServe | Déploiement API : transformation en FastAPI server | MIT |
| LangChain Academy | Formation : cours gratuits sur LangChain, LangGraph, LangSmith | Gratuit |
Forces et faiblesses
| Forces | Faiblesses |
|---|---|
| Plus grand écosystème d’intégrations IA (1 000+ composants) | Historique de breaking changes fréquents entre versions (amélioré avec 1.0) |
| Interopérabilité modèle : changez de fournisseur en une ligne | Couche d’abstraction parfois opaque pour le débogage |
| LangGraph pour orchestration avancée (état, persistance, checkpointing) | Courbe d’apprentissage significative (nombreux concepts à maîtriser) |
| LangSmith pour observabilité et évaluation en production | LangSmith payant pour un usage sérieux (39 $/user/mois) |
| Communauté massive (118K GitHub stars, 90M téléchargements/mois) | Documentation parfois en retard sur les dernières API |
| Système de middleware composable (1.0) | Plus verbeux que LlamaIndex pour le RAG simple |
| Adopté par 35 % du Fortune 500 | Dépendance potentielle à l’écosystème LangChain (lock-in subtil) |
LangChain vs. alternatives
LangChain vs. LlamaIndex
LlamaIndex excelle sur le RAG pur : plus de stratégies de chunking, d’index, et de recherche hybride pré-construites, avec moins de code. LangChain excelle sur les agents complexes : orchestration d’état via LangGraph, middleware, persistance, human-in-the-loop. En pratique, les deux se complètent : certaines équipes utilisent LlamaIndex pour le pipeline RAG et LangChain/LangGraph pour l’orchestration de l’agent qui consomme ce pipeline.
LangChain vs. Semantic Kernel
Semantic Kernel est le framework IA de Microsoft. Il est plus intégré à l’écosystème Azure/Microsoft (C#, .NET, Azure OpenAI) et adopte une approche plus structurée (plugins, planners). LangChain est plus flexible, plus riche en intégrations, et domine l’écosystème Python. Si votre stack est Microsoft, Semantic Kernel s’intègre mieux. Sinon, LangChain offre plus de choix.
LangChain vs. CrewAI
CrewAI se spécialise dans les systèmes multi-agents avec des rôles définis (chercheur, rédacteur, réviseur). C’est plus simple d’utilisation pour les cas multi-agents classiques. LangChain/LangGraph offre plus de contrôle bas-niveau mais demande plus de code. CrewAI est d’ailleurs souvent utilisé en combinaison avec LangChain pour les intégrations.
| Critère | LangChain | LlamaIndex | Semantic Kernel | CrewAI |
|---|---|---|---|---|
| Focus principal | Agents IA généralistes | RAG et recherche documentaire | Intégration écosystème Microsoft | Systèmes multi-agents à rôles |
| Langages | Python, JS/TS | Python, JS/TS | C#, Python, Java | Python |
| Intégrations | 1 000+ | ~300+ | ~100+ | Via LangChain |
| Orchestration | LangGraph (graphes d’état) | Workflows (depuis 2025) | Planners + Plugins | Crew process (séquentiel/hiérarchique) |
| Observabilité | LangSmith (intégré) | Langfuse, Arize | Azure Monitor | Via LangSmith ou Langfuse |
| Licence | MIT | MIT | MIT | MIT |
Prise en main rapide
Installation :
Premier agent en quelques lignes :
Pour ajouter des outils (recherche web, calculatrice, accès à une base de données), importez les toolkits correspondants et passez-les à create_agent. Le pattern ReAct gère automatiquement le cycle raisonnement-action-observation.
Activer LangSmith (optionnel) : définissez une variable d’environnement LANGSMITH_API_KEY et toutes vos exécutions sont automatiquement tracées, sans aucune modification de code. C’est ce qui rend l’intégration LangChain/LangSmith si fluide.
Cas d’usage en production
Agents conversationnels augmentés : Un chatbot qui ne se contente pas de générer du texte, mais qui peut chercher dans votre base de connaissances (RAG), appeler des APIs internes, et exécuter des actions (créer un ticket, envoyer un email, mettre à jour un CRM). C’est le cas d’usage le plus courant.
Automatisation de workflows métier : Des agents qui traitent des commandes (C.H. Robinson automatise 5 500 commandes/jour avec LangSmith), génèrent des rapports, analysent des documents juridiques (Harvey), ou orchestrent des pipelines de données.
Assistants de code : Analyse de codebase, génération de tests unitaires, revue de code automatisée, documentation. LangChain permet de combiner l’analyse statique avec la compréhension sémantique du LLM.
Extraction et transformation de données : Remote a construit un agent d’exécution de code qui sépare le raisonnement (LLM) de l’exécution (Python) pour convertir des données employés et paie multi-format en JSON validé.
Verdict
LangChain est le framework de référence pour construire des agents IA en Python (et en JavaScript via LangChain.js). Son écosystème de 1 000+ intégrations, l’orchestration avancée de LangGraph, et l’observabilité de LangSmith en font la stack la plus complète du marché pour passer d’un prototype à un agent en production.
La version 1.0 a corrigé le principal reproche historique (breaking changes fréquents) en promettant la stabilité jusqu’à la version 2.0. Le système de middleware et les model profiles montrent une maturité croissante dans la conception du framework.
Cela dit, LangChain n’est pas toujours le bon choix. Pour un pipeline RAG simple, LlamaIndex est plus rapide à mettre en place. Pour un système multi-agents avec rôles définis, CrewAI est plus direct. Et si vous n’avez besoin que d’appeler un LLM avec du function calling basique, le SDK natif d’OpenAI ou d’Anthropic suffit.
Notre recommandation : utilisez LangChain si vous construisez un agent qui doit interagir avec de multiples outils et sources de données, si vous avez besoin d’interopérabilité entre fournisseurs de modèles, ou si vous voulez bénéficier de l’observabilité LangSmith pour le débogage en production. Passez-vous-en si votre cas d’usage est simple et bien couvert par le SDK natif de votre fournisseur.
Questions fréquentes sur LangChain
LangChain est-il gratuit ?
Le framework LangChain (Python et JavaScript) est entièrement gratuit et open source sous licence MIT. LangGraph est aussi open source et gratuit. LangSmith, la plateforme d’observabilité et d’évaluation, propose un plan gratuit (5 000 traces/mois, rétention 14 jours) suffisant pour le développement. Les plans payants démarrent à 39 $/utilisateur/mois (Plus, 100 000 traces incluses). Vous pouvez utiliser LangChain et LangGraph sans jamais payer quoi que ce soit. LangSmith est optionnel mais fortement recommandé pour la production.
Quelle est la différence entre LangChain et LangGraph ?
LangChain est le framework de haut niveau : il fournit les abstractions pour les modèles, outils, prompts, et agents pré-construits. LangGraph est le moteur d’orchestration bas-niveau : il permet de définir des graphes d’état complexes avec persistance, checkpointing, time travel, et human-in-the-loop. Depuis LangChain 1.0, le framework tourne nativement sur le runtime de LangGraph. En pratique, vous utilisez LangChain pour l’interface (modèles, outils) et LangGraph pour le flux de contrôle de votre agent.
LangChain ou LlamaIndex pour le RAG ?
Pour un pipeline RAG standard (ingestion de documents, vectorisation, recherche, génération), LlamaIndex est plus rapide à mettre en place grâce à ses abstractions de plus haut niveau (chunking hiérarchique, recherche hybride BM25 + vectorielle pré-intégrés). LangChain offre plus de flexibilité dans l’assemblage des composants mais demande plus de code. Si votre RAG alimente un agent complexe qui fait aussi du function calling, de l’orchestration multi-étapes, et du human-in-the-loop, LangChain/LangGraph est le meilleur choix car il gère l’ensemble du cycle de vie de l’agent.
LangChain est-il adapté à la production ?
Oui, avec des nuances. La version 1.0 marque un tournant en termes de stabilité (plus de breaking changes prévus avant 2.0). LangGraph fournit l’exécution durable, le checkpointing, et la gestion d’état nécessaires pour les agents en production. LangSmith offre l’observabilité et l’évaluation indispensables pour monitorer et améliorer un agent déployé. Le framework a un historique de changements fréquents qui a frustré des équipes en production, mais la version 1.0 vise à résoudre ce problème. Des entreprises comme Replit, Clay, Harvey, Rippling, Cloudflare et Cisco utilisent LangChain en production. Si vous déployez LangChain, épinglez vos versions, écrivez des tests de contrat, et utilisez LangSmith pour détecter les régressions.
Faut-il utiliser LangChain ou le SDK natif d’OpenAI/Anthropic ?
Si votre application appelle un seul fournisseur de modèle, fait du function calling simple, et n’a pas besoin d’orchestration complexe, le SDK natif suffit et ajouter LangChain serait une surcouche inutile. Utilisez LangChain quand vous avez besoin d’interopérabilité entre fournisseurs (changer de modèle en une ligne), d’intégrations multiples (vector stores, outils, document loaders), d’orchestration d’agents complexes (LangGraph), ou d’observabilité en production (LangSmith). C’est un outil puissant, mais pas indispensable pour tous les cas d’usage.