Jan AI
Jan est une application desktop open source (Apache 2.0) qui fonctionne comme une alternative locale à ChatGPT. Elle permet de télécharger et exécuter des LLM 100 % hors ligne sur votre ordinateur, avec une interface de chat moderne, un hub de modèles intégré, un serveur API compatible OpenAI, et un système d’extensions (MCP) pour des capacités agentiques.
Jan se positionne comme une plateforme IA locale complète, pas simplement un lanceur de modèles. L’application combine une interface utilisateur soignée, un stockage entièrement local (conversations, modèles, paramètres), l’absence de télémétrie par défaut, et la possibilité de connecter des fournisseurs cloud (OpenAI, Anthropic, Mistral, Groq, etc.) quand vous en avez besoin. C’est le choix de prédilection des utilisateurs qui veulent une transparence totale sur ce que leur outil IA fait avec leurs données.
- Type
- Application desktop IA locale + plateforme agentique
- Version stable
- v0.7.8 (mars 2026)
- Plateformes
- macOS (Apple Silicon + Intel), Windows, Linux
- Moteur
- llama.cpp (via Cortex.cpp), support CUDA, Metal, Vulkan
- Format de modèle
- GGUF (local) + API cloud (OpenAI, Anthropic, Mistral, Groq, etc.)
- API
- Compatible OpenAI + Anthropic Messages API (
localhost:1337) - Assistants personnalisés
- Oui
- MCP
- Oui (host MCP pour outils et agents)
- Licence
- Apache 2.0
- URL
- jan.ai
Philosophie : privacy-first et open source
Jan stocke tout localement par défaut : modèles, historique de conversations, extensions, et paramètres. Aucune télémétrie n’est activée par défaut, aucun compte n’est requis, et aucune dépendance à un service cloud n’est nécessaire pour le fonctionnement de base. Pour les équipes qui opèrent sur des réseaux restreints ou air-gapped, c’est un avantage majeur.
Le code source est sous licence Apache 2.0, ce qui signifie que vous pouvez auditer, modifier, et redistribuer le code librement, y compris pour un usage commercial. C’est une distinction importante par rapport à LM Studio, qui est closed-source.
Installation et premiers pas
L’installation est simple : téléchargez l’installateur depuis jan.ai pour votre plateforme (Windows .exe, macOS .dmg, Linux .AppImage). L’application pèse environ 50 à 60 Mo. Au premier lancement, Jan propose le modèle Jan V3 comme point de départ recommandé, avec un onboarding simplifié depuis la v0.7.4.
Vous pouvez aussi construire Jan depuis les sources :
git clone https://github.com/janhq/jan
cd jan
make dev # Lancement en mode développement
make build # Build de production
Pour un déploiement serveur (équipes, auto-hébergement), Jan propose Jan Server, une plateforme microservices déployable via Docker :
git clone https://github.com/janhq/server
cd server && make quickstart
Fonctionnalités principales
Interface de chat
L’interface de chat a été entièrement repensée dans la v0.7.6 pour une expérience unifiée. Elle inclut une boîte de recherche pour naviguer rapidement entre les conversations, le support des pièces jointes (fichiers, images), et la possibilité de saisir un nouveau message pendant qu’une réponse est en cours de génération. Les conversations sont stockées localement et votre contexte se maintient entre les sessions.
Hub de modèles
Jan intègre un hub de modèles qui permet de parcourir et télécharger des modèles GGUF depuis Hugging Face Hub. Les modèles supportés incluent Llama 3.1/3.2, DeepSeek-R1, Qwen 3, Gemma 3, Mistral, gpt-oss, et bien d’autres. Vous pouvez aussi importer vos propres fichiers GGUF manuellement.
Jan propose aussi ses propres modèles : Jan V3 (optimisé pour les maths, le coding, et les interactions rapides) et Jan VL (modèle vision pour le chat avec images).
Intégration cloud
En plus des modèles locaux, Jan permet de connecter des fournisseurs cloud via leurs clés API : OpenAI (GPT-4), Anthropic (Claude), Mistral, Groq, MiniMax, Azure, OpenRouter, et d’autres. Cela permet de basculer entre local et cloud selon le besoin, dans la même interface. L’intérêt principal est la flexibilité : utilisez un modèle local pour les données sensibles, et un modèle cloud pour les tâches qui nécessitent un modèle plus puissant. La configuration se fait dans les paramètres, en ajoutant simplement une clé API pour chaque fournisseur.
Assistants personnalisés
Jan permet de créer des assistants IA spécialisés qui mémorisent le contexte et les préférences de l’utilisateur. Vous pouvez configurer des system prompts, des paramètres d’inférence, et des comportements spécifiques pour chaque assistant. C’est utile pour créer des workflows dédiés (assistant de rédaction, assistant code, assistant recherche).
MCP (Model Context Protocol)
Jan fonctionne comme un host MCP, permettant aux modèles d’interagir avec des outils et services externes via le protocole standardisé MCP. Concrètement, vous pouvez connecter Jan à Notion, Google Sheets, des APIs personnalisées, des bases de données, et d’autres outils sans intégration custom.
La v0.7.3 a introduit Jan Browser MCP, un outil d’automatisation de navigateur qui permet aux modèles de chercher et extraire des informations du web. Combiné avec le MCP, Jan se transforme en agent capable d’exécuter des tâches multi-étapes.
Serveur API
Jan expose un serveur API local sur localhost:1337, compatible avec le format OpenAI. Depuis la v0.7.6, le proxy llama.cpp supporte aussi le format Anthropic Messages API, permettant d’utiliser des workflows Claude-compatibles avec des modèles locaux. Ce serveur peut être utilisé par des outils comme Continue.dev, Cline, ou toute application compatible OpenAI.
Projects (v0.7.0+)
La fonctionnalité Projects permet d’organiser vos conversations et vos assistants par projet, avec un contexte partagé. Vous pouvez aussi renommer les modèles pour une meilleure lisibilité et consulter des statistiques d’utilisation par modèle.
Auto Optimize
La fonctionnalité expérimentale Auto Optimize ajuste automatiquement les paramètres llama.cpp en fonction de votre matériel, sans configuration manuelle. C’est l’équivalent de la détection automatique de matériel d’Ollama, mais dans un contexte GUI.
Jan Server : déploiement pour les équipes
Jan Server est une plateforme microservices distincte de l’application desktop, conçue pour les équipes et organisations qui veulent déployer leur propre infrastructure IA. Elle inclut :
API compatible OpenAI : drop-in replacement pour les endpoints OpenAI.
Response API : orchestration multi-étapes pour les workflows agentiques complexes.
Intégration MCP : recherche web, exécution de code, et outils personnalisés.
Authentification entreprise : OAuth/OIDC via Keycloak avec support d’accès invité.
Observabilité complète : OpenTelemetry, Prometheus, Jaeger, et Grafana intégrés.
Gestion des médias : intégration S3 pour les fichiers et pièces jointes.
Le déploiement se fait via Docker Compose en quelques minutes. C’est une solution sérieuse pour les organisations qui veulent un ChatGPT privé auto-hébergé avec contrôle total.
Jan Desktop est aussi disponible en Docker pour un usage individuel, avec des volumes montés pour persister les modèles et conversations entre les mises à jour. Cette approche est populaire pour rendre Jan accessible depuis n’importe quel appareil sur le réseau local, tout en gardant les données centralisées sur un serveur dédié.
Cas d’usage
ChatGPT privé pour une équipe. C’est le cas d’usage principal de Jan. Déployez Jan Server via Docker, connectez-le à vos modèles locaux ou cloud, et offrez à votre équipe une interface de chat IA sans qu’aucune donnée ne quitte vos serveurs. L’authentification OAuth/OIDC et l’observabilité intégrée (Prometheus, Grafana) en font une solution prête pour l’entreprise.
Environnements air-gapped et réglementés. Pour les organisations soumises au RGPD, HIPAA, ou des réglementations de résidence des données, Jan élimine le risque d’envoi de données vers des serveurs tiers. L’inférence locale garantit que les prompts et les réponses ne quittent jamais le périmètre contrôlé.
Automatisation agentique locale. Grâce au support MCP, Jan peut orchestrer des workflows multi-étapes : rechercher sur le web (Browser MCP), interroger des bases de données, lire des fichiers, et exécuter du code. Combiné avec un modèle performant en tool calling (Qwen 3, gpt-oss), Jan devient un agent autonome fonctionnant sur votre machine.
Évaluation et comparaison de modèles. L’intégration simultanée de modèles locaux et cloud permet de comparer directement les résultats. Testez un Llama 3.1 8B local contre Claude ou GPT-4 sur vos propres prompts, dans la même interface, pour décider quel modèle convient à votre cas d’usage.
Développement d’applications IA. Le serveur API compatible OpenAI + Anthropic sur localhost:1337 permet d’intégrer Jan comme backend dans vos applications. Les SDKs et l’API standardisée signifient que vous pouvez développer contre l’API OpenAI, tester en local avec Jan, et basculer vers le cloud en production (ou l’inverse) sans changer une ligne de code.
Éducation et apprentissage. Jan est gratuit, open source, et fonctionne hors ligne. Pour les étudiants, chercheurs, et curieux qui veulent expérimenter avec les LLM sans budget cloud, c’est un point d’entrée accessible. La GUI élimine la barrière du terminal.
Matériel et performances
Jan utilise llama.cpp comme moteur d’inférence, via son propre wrapper Cortex.cpp. Les performances sont donc identiques à celles d’Ollama et LM Studio sur le même matériel, puisque le moteur sous-jacent est le même.
Configuration minimum : 8 Go de RAM pour les modèles 3-4B en Q4. 16 Go recommandés pour les modèles 7-8B.
Configuration idéale : 32 Go de RAM ou un GPU avec 12+ Go de VRAM. Un MacBook Pro Apple Silicon avec 36 Go fait tourner confortablement des modèles 32B.
Accélération GPU : NVIDIA via CUDA, AMD via ROCm (Linux) et Vulkan, Apple Silicon via Metal. Jan détecte automatiquement le matériel et utilise le backend approprié.
Repères de vitesse : pour un modèle 8B en Q4_K_M, comptez environ 8-15 tok/s sur CPU moderne, 30-50+ tok/s sur Apple Silicon M2+, et 60-100+ tok/s sur GPU NVIDIA récent. Au-dessus de 15 tok/s, l’expérience de chat est fluide. En dessous de 8 tok/s, la latence devient perceptible.
Jan vs Ollama vs LM Studio
| Critère | Jan | Ollama | LM Studio |
|---|---|---|---|
| Interface | GUI complète + serveur | CLI + API uniquement | GUI complète + CLI |
| Open source | Oui (Apache 2.0) | Oui (MIT) | Non (propriétaire) |
| Modèles cloud | Oui (OpenAI, Anthropic, Mistral, Groq, etc.) | Oui (:cloud) | Non |
| MCP / Agents | Oui (MCP host + Browser MCP) | OpenClaw, ollama launch | MCP client |
| Assistants personnalisés | Oui (avec mémoire de contexte) | Modelfiles | Via system prompts |
| API serveur | OpenAI + Anthropic (:1337) |
OpenAI + Anthropic (:11434) |
OpenAI (:1234) |
| Déploiement équipe | Jan Server (Docker, auth, observabilité) | Docker (basique) | llmster (headless) |
| Docker | Oui (desktop + server) | Oui (image officielle) | Non |
| Extensions / plugins | Oui (système d’extensions) | Plugins OpenClaw | Non |
| Public cible | Privacy-first, équipes, agents | Développeurs, CI/CD, agents | Exploration, non-développeurs |
Support multimodal
Jan supporte les modèles multimodaux (vision) depuis les versions récentes. Vous pouvez envoyer des images dans le chat, et les modèles compatibles (Gemma 3, Qwen 2.5 VL, Llama 3.2 Vision, Jan VL) les analysent directement. Le support inclut l’OCR (reconnaissance de texte dans les images), l’interprétation de graphiques et captures d’écran, et la description d’images. Les résultats multimodaux des outils MCP sont aussi supportés, ce qui signifie qu’un agent peut analyser visuellement le résultat d’une action.
Internationalisation
Jan supporte l’internationalisation avec plusieurs langues d’interface (anglais, chinois, japonais, français, et d’autres via des contributions communautaires). C’est un avantage pour les équipes non-anglophones qui déploient Jan en interne. Les contributions de traduction sont acceptées sur le repo GitHub.
Limites
Maturité variable des fonctionnalités. Jan évolue vite (v0.7.x en mars 2026), mais certaines fonctionnalités comme le MCP, l’Auto Optimize, et les Projects sont encore relativement récentes. Attendez-vous à des bugs occasionnels sur les fonctionnalités les plus nouvelles.
Performances identiques à Ollama/LM Studio. Les trois outils utilisent llama.cpp sous le capot. L’écart de performance entre eux est négligeable sur le même matériel et la même quantification. Le choix entre Jan, Ollama, et LM Studio se fait sur l’expérience utilisateur, l’écosystème d’extensions, et les besoins de déploiement, pas sur la vitesse d’inférence brute.
Format GGUF principalement. Comme ses concurrents, Jan charge principalement des modèles GGUF pour l’inférence locale. Les modèles GPTQ ou AWQ en SafeTensors ne sont pas supportés.
Matériel requis identique. Un modèle 7B en Q4_K_M nécessite environ 4 à 5 Go de RAM/VRAM, quel que soit l’outil. La recommandation minimum de 16 Go de RAM s’applique pour une utilisation confortable.
Questions fréquentes sur Jan AI
Jan est-il gratuit ?
Oui, entièrement. Jan est open source sous licence Apache 2.0. Aucun abonnement, aucun compte requis. Vous pouvez utiliser, modifier, et redistribuer le code, y compris pour un usage commercial.
Jan collecte-t-il des données ?
Non, par défaut. Jan n’active aucune télémétrie par défaut et ne nécessite aucun compte. Toutes les données (conversations, modèles, paramètres) sont stockées localement sur votre machine. Si vous connectez un fournisseur cloud (OpenAI, Anthropic), les prompts envoyés à ces API passent par leurs serveurs, mais Jan lui-même n’intercepte ni ne stocke rien côté cloud.
Quelle est la différence entre Jan Desktop et Jan Server ?
Jan Desktop est l’application individuelle avec interface graphique. Jan Server est une plateforme microservices déployable via Docker, conçue pour les équipes : elle ajoute l’authentification (OAuth/OIDC), l’observabilité (Prometheus, Grafana), la gestion des fichiers (S3), et une API de réponse multi-étapes pour les workflows agentiques. Les deux partagent le même moteur d’inférence.
Jan peut-il utiliser des modèles cloud en plus du local ?
Oui. Jan permet de connecter des fournisseurs cloud (OpenAI, Anthropic Claude, Mistral, Groq, MiniMax, Azure, OpenRouter) via leurs clés API. Vous pouvez basculer entre un modèle local et un modèle cloud dans la même conversation. C’est utile pour comparer les résultats ou utiliser un modèle cloud pour les tâches complexes et un modèle local pour la confidentialité.
Jan fonctionne-t-il hors connexion ?
Oui, à 100 %. Une fois qu’un modèle local est téléchargé, Jan fonctionne entièrement hors ligne. Aucune connexion internet n’est nécessaire pour l’inférence locale. C’est idéal pour les environnements air-gapped, les déplacements, ou toute situation où la connectivité est limitée ou la confidentialité est critique.