Jan AI

Jan est une application desktop open source (Apache 2.0) qui fonctionne comme une alternative locale à ChatGPT. Elle permet de télécharger et exécuter des LLM 100 % hors ligne sur votre ordinateur, avec une interface de chat moderne, un hub de modèles intégré, un serveur API compatible OpenAI, et un système d’extensions (MCP) pour des capacités agentiques.

Jan se positionne comme une plateforme IA locale complète, pas simplement un lanceur de modèles. L’application combine une interface utilisateur soignée, un stockage entièrement local (conversations, modèles, paramètres), l’absence de télémétrie par défaut, et la possibilité de connecter des fournisseurs cloud (OpenAI, Anthropic, Mistral, Groq, etc.) quand vous en avez besoin. C’est le choix de prédilection des utilisateurs qui veulent une transparence totale sur ce que leur outil IA fait avec leurs données.

Type: Application desktop IA locale + plateforme agentique
Version stable: v0.7.8 (mars 2026)
Plateformes: macOS (Apple Silicon + Intel), Windows, Linux
Moteur: llama.cpp (via Cortex.cpp), support CUDA, Metal, Vulkan
Format de modèle: GGUF (local) + API cloud (OpenAI, Anthropic, Mistral, Groq, etc.)
API: Compatible OpenAI + Anthropic Messages API (localhost:1337)
Assistants personnalisés: Oui
MCP: Oui (host MCP pour outils et agents)
Licence: Apache 2.0
URL: jan.ai

Philosophie : privacy-first et open source

Jan stocke tout localement par défaut : modèles, historique de conversations, extensions, et paramètres. Aucune télémétrie n’est activée par défaut, aucun compte n’est requis, et aucune dépendance à un service cloud n’est nécessaire pour le fonctionnement de base. Pour les équipes qui opèrent sur des réseaux restreints ou air-gapped, c’est un avantage majeur.

Le code source est sous licence Apache 2.0, ce qui signifie que vous pouvez auditer, modifier, et redistribuer le code librement, y compris pour un usage commercial. C’est une distinction importante par rapport à LM Studio, qui est closed-source.

Changement de licence Jan était initialement sous licence AGPL v3. Le projet est passé à Apache 2.0, une licence plus permissive qui facilite l’intégration dans des projets commerciaux sans obligation de publier le code source des applications dérivées. Les anciennes forks peuvent encore référencer l’AGPL.

Installation et premiers pas

L’installation est simple : téléchargez l’installateur depuis jan.ai pour votre plateforme (Windows .exe, macOS .dmg, Linux .AppImage). L’application pèse environ 50 à 60 Mo. Au premier lancement, Jan propose le modèle Jan V3 comme point de départ recommandé, avec un onboarding simplifié depuis la v0.7.4.

Vous pouvez aussi construire Jan depuis les sources :

git clone https://github.com/janhq/jan
cd jan
make dev   # Lancement en mode développement
make build # Build de production

Pour un déploiement serveur (équipes, auto-hébergement), Jan propose Jan Server, une plateforme microservices déployable via Docker :

git clone https://github.com/janhq/server
cd server && make quickstart

Fonctionnalités principales

Interface de chat

L’interface de chat a été entièrement repensée dans la v0.7.6 pour une expérience unifiée. Elle inclut une boîte de recherche pour naviguer rapidement entre les conversations, le support des pièces jointes (fichiers, images), et la possibilité de saisir un nouveau message pendant qu’une réponse est en cours de génération. Les conversations sont stockées localement et votre contexte se maintient entre les sessions.

Hub de modèles

Jan intègre un hub de modèles qui permet de parcourir et télécharger des modèles GGUF depuis Hugging Face Hub. Les modèles supportés incluent Llama 3.1/3.2, DeepSeek-R1, Qwen 3, Gemma 3, Mistral, gpt-oss, et bien d’autres. Vous pouvez aussi importer vos propres fichiers GGUF manuellement.

Jan propose aussi ses propres modèles : Jan V3 (optimisé pour les maths, le coding, et les interactions rapides) et Jan VL (modèle vision pour le chat avec images).

Intégration cloud

En plus des modèles locaux, Jan permet de connecter des fournisseurs cloud via leurs clés API : OpenAI (GPT-4), Anthropic (Claude), Mistral, Groq, MiniMax, Azure, OpenRouter, et d’autres. Cela permet de basculer entre local et cloud selon le besoin, dans la même interface. L’intérêt principal est la flexibilité : utilisez un modèle local pour les données sensibles, et un modèle cloud pour les tâches qui nécessitent un modèle plus puissant. La configuration se fait dans les paramètres, en ajoutant simplement une clé API pour chaque fournisseur.

Assistants personnalisés

Jan permet de créer des assistants IA spécialisés qui mémorisent le contexte et les préférences de l’utilisateur. Vous pouvez configurer des system prompts, des paramètres d’inférence, et des comportements spécifiques pour chaque assistant. C’est utile pour créer des workflows dédiés (assistant de rédaction, assistant code, assistant recherche).

MCP (Model Context Protocol)

Jan fonctionne comme un host MCP, permettant aux modèles d’interagir avec des outils et services externes via le protocole standardisé MCP. Concrètement, vous pouvez connecter Jan à Notion, Google Sheets, des APIs personnalisées, des bases de données, et d’autres outils sans intégration custom.

La v0.7.3 a introduit Jan Browser MCP, un outil d’automatisation de navigateur qui permet aux modèles de chercher et extraire des informations du web. Combiné avec le MCP, Jan se transforme en agent capable d’exécuter des tâches multi-étapes.

Compatibilité MCP et modèles Tous les modèles locaux ne sont pas performants en tool calling et MCP. Vérifiez que le modèle choisi supporte les fonctionnalités d’appel d’outils avant de l’utiliser dans des workflows MCP. Les modèles cloud (Claude, GPT-4) ont généralement un meilleur support, tandis que pour le local, les modèles récents comme Qwen 3 ou gpt-oss sont recommandés.

Serveur API

Jan expose un serveur API local sur localhost:1337, compatible avec le format OpenAI. Depuis la v0.7.6, le proxy llama.cpp supporte aussi le format Anthropic Messages API, permettant d’utiliser des workflows Claude-compatibles avec des modèles locaux. Ce serveur peut être utilisé par des outils comme Continue.dev, Cline, ou toute application compatible OpenAI.

Projects (v0.7.0+)

La fonctionnalité Projects permet d’organiser vos conversations et vos assistants par projet, avec un contexte partagé. Vous pouvez aussi renommer les modèles pour une meilleure lisibilité et consulter des statistiques d’utilisation par modèle.

Auto Optimize

La fonctionnalité expérimentale Auto Optimize ajuste automatiquement les paramètres llama.cpp en fonction de votre matériel, sans configuration manuelle. C’est l’équivalent de la détection automatique de matériel d’Ollama, mais dans un contexte GUI.

Jan Server : déploiement pour les équipes

Jan Server est une plateforme microservices distincte de l’application desktop, conçue pour les équipes et organisations qui veulent déployer leur propre infrastructure IA. Elle inclut :

API compatible OpenAI : drop-in replacement pour les endpoints OpenAI.

Response API : orchestration multi-étapes pour les workflows agentiques complexes.

Intégration MCP : recherche web, exécution de code, et outils personnalisés.

Authentification entreprise : OAuth/OIDC via Keycloak avec support d’accès invité.

Observabilité complète : OpenTelemetry, Prometheus, Jaeger, et Grafana intégrés.

Gestion des médias : intégration S3 pour les fichiers et pièces jointes.

Le déploiement se fait via Docker Compose en quelques minutes. C’est une solution sérieuse pour les organisations qui veulent un ChatGPT privé auto-hébergé avec contrôle total.

Jan Desktop est aussi disponible en Docker pour un usage individuel, avec des volumes montés pour persister les modèles et conversations entre les mises à jour. Cette approche est populaire pour rendre Jan accessible depuis n’importe quel appareil sur le réseau local, tout en gardant les données centralisées sur un serveur dédié.

Cas d’usage

ChatGPT privé pour une équipe. C’est le cas d’usage principal de Jan. Déployez Jan Server via Docker, connectez-le à vos modèles locaux ou cloud, et offrez à votre équipe une interface de chat IA sans qu’aucune donnée ne quitte vos serveurs. L’authentification OAuth/OIDC et l’observabilité intégrée (Prometheus, Grafana) en font une solution prête pour l’entreprise.

Environnements air-gapped et réglementés. Pour les organisations soumises au RGPD, HIPAA, ou des réglementations de résidence des données, Jan élimine le risque d’envoi de données vers des serveurs tiers. L’inférence locale garantit que les prompts et les réponses ne quittent jamais le périmètre contrôlé.

Automatisation agentique locale. Grâce au support MCP, Jan peut orchestrer des workflows multi-étapes : rechercher sur le web (Browser MCP), interroger des bases de données, lire des fichiers, et exécuter du code. Combiné avec un modèle performant en tool calling (Qwen 3, gpt-oss), Jan devient un agent autonome fonctionnant sur votre machine.

Évaluation et comparaison de modèles. L’intégration simultanée de modèles locaux et cloud permet de comparer directement les résultats. Testez un Llama 3.1 8B local contre Claude ou GPT-4 sur vos propres prompts, dans la même interface, pour décider quel modèle convient à votre cas d’usage.

Développement d’applications IA. Le serveur API compatible OpenAI + Anthropic sur localhost:1337 permet d’intégrer Jan comme backend dans vos applications. Les SDKs et l’API standardisée signifient que vous pouvez développer contre l’API OpenAI, tester en local avec Jan, et basculer vers le cloud en production (ou l’inverse) sans changer une ligne de code.

Éducation et apprentissage. Jan est gratuit, open source, et fonctionne hors ligne. Pour les étudiants, chercheurs, et curieux qui veulent expérimenter avec les LLM sans budget cloud, c’est un point d’entrée accessible. La GUI élimine la barrière du terminal.

Matériel et performances

Jan utilise llama.cpp comme moteur d’inférence, via son propre wrapper Cortex.cpp. Les performances sont donc identiques à celles d’Ollama et LM Studio sur le même matériel, puisque le moteur sous-jacent est le même.

Configuration minimum : 8 Go de RAM pour les modèles 3-4B en Q4. 16 Go recommandés pour les modèles 7-8B.

Configuration idéale : 32 Go de RAM ou un GPU avec 12+ Go de VRAM. Un MacBook Pro Apple Silicon avec 36 Go fait tourner confortablement des modèles 32B.

Accélération GPU : NVIDIA via CUDA, AMD via ROCm (Linux) et Vulkan, Apple Silicon via Metal. Jan détecte automatiquement le matériel et utilise le backend approprié.

Repères de vitesse : pour un modèle 8B en Q4_K_M, comptez environ 8-15 tok/s sur CPU moderne, 30-50+ tok/s sur Apple Silicon M2+, et 60-100+ tok/s sur GPU NVIDIA récent. Au-dessus de 15 tok/s, l’expérience de chat est fluide. En dessous de 8 tok/s, la latence devient perceptible.

Jan vs Ollama vs LM Studio

Critère	Jan	Ollama	LM Studio
Interface	GUI complète + serveur	CLI + API uniquement	GUI complète + CLI
Open source	Oui (Apache 2.0)	Oui (MIT)	Non (propriétaire)
Modèles cloud	Oui (OpenAI, Anthropic, Mistral, Groq, etc.)	Oui (:cloud)	Non
MCP / Agents	Oui (MCP host + Browser MCP)	OpenClaw, ollama launch	MCP client
Assistants personnalisés	Oui (avec mémoire de contexte)	Modelfiles	Via system prompts
API serveur	OpenAI + Anthropic (`:1337`)	OpenAI + Anthropic (`:11434`)	OpenAI (`:1234`)
Déploiement équipe	Jan Server (Docker, auth, observabilité)	Docker (basique)	llmster (headless)
Docker	Oui (desktop + server)	Oui (image officielle)	Non
Extensions / plugins	Oui (système d’extensions)	Plugins OpenClaw	Non
Public cible	Privacy-first, équipes, agents	Développeurs, CI/CD, agents	Exploration, non-développeurs

Verdict Jan si vous voulez une application IA locale complète, open source, avec une GUI, des assistants personnalisés, et un vrai déploiement équipe (Jan Server). Ollama si vous êtes développeur et que vous voulez un backend CLI/API léger pour l’intégration dans vos outils. LM Studio si vous voulez la meilleure interface graphique pour tester et comparer des modèles. Rien n’empêche de combiner les trois : Jan comme interface de chat, Ollama comme backend API, et LM Studio pour le benchmarking.

Support multimodal

Jan supporte les modèles multimodaux (vision) depuis les versions récentes. Vous pouvez envoyer des images dans le chat, et les modèles compatibles (Gemma 3, Qwen 2.5 VL, Llama 3.2 Vision, Jan VL) les analysent directement. Le support inclut l’OCR (reconnaissance de texte dans les images), l’interprétation de graphiques et captures d’écran, et la description d’images. Les résultats multimodaux des outils MCP sont aussi supportés, ce qui signifie qu’un agent peut analyser visuellement le résultat d’une action.

Internationalisation

Jan supporte l’internationalisation avec plusieurs langues d’interface (anglais, chinois, japonais, français, et d’autres via des contributions communautaires). C’est un avantage pour les équipes non-anglophones qui déploient Jan en interne. Les contributions de traduction sont acceptées sur le repo GitHub.

Limites

Maturité variable des fonctionnalités. Jan évolue vite (v0.7.x en mars 2026), mais certaines fonctionnalités comme le MCP, l’Auto Optimize, et les Projects sont encore relativement récentes. Attendez-vous à des bugs occasionnels sur les fonctionnalités les plus nouvelles.

Performances identiques à Ollama/LM Studio. Les trois outils utilisent llama.cpp sous le capot. L’écart de performance entre eux est négligeable sur le même matériel et la même quantification. Le choix entre Jan, Ollama, et LM Studio se fait sur l’expérience utilisateur, l’écosystème d’extensions, et les besoins de déploiement, pas sur la vitesse d’inférence brute.

Format GGUF principalement. Comme ses concurrents, Jan charge principalement des modèles GGUF pour l’inférence locale. Les modèles GPTQ ou AWQ en SafeTensors ne sont pas supportés.

Matériel requis identique. Un modèle 7B en Q4_K_M nécessite environ 4 à 5 Go de RAM/VRAM, quel que soit l’outil. La recommandation minimum de 16 Go de RAM s’applique pour une utilisation confortable.

Questions fréquentes sur Jan AI

Jan est-il gratuit ?

Oui, entièrement. Jan est open source sous licence Apache 2.0. Aucun abonnement, aucun compte requis. Vous pouvez utiliser, modifier, et redistribuer le code, y compris pour un usage commercial.

Jan collecte-t-il des données ?

Non, par défaut. Jan n’active aucune télémétrie par défaut et ne nécessite aucun compte. Toutes les données (conversations, modèles, paramètres) sont stockées localement sur votre machine. Si vous connectez un fournisseur cloud (OpenAI, Anthropic), les prompts envoyés à ces API passent par leurs serveurs, mais Jan lui-même n’intercepte ni ne stocke rien côté cloud.

Quelle est la différence entre Jan Desktop et Jan Server ?

Jan Desktop est l’application individuelle avec interface graphique. Jan Server est une plateforme microservices déployable via Docker, conçue pour les équipes : elle ajoute l’authentification (OAuth/OIDC), l’observabilité (Prometheus, Grafana), la gestion des fichiers (S3), et une API de réponse multi-étapes pour les workflows agentiques. Les deux partagent le même moteur d’inférence.

Jan peut-il utiliser des modèles cloud en plus du local ?

Oui. Jan permet de connecter des fournisseurs cloud (OpenAI, Anthropic Claude, Mistral, Groq, MiniMax, Azure, OpenRouter) via leurs clés API. Vous pouvez basculer entre un modèle local et un modèle cloud dans la même conversation. C’est utile pour comparer les résultats ou utiliser un modèle cloud pour les tâches complexes et un modèle local pour la confidentialité.

Jan fonctionne-t-il hors connexion ?

Oui, à 100 %. Une fois qu’un modèle local est téléchargé, Jan fonctionne entièrement hors ligne. Aucune connexion internet n’est nécessaire pour l’inférence locale. C’est idéal pour les environnements air-gapped, les déplacements, ou toute situation où la connectivité est limitée ou la confidentialité est critique.