OpenRouter

OpenRouter est une API unifiée qui donne accès à plus de 400 modèles IA de 60+ fournisseurs (OpenAI, Anthropic, Google, Meta, Mistral, xAI, DeepSeek, etc.) via un seul endpoint compatible OpenAI, avec routage intelligent, failover automatique et facturation centralisée.

Éditeur: OpenRouter Inc.
Type: API gateway / routeur multi-provider pour LLM
Modèles: 400+ modèles de 60+ fournisseurs
Pricing: Pass-through (même prix que le provider) + 5 % sur les crédits
API: Compatible OpenAI (drop-in replacement)
Utilisateurs: 1M+ développeurs, 250K+ applications
Fondateur: Alex Atallah (cofondateur et ex-CTO d’OpenSea)
Financement: ≈ $60M levés (Seed $12,5M a16z + Series A $28M+ Menlo Ventures, juin 2025)
Valorisation: $500M (juin 2025)
Fondation: 2023
URL: openrouter.ai

Qu’est-ce qu’OpenRouter ?

OpenRouter est le « Stripe des LLM » : une couche d’abstraction qui vous connecte à tous les principaux fournisseurs de modèles IA via un seul endpoint API, une seule clé, et une seule facture. Vous changez de modèle en modifiant un paramètre dans votre requête, sans toucher au reste de votre code.

Le problème qu’OpenRouter résout est concret : si vous construisez une application IA, vous voulez utiliser GPT-5.4 pour certaines tâches, Claude Opus 4.6 pour d’autres, Gemini 3 Flash pour les requêtes rapides, et DeepSeek V3.2 pour minimiser les coûts. Sans OpenRouter, c’est quatre intégrations distinctes, quatre clés API, quatre systèmes de facturation, et quatre logiques de gestion d’erreurs. Avec OpenRouter, c’est une seule intégration.

Fondé en 2023 par Alex Atallah (cofondateur et ex-CTO d’OpenSea, la marketplace NFT valorisée à $13,3 Mds) et Louis Vichy, OpenRouter a connu une croissance explosive. Les dépenses mensuelles des clients sont passées de $800K en octobre 2024 à environ $8M en mai 2025, soit une multiplication par 10 en sept mois. La plateforme traite plus de 100 trillions de tokens par an et sert plus d’un million de développeurs.

En juin 2025, OpenRouter a levé environ $60M au total (seed de $12,5M mené par a16z, Series A menée par Menlo Ventures), avec la participation de Sequoia Capital, Figma, et Fred Ehrsam. La valorisation est de $500M.

Comment fonctionne OpenRouter

L’API : un seul changement pour tout migrer

L’API OpenRouter est compatible OpenAI. Vous changez le base URL et la clé API, et tout votre code existant (SDK OpenAI Python/Node.js, LangChain, Vercel AI SDK, etc.) fonctionne immédiatement. Voici un exemple :

from openai import OpenAI

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="VOTRE_CLE_OPENROUTER"
)

# Appeler Claude Opus 4.6
response = client.chat.completions.create(
    model="anthropic/claude-opus-4.6",
    messages=[{"role": "user", "content": "Bonjour OpenRouter !"}]
)

# Changer de modèle = changer une string
response = client.chat.completions.create(
    model="google/gemini-3-flash",  # même code, modèle différent
    messages=[{"role": "user", "content": "Bonjour OpenRouter !"}]
)

Le routage intelligent

OpenRouter ne se contente pas de relayer vos requêtes. Sa couche de routage sélectionne automatiquement le meilleur endpoint disponible pour chaque modèle en fonction de la latence, du throughput, de l’uptime et du prix. Si un provider tombe, OpenRouter route automatiquement vers un autre provider qui héberge le même modèle. Vous n’êtes facturé que pour les requêtes réussies.

Les variants dynamiques permettent d’affiner le routage :

:nitro : trie les providers par throughput. Idéal quand la vitesse de réponse est prioritaire.

:floor : trie par prix, en privilégiant l’option la moins chère.

:online : attache des résultats de recherche web au prompt (RAG automatique).

:thinking : active le mode raisonnement par défaut (pour les modèles qui le supportent).

:free : utilise uniquement les versions gratuites du modèle (avec rate limits).

:exacto : optimise pour la fiabilité du tool calling.

Le Free Models Router

OpenRouter propose un routeur de modèles gratuits (openrouter/free) qui sélectionne automatiquement un modèle gratuit disponible pour vos requêtes. Les modèles gratuits incluent DeepSeek R1, Llama 3.3 70B, Gemma 3, et d’autres. Les rate limits sont modestes (20 requêtes/minute, 200/jour pour les comptes sans crédits ; 1 000/jour avec $10+ de crédits), mais c’est suffisant pour du prototypage.

Pricing : la transparence comme principe

OpenRouter ne majore pas les prix des providers. Le tarif affiché dans le catalogue est le même que celui du fournisseur. Le modèle économique repose sur une commission de 5 % prélevée sur les crédits achetés et sur l’utilisation BYOK (Bring Your Own Key).

Concrètement :

Pay-as-you-go : vous achetez des crédits (par carte bancaire, AliPay, ou crypto USDC) et les utilisez avec n’importe quel modèle. Pas de minimum, pas d’engagement. Les crédits n’expirent pas.

BYOK (Bring Your Own Key) : vous utilisez vos propres clés API de providers (OpenAI, Anthropic, etc.) tout en bénéficiant du routage et de l’analytics OpenRouter. Les 1M premières requêtes BYOK par mois sont gratuites, ensuite OpenRouter prélève 5 % du coût équivalent.

Enterprise : tarification basée sur le volume, prépaiement, engagements annuels, facturation par PO, SSO SAML, routage régional. Contactez l’équipe commerciale.

Modèle (via OpenRouter)	Input (par 1M tokens)	Output (par 1M tokens)
Claude Opus 4.6	$5,00	$25,00
Claude Sonnet 4.6	$3,00	$15,00
GPT-5.4	$2,50	$15,00
Gemini 3.1 Pro	$2,00	$12,00
Gemini 3 Flash	$0,50	$3,00
Llama 3 70B	≈ $0,50-0,90	≈ $0,50-0,90
DeepSeek V3.2	≈ $0,28	≈ $0,42
Modèles gratuits	$0	$0 (rate limits)

Zero Completion Insurance Si une requête échoue (erreur provider, timeout, etc.), vous n’êtes pas facturé. Le failover route automatiquement vers un provider alternatif, et seule la requête réussie est facturée. C’est une garantie concrète qui n’existe pas quand vous appelez les providers directement.

Le leaderboard : un actif stratégique

OpenRouter publie des classements de modèles et des benchmarks basés sur des données réelles d’utilisation. Après avoir traité plus de 100 trillions de tokens, OpenRouter sait quels modèles performent le mieux pour quels cas d’usage, quels providers offrent la meilleure latence, et quelles combinaisons modèle/provider sont les plus fiables.

Ce leaderboard est devenu une référence dans l’industrie, recommandé publiquement par des figures comme Andrej Karpathy (cofondateur d’OpenAI, ex-directeur IA Tesla). C’est un avantage concurrentiel difficile à répliquer : les données de routing s’améliorent avec le volume, ce qui améliore le produit, ce qui attire plus d’utilisateurs, ce qui génère plus de données. C’est un data flywheel classique.

OpenRouter vs LiteLLM vs Vercel AI Gateway

Critère	OpenRouter	LiteLLM	Vercel AI Gateway
Type	API cloud managée	Proxy open-source (Python)	Service Vercel intégré
Modèles	400+ de 60+ providers	100+ providers (vous amenez vos clés)	Providers majeurs
Auto-hébergement	Non (cloud only)	Oui	Non (Vercel only)
Facturation unifiée	Oui (crédits centralisés)	Non (vos clés, votre facturation)	Oui (via Vercel)
Failover automatique	Oui	Oui (configurable)	Oui
Modèles gratuits	Oui (Free Router)	Non (vos clés)	Non
BYOK	Oui (5 % au-delà de 1M req/mois)	Natif (c’est le principe)	Oui
Langage	API REST (tout langage)	Python	TypeScript (AI SDK)
Prix	Pass-through + 5 %	Gratuit (open-source)	Inclus dans Vercel

Verdict Polydesk OpenRouter est le meilleur choix si vous voulez accéder à tous les modèles du marché via une seule facture, sans gérer d’infrastructure. La facturation centralisée, le failover automatique et le leaderboard en font la solution la plus pratique pour les équipes qui expérimentent avec plusieurs modèles. LiteLLM est préférable si vous voulez un proxy auto-hébergé, si vous avez déjà des clés API chez les providers, ou si vous avez des exigences de souveraineté des données (pas de tiers entre vous et le provider). Le Vercel AI Gateway est optimal si vous êtes déjà dans l’écosystème Vercel et que vous utilisez le AI SDK.

Cas d’usage

Prototypage et comparaison de modèles. Testez GPT-5.4, Claude Opus, Gemini Pro et Llama sur le même prompt en changeant un paramètre. Le chatroom web d’OpenRouter permet de comparer les modèles côte à côte sans écrire de code. C’est le moyen le plus rapide de choisir le bon modèle pour votre cas d’usage.

Applications multi-modèles en production. Utilisez un modèle rapide et bon marché (Gemini Flash, DeepSeek) pour le tri et la classification, et un modèle frontier (Claude Opus, GPT-5.4) pour les tâches complexes. OpenRouter gère le routage, le failover et la facturation unifiée.

Outils de développement IA. OpenRouter est intégré nativement dans des outils populaires : Cline (agent de coding VS Code), Microsoft VS Code (extension), Zapier, Cloudflare, et de nombreux frameworks d’agents. Plus de 250 000 applications utilisent OpenRouter.

Résilience et haute disponibilité. Le failover automatique entre providers garantit que vos requêtes aboutissent même si un fournisseur est en panne. C’est plus fiable que d’appeler un seul provider directement. OpenRouter ajoute environ 15 ms de latence, ce qui est négligeable par rapport au temps d’inférence du modèle.

Contrôle des coûts multi-modèles. Le dashboard centralisé montre les dépenses par modèle, par clé API et par organisation. Vous pouvez définir des caps par clé et des alertes de dépense. C’est infiniment plus simple que de consolider les factures de quatre providers différents.

Démarrer avec OpenRouter

Étape 1 : Créer un compte. Inscrivez-vous sur openrouter.ai. Vous recevez un petit crédit gratuit pour tester.

Étape 2 : Ajouter des crédits. Achetez des crédits (pas de minimum). Les crédits fonctionnent avec tous les modèles.

Étape 3 : Créer une clé API. Depuis les settings, générez une clé. Vous pouvez créer des clés séparées par environnement (dev, staging, prod) avec des caps de dépense individuels.

Étape 4 : Intégrer. Changez le base URL de votre SDK OpenAI vers https://openrouter.ai/api/v1 et votre clé API. C’est tout.

Étape 5 : Explorer les modèles gratuits. Utilisez le Free Router (openrouter/free) pour tester sans dépenser un centime.

Limites

Pas d’auto-hébergement. OpenRouter est un service cloud. Vos requêtes transitent par les serveurs d’OpenRouter avant d’atteindre le provider. Si vous avez des exigences strictes de souveraineté des données (pas de tiers intermédiaire), utilisez LiteLLM en auto-hébergé.

Données non entraînées, mais transit par OpenRouter. OpenRouter affirme ne pas entraîner de modèles sur vos données et ne pas logger les prompts/completions par défaut. La rétention côté provider peut être désactivée au niveau du compte ou par requête. Pour les cas d’usage très sensibles, vérifiez les politiques exactes.

Latence additionnelle. Le routage ajoute environ 15 ms de latence. C’est négligeable pour la plupart des applications, mais pour des cas d’usage ultra-sensibles à la latence (voix en temps réel, gaming), c’est un facteur à considérer.

Pas de fine-tuning ni de compute GPU. OpenRouter est un routeur d’inférence, pas une plateforme de compute. Pour le fine-tuning, l’entraînement ou l’hébergement de modèles custom, utilisez Together AI, Modal ou RunPod.

Dépendance à un tiers. En utilisant OpenRouter, vous ajoutez un intermédiaire entre vous et les providers. Si OpenRouter a une panne (rare, mais possible), toutes vos requêtes IA sont affectées. L’architecture edge d’OpenRouter minimise ce risque, mais il existe. Pour une résilience maximale, combinez OpenRouter avec un fallback direct vers vos providers principaux.

Intégrations et écosystème

OpenRouter s’est imposé comme le backend d’inférence par défaut pour de nombreux outils populaires dans l’écosystème IA :

Cline : l’agent de coding open-source pour VS Code utilise OpenRouter comme provider par défaut, permettant aux développeurs d’accéder à tous les modèles depuis leur IDE.

Microsoft VS Code : intégration native pour l’accès aux modèles via OpenRouter.

Zapier : connecteur OpenRouter pour automatiser des workflows avec des modèles IA variés.

Cloudflare : intégration pour les applications Workers AI.

Vercel AI SDK : compatible via l’API OpenAI (changez le base URL).

LangChain, LlamaIndex, CrewAI, AutoGen : tous compatibles via le format OpenAI.

L’adoption par des outils comme Cline a été un moteur de croissance majeur pour OpenRouter. Quand un agent de coding populaire utilise OpenRouter comme backend, chaque développeur qui adopte l’agent devient automatiquement un utilisateur OpenRouter. C’est un effet de réseau puissant qui renforce la position de la plateforme. Selon Menlo Ventures, cette intégration dans les workflows des développeurs crée un avantage compétitif difficile à déloger : une fois qu’un outil est câblé sur OpenRouter, le coût de migration est significatif.

OpenRouter propose également un chatroom web pour tester les modèles en temps réel, et un système de presets qui permet à des membres non techniques d’une équipe de configurer des prompts et des règles de routage sans toucher au code. C’est un détail qui compte pour l’adoption enterprise.

Questions fréquentes sur OpenRouter

OpenRouter est-il plus cher que d’appeler les providers directement ?

OpenRouter ne majore pas les prix des providers. Le tarif par token affiché est le même que chez le fournisseur. La commission de 5 % est appliquée lors de l’achat de crédits, pas sur chaque requête. Pour la majorité des cas d’usage, le surcoût est plus que compensé par la facturation centralisée, le failover automatique et le gain de temps d’intégration. Si vous utilisez BYOK (vos propres clés), les 1M premières requêtes par mois sont gratuites.

Mes données sont-elles sécurisées sur OpenRouter ?

OpenRouter ne log pas les prompts et completions par défaut et n’entraîne pas de modèles sur vos données. Le plan Enterprise offre des politiques de données granulaires : vous pouvez restreindre le routage à des providers de confiance et configurer les politiques de rétention. La rétention côté provider peut être désactivée. Pour les cas très sensibles, le mode BYOK minimise l’exposition car OpenRouter ne voit que les métadonnées de routage, pas le contenu des requêtes transmises via vos propres clés.

Quelle est la différence entre OpenRouter et LiteLLM ?

LiteLLM est un proxy open-source en Python que vous auto-hébergez. Vous amenez vos propres clés API et LiteLLM normalise les appels entre providers. OpenRouter est un service cloud managé avec ses propres crédits, son propre failover et son analytics intégré. LiteLLM offre plus de contrôle et de confidentialité (vos requêtes ne passent pas par un tiers). OpenRouter offre plus de commodité (une seule facture, pas d’infrastructure à gérer, modèles gratuits, leaderboard).

Puis-je utiliser OpenRouter avec LangChain, Vercel AI SDK ou d’autres frameworks ?

Oui. L’API OpenRouter est compatible OpenAI, ce qui la rend compatible avec tous les outils qui supportent l’API OpenAI : LangChain, LlamaIndex, Vercel AI SDK, LiteLLM, Haystack, AutoGen, CrewAI, etc. Changez le base URL et la clé API, et tout fonctionne. OpenRouter est aussi intégré nativement dans des outils comme Cline, Cursor et VS Code.

Les modèles gratuits sont-ils utilisables en production ?

Non, pas vraiment. Les modèles gratuits ont des rate limits stricts (50 requêtes/jour sans crédits, 1 000/jour avec $10+ de crédits). Ils sont conçus pour le prototypage et les tests, pas pour des charges de production. Pour la production, utilisez les modèles payants avec des crédits ou BYOK. Le Free Router (openrouter/free) est parfait pour les démonstrations et l’expérimentation.