Cohere

Cohere est une startup canadienne d’intelligence artificielle fondée en 2019 par Aidan Gomez (coauteur de l’article fondateur sur les Transformers), Ivan Zhang et Nick Frosst. Spécialisée dans l’IA enterprise, elle développe les modèles Command (génération de texte), Embed (recherche sémantique), Rerank (réordonnancement de résultats) et la plateforme North (agents IA d’entreprise). Avec un ARR de 240 millions de dollars fin 2025, une valorisation de 7 milliards et une IPO potentielle en 2026, Cohere s’est positionnée comme l’alternative enterprise-first aux géants américains de l’IA.

Fondation: 2019
Fondateurs: Aidan Gomez (CEO), Ivan Zhang, Nick Frosst
Siège: Toronto, Canada (bureaux à SF, NY, Londres, Paris, Séoul, Montréal)
Employés: ~800+
Valorisation: $7 milliards (septembre 2025)
ARR: $240M (fin 2025), objectif significativement plus élevé en 2026
Modèle phare: Command R+ / Command A
Produits: API (Command, Embed, Rerank), North (plateforme agents), Model Vault
Investisseurs: Nvidia, AMD, Salesforce, Oracle, ASML, PSP Investments, BDC
Total levé: ~$600M+
URL: cohere.com

Histoire et fondation

Des Transformers à Cohere

L’histoire de Cohere est intimement liée à l’une des publications les plus influentes de l’histoire de l’IA. En 2017, Aidan Gomez, alors stagiaire chez Google Brain, a coécrit « Attention Is All You Need », l’article qui a introduit l’architecture Transformer. Cette architecture est la base de pratiquement tous les grands modèles de langage actuels : GPT, Claude, Gemini, Llama, Mistral. Gomez est l’un des rares fondateurs de startups IA à avoir contribué directement à l’invention fondamentale qui sous-tend l’industrie entière.

Cohere a été fondée en 2019 à Toronto par Gomez, Ivan Zhang et Nick Frosst (ancien chercheur chez Geoffrey Hinton, le « parrain du deep learning »). Le choix de Toronto n’est pas anodin : la ville est un hub mondial de la recherche en IA, avec l’Université de Toronto et le Vector Institute comme pôles d’excellence.

Là où OpenAI a misé sur le consumer avec ChatGPT et Anthropic sur la sécurité de l’IA, Cohere s’est concentrée dès le départ sur l’enterprise. L’objectif : fournir aux entreprises des modèles optimisés pour leurs cas d’usage (recherche, génération, classification) avec une attention particulière à la sécurité des données, la souveraineté et le déploiement flexible.

Trajectoire de croissance

La montée en puissance de Cohere a été progressive mais constante. Le revenu annualisé est passé d’environ 13 millions de dollars fin 2023 à 35 millions en mars 2024, puis a franchi les 100 millions en mai 2025. Fin 2025, l’ARR atteignait 240 millions de dollars, avec une croissance trimestrielle supérieure à 50%. Les marges brutes sont d’environ 70%.

Les levées de fonds ont suivi : Series C à $270M en juin 2023 (valorisation $2,2B), Series D de $500M en août 2025 (valorisation $6,8B), puis $100M supplémentaires en septembre 2025 portant la valorisation à $7B. Le total levé dépasse 600 millions de dollars. Les investisseurs incluent Oracle, Salesforce, Nvidia, AMD, Cisco, ASML, PSP Investments (fonds de pension public canadien) et BDC (Banque de développement du Canada).

L’effectif est passé d’environ 250 personnes mi-2024 à plus de 800 début 2026, avec des équipes commerciales déployées en Asie (Corée, Japon), en Europe et en Amérique du Nord.

Les modèles Cohere

Cohere se distingue par un trio de modèles complémentaires conçus pour fonctionner ensemble dans des pipelines enterprise, plutôt qu’un modèle unique qui fait tout.

Command (génération)

La famille Command est la gamme de modèles génératifs de Cohere, optimisée pour le RAG, le tool use et les workflows agentiques.

Command R+ : le modèle le plus capable, avec un contexte de 128K tokens et des capacités de raisonnement complexe et d’utilisation d’outils multi-étapes. Pricing : environ $2,50/M tokens en entrée, $10,00/M en sortie.

Command A : le modèle le plus récent, présenté comme le plus efficient et performant à ce jour, spécialisé en IA agentique, multilinguisme et évaluations orientées cas d’usage réel.

Command R : modèle équilibré performance/coût pour les cas d’usage de production généraux. Pricing significativement inférieur à Command R+.

Command R7B : le modèle le plus économique, conçu pour les applications à haut volume (classification, Q&A basique).

Embed (recherche sémantique)

Les modèles Embed de Cohere transforment du texte (et des images avec Embed 4) en vecteurs numériques pour la recherche sémantique. Embed 4, le dernier en date, est multimodal (texte + images) à $0,12/M tokens, compétitif avec les modèles OpenAI text-embedding-3-large ($0,13/M). Ces embeddings alimentent les bases de données vectorielles (Pinecone, Chroma, Weaviate, Qdrant) qui constituent le coeur des systèmes RAG enterprise.

Rerank (réordonnancement)

Les modèles Rerank réordonnent des résultats de recherche pour améliorer la pertinence. À $2,00 par 1 000 unités de recherche, c’est un composant discret mais crucial : inséré entre une recherche initiale (par mots-clés ou vectorielle) et le modèle génératif, Rerank améliore significativement la qualité des réponses RAG. C’est un avantage compétitif différenciant que ni OpenAI ni Anthropic ne proposent nativement.

Tiny Aya (modèles multilingues open-weight)

Publié en février 2026 par Cohere Labs (la branche recherche), Tiny Aya est une famille de modèles open-weight de 3,35 milliards de paramètres supportant plus de 70 langues. La famille inclut des variantes régionales : Tiny Aya-Global (couverture large), Tiny Aya-Earth (langues africaines), Tiny Aya-Fire (langues sud-asiatiques), Tiny Aya-Water (Asie-Pacifique, Moyen-Orient, Europe). Les modèles tournent localement sur des laptops et des appareils edge sans connexion internet, et sont disponibles sur Hugging Face, Kaggle et Ollama.

North : la plateforme agents enterprise

North, lancé en janvier 2025 et en GA depuis août 2025, est la plateforme d’IA enterprise de Cohere. C’est un workspace sécurisé où les entreprises peuvent déployer des agents IA adaptés à leurs processus internes. North intègre Command (génération), Compass (recherche), Embed et Rerank dans une interface unifiée.

Les clients incluent RBC (Banque Royale du Canada), Dell, LG CNS et Ensemble Health Partners. North positionne Cohere non plus comme un simple fournisseur de modèles, mais comme un partenaire d’infrastructure IA enterprise, en concurrence directe avec Microsoft Copilot et Google Vertex AI. Le passage de l’API pure à la plateforme est stratégique : il crée du lock-in client, élargit le revenu par compte, et renforce les relations au-delà de la simple consommation de tokens.

Model Vault et souveraineté IA

Lancé en septembre 2025, Model Vault est la plateforme d’inférence dédiée de Cohere qui permet aux entreprises de déployer les modèles Command, Rerank et Embed dans des VPC isolés ou des environnements on-premise. Le principe : l’IA vient aux données, pas l’inverse. Les données sensibles ne quittent jamais le réseau sécurisé de l’organisation.

Ce positionnement de « souveraineté IA » est central dans la stratégie de Cohere. Le partenariat avec Bell Canada (juillet 2025) permet de fournir des services IA souverains aux clients gouvernementaux et enterprise canadiens, avec l’infrastructure de Bell. Le gouvernement canadien considère Cohere comme un « champion national ». Macron parle de Mistral, Trudeau parle de Cohere : le pattern est le même.

Partenariats stratégiques

Oracle : investisseur et partenaire de distribution majeur. Les modèles Cohere sont disponibles sur Oracle Cloud Infrastructure (OCI). Oracle revend Cohere à ses clients enterprise, créant un canal de distribution puissant.

AMD : investisseur et partenaire hardware. Les modèles Command tournent sur les GPU AMD Instinct, et AMD utilise Cohere en interne. C’est un positionnement différenciant face à l’écosystème Nvidia-centrique de la plupart des concurrents.

Salesforce : investisseur et intégrateur. Cohere est disponible dans l’écosystème Salesforce pour les cas d’usage CRM et service client.

Nvidia : investisseur, mais la relation AMD-Cohere est notable comme diversification stratégique dans un marché dominé par Nvidia.

Pricing et modèle économique

Cohere monétise via trois canaux : les API pay-as-you-go (Command, Embed, Rerank), les licences enterprise (North, Model Vault) et les abonnements consumer (Le Chat de Cohere, bien que marginal). Le plan gratuit est limité au prototypage. La production nécessite un API key payant.

Modèle	Input/1M tokens	Output/1M tokens	Contexte
Command R+	$2,50	$10,00	128K
Embed 4	$0,12/M tokens		N/A
Rerank	$2,00/1 000 unités de recherche		N/A

Le pricing de Command R+ ($2,50/$10,00) est compétitif face à GPT-5.4 ($2,50/$15,00) et nettement moins cher que Claude Opus 4.6 ($5,00/$25,00). Cohere ne facture pas séparément pour la longueur du contexte : une requête de 100K tokens coûte le même prix au token qu’une requête de 1K tokens.

Cas d’usage enterprise

La stratégie commerciale de Cohere repose sur une approche modulaire : vendre d’abord la recherche vectorielle (Embed), puis le LLM (Command), puis la plateforme agents (North). Chaque composant est un point d’entrée qui génère de l’upsell.

Gestion des connaissances : les pipelines RAG (Embed + Rerank + Command) permettent aux entreprises de construire des systèmes de Q&A sur leurs documents internes. Scale AI utilise Cohere pour une application de knowledge management destinée à son équipe de support client, optimisant le coût total de possession tout en maintenant des performances élevées.

Services financiers : RBC (Banque Royale du Canada) déploie North pour des cas d’usage allant de l’analyse de documents réglementaires à l’automatisation de rapports. Le secteur financier est un terrain naturel pour Cohere grâce au déploiement souverain et à la conformité intégrée.

Télécommunications : Bell Canada a signé un partenariat stratégique pour fournir des services IA souverains à ses clients gouvernementaux et enterprise, déployant la technologie Cohere sur sa propre infrastructure de data centers.

Santé : Ensemble Health Partners utilise North pour automatiser des workflows dans le cycle de revenus hospitalier. Le déploiement on-premise via Model Vault est essentiel dans ce secteur ultra-régulé.

Fine-tuning et personnalisation

Cohere propose le fine-tuning de ses modèles Command pour les entreprises qui ont besoin d’un ton spécifique, d’un vocabulaire métier ou de performances optimisées sur un domaine. Le processus est accessible via l’API ou North, avec des outils d’évaluation intégrés pour mesurer la qualité du modèle affiné. La capacité de fine-tuner sur Cohere’s API puis d’exporter le modèle via Model Vault pour un déploiement on-premise est un workflow que peu de concurrents proposent de manière aussi fluide.

Le modèle Cohere 3.3 8B, récemment ouvert au fine-tuning dans la nouvelle API, permet de réduire les coûts tout en améliorant vitesse et précision pour des tâches spécifiques. L’évaluation est intégrée : vous pouvez générer des données, entraîner, et tester la qualité du modèle dans un workflow unifié.

L’écosystème canadien

Cohere bénéficie d’un positionnement unique dans l’écosystème IA canadien. Toronto est un hub mondial de la recherche en deep learning grâce à Geoffrey Hinton (Université de Toronto, Vector Institute), et le Canada dispose d’un vivier de talents IA de premier plan. Le gouvernement canadien soutient explicitement Cohere comme « champion national », avec des investissements via BDC et PSP Investments.

Ce positionnement canadien offre des avantages concurrentiels subtils mais réels. Le Canada est perçu comme un tiers de confiance par les entreprises et gouvernements qui hésitent à confier leurs données à des fournisseurs américains (soumis au Cloud Act) ou chinois. Pour les marchés européens et asiatiques soucieux de souveraineté, un fournisseur canadien représente un compromis intéressant entre expertise technique de pointe et cadre réglementaire moins intrusif.

Positionnement concurrentiel

Cohere se distingue par plusieurs avantages face aux géants :

Trio Embed + Rerank + Command : une stack RAG intégrée que personne d’autre ne propose de manière aussi cohérente. OpenAI a des embeddings mais pas de Rerank natif. Anthropic n’a ni l’un ni l’autre.

Déploiement souverain : Model Vault et les options on-premise/VPC répondent aux exigences des industries régulées (finance, santé, défense, gouvernement) que les solutions cloud-only ne peuvent pas adresser.

Efficience : les modèles Cohere sont conçus pour tourner sur du hardware limité. C’est un argument de poids pour les entreprises qui n’ont pas accès à des clusters GPU massifs.

Multilingue natif : avec Tiny Aya (70+ langues) et Command R (10 langues majeures), Cohere est l’un des fournisseurs les plus multilingues du marché.

Les limites : Cohere n’a pas la notoriété consumer d’OpenAI, la réputation safety-first d’Anthropic, ni les ressources de calcul de Google DeepMind ou Meta. Le rapport valorisation/revenu (~30x) est élevé mais inférieur à celui des concurrents, ce que le CFO Chadwick présente comme un signe de discipline financière plutôt que de sous-performance.

Perspectives d’IPO

L’embauche de Francois Chadwick comme premier CFO en août 2025 (ex-CFO par intérim d’Uber, expérience directe d’IPO tech) signale des préparatifs sérieux. Le CEO Aidan Gomez a indiqué en octobre 2025 qu’une IPO pourrait arriver « bientôt ». Si elle se concrétise en 2026, ce serait un test majeur pour savoir si les investisseurs publics considèrent Cohere comme un acteur durable de l’infrastructure IA enterprise ou comme un bénéficiaire temporaire du boom IA.

Les multiples typiques d’entreprises IA enterprise en bourse sont de 15 à 25x l’ARR, ce qui suggérerait une valorisation publique dans la fourchette de 3,6 à 6 milliards de dollars sur la base de l’ARR actuel. Cependant, la trajectoire de croissance pourrait justifier une prime si elle se maintient.

Questions fréquentes

Qui a fondé Cohere et pourquoi ?

Cohere a été fondée en 2019 à Toronto par Aidan Gomez (CEO, coauteur de l’article fondateur sur les Transformers), Ivan Zhang et Nick Frosst (ancien chercheur chez Geoffrey Hinton). L’objectif : construire des modèles de langage optimisés pour l’enterprise, avec un focus sur la sécurité des données, le déploiement flexible et la recherche sémantique (RAG).

Quelle est la différence entre Cohere et OpenAI ?

Cohere est 100% enterprise-first : pas de produit consumer grand public (pas de ChatGPT-like viral). L’accent est mis sur le RAG (trio Command + Embed + Rerank), le déploiement souverain (on-premise, VPC), et le multilingue. OpenAI est consumer-first avec ChatGPT, propose un écosystème plus large (images, vidéo, code) mais offre moins d’options de déploiement privé. Pour les entreprises qui ont besoin de garder le contrôle sur leurs données, Cohere est souvent le choix le plus adapté.

Combien coûte l’API Cohere ?

Command R+ : $2,50/M tokens en entrée, $10,00/M en sortie (128K contexte). Embed 4 : $0,12/M tokens (multimodal texte + images). Rerank : $2,00 par 1 000 unités de recherche. Un plan gratuit existe pour le prototypage, mais la production nécessite un API key payant. Des remises volume et des plans enterprise sur mesure sont disponibles.

Qu’est-ce que North ?

North est la plateforme d’agents IA enterprise de Cohere, en GA depuis août 2025. C’est un workspace sécurisé qui intègre les modèles Command, Embed et Rerank pour déployer des agents IA adaptés aux processus internes des entreprises. Pensez-le comme un concurrent de Microsoft Copilot ou Google Vertex AI, mais construit autour de la souveraineté des données et de la flexibilité de déploiement.

Cohere va-t-elle entrer en bourse ?

Les signaux pointent vers une IPO en 2026. L’embauche d’un CFO expérimenté en IPO (Francois Chadwick, ex-Uber), un ARR de $240M avec une croissance >50% trimestrielle, et les déclarations du CEO sur un calendrier « bientôt » suggèrent des préparatifs actifs. Cependant, rien n’est confirmé officiellement, et le timing dépendra des conditions de marché.