Gemini : la famille de modeles IA multimodaux de Google
- Editeur
- Google DeepMind
- Version phare
- Gemini 3.1 Pro Preview (fevrier 2026)
- Modeles actifs
- Gemini 3.1 Pro, Gemini 3 Flash, Gemini 3.1 Flash-Lite
- Contexte
- Jusqu’a 1M tokens (gamme 3.x)
- Output max
- ~65 000 tokens (3.1 Pro)
- Multimodal
- Texte, images, audio, video, code
- Tier gratuit
- Oui (Google AI Studio, quotas limites)
- URL
- gemini.google.com
Qu’est-ce que Gemini ?
Gemini designe a la fois une famille de modeles de langage et le chatbot grand public de Google (accessible sur gemini.google.com et dans l’app mobile). C’est la reponse directe de Google a ChatGPT d’OpenAI et a Claude d’Anthropic.
Ce qui distingue Gemini de la concurrence : ses modeles sont nativement multimodaux. Ils ne sont pas construits en assemblant un modele texte + un modele image + un modele audio. L’ensemble est entraine de maniere unifiee, ce qui lui permet de comprendre et de generer du contenu a travers plusieurs modalites simultanement.
En mars 2026, la gamme active comprend trois tiers principaux : Gemini 3.1 Pro (le modele phare pour les taches complexes), Gemini 3 Flash (le modele rapide et economique) et Gemini 3.1 Flash-Lite (le tier ultra-economique lance le 3 mars 2026).
Les modeles Gemini en mars 2026
Gemini 3.1 Pro Preview
Annonce le 19 fevrier 2026, Gemini 3.1 Pro est le modele le plus avance de Google pour les taches complexes. Il remplace Gemini 3 Pro Preview, qui a ete arrete le 9 mars 2026.
Ses performances sont impressionnantes : il a obtenu un score de 77,1 % sur ARC-AGI-2, un benchmark concu pour empecher la memorisation, soit plus du double du score de Gemini 3 Pro trois mois plus tot. Il se classe numero un sur 12 des 18 benchmarks suivis par Google et offre un doublement des capacites de raisonnement par rapport a la generation precedente.
Gemini 3.1 Pro supporte une fenetre de contexte de 1M de tokens avec un output allant jusqu’a 65K tokens. Il est accessible via l’API Gemini, Vertex AI, l’app Gemini et NotebookLM.
Gemini 3 Flash
Gemini 3 Flash est le modele rapide et economique de la gamme. Il offre un excellent compromis entre performance et cout, avec un prix API d’environ 0,50 $/M tokens en input et 3 $/M en output. Il supporte egalement une fenetre de contexte d’1M de tokens.
Flash est le choix par defaut pour les applications a fort volume qui necessitent des reponses rapides sans mobiliser la puissance complete de Pro.
Gemini 3.1 Flash-Lite
Lance le 3 mars 2026, Flash-Lite est le modele le plus economique de Google : environ 0,25 $/M tokens en input et 1,50 $/M en output. Il cible les cas d’usage a tres fort volume ou la latence et le cout priment sur la qualite maximale.
Modeles legacy
Gemini 2.5 Pro et Flash sont encore disponibles mais consideres comme legacy. Gemini 2.0 Flash est annonce comme devant etre arrete autour du 1er juin 2026.
Tarification
API
| Modele | Input (par 1M tokens) | Output (par 1M tokens) |
|---|---|---|
| Gemini 3.1 Pro | ~2,00 $ | ~12,00 $ |
| Gemini 3 Flash | ~0,50 $ | ~3,00 $ |
| Gemini 3.1 Flash-Lite | ~0,25 $ | ~1,50 $ |
Un point important : Gemini applique toujours un surcout pour les requetes depassant environ 200K tokens de contexte. C’est un desavantage par rapport a Claude Opus 4.6 et Claude Sonnet 4.6, qui ont supprime tout surcout long contexte depuis le 13 mars 2026.
Un tier gratuit est disponible via Google AI Studio pour la plupart des modeles, avec des quotas limites.
Abonnements grand public
| Plan | Prix | Acces |
|---|---|---|
| Gratuit | 0 $ | Acces basique a Gemini |
| Google AI Pro | ~19,99 $/mois | Gemini 3.1 Pro, limites etendues |
| Ultra | ~249,99 $/mois | Acces maximal, priorite |
Capacites multimodales
La force de Gemini reside dans sa polyvalence multimodale native :
Texte : comprehension, generation, traduction, resume, analyse. C’est la base commune a tous les LLM.
Images : analyse de photos, graphiques, diagrammes, captures d’ecran. Gemini peut decrire, classifier et extraire de l’information visuelle. La generation d’images est assuree par Imagen 4.0.
Audio : transcription, comprehension de parole, analyse de contenu audio. Gemini traite l’audio nativement, sans conversion texte intermediaire.
Video : analyse de clips video, comprehension de scenes, extraction d’informations temporelles. La generation video est assuree par Veo 3.1.
Code : generation, debug, refactoring, explication de code dans de nombreux langages. Gemini se comporte comme un assistant de developpement complet.
Ecosysteme Google
L’avantage strategique de Gemini est son integration profonde dans l’ecosysteme Google :
Google Workspace : Gemini est integre a Gmail, Docs, Sheets, Slides et Meet pour l’aide a la redaction, l’analyse de donnees et la generation de presentations.
NotebookLM : l’assistant de recherche IA de Google utilise les modeles Gemini pour analyser des documents, generer des resumes audio et repondre aux questions avec citations.
Google AI Studio : l’interface de prototypage gratuite pour experimenter avec les modeles Gemini via une interface web ou l’API.
Vertex AI : la plateforme enterprise de Google Cloud pour deployer Gemini a l’echelle avec des garanties SLA, de gouvernance et de conformite.
Gemini vs ChatGPT vs Claude
| Critere | Gemini 3.1 Pro | GPT-5.4 | Claude Opus 4.6 |
|---|---|---|---|
| Contexte | 1M tokens | ~1,05M tokens | 1M tokens |
| Surcout long contexte | Oui (>200K) | Oui (>272K) | Non (supprime) |
| Multimodal natif | Texte, image, audio, video | Texte, image, audio | Texte, image |
| Generation images | Imagen 4.0 | DALL-E | Non |
| Generation video | Veo 3.1 | Sora 2 | Non |
| Prix input API | ~2 $/M | ~2,50 $/M | 5 $/M |
| Prix output API | ~12 $/M | ~15 $/M | 25 $/M |
| ARC-AGI-2 | 77,1 % | Non publie | ~2x Opus 4.5 |
| Tier gratuit | Oui | Oui (avec pub) | Oui |
Le verdict : Gemini 3.1 Pro se distingue par sa polyvalence multimodale (audio et video natifs) et son excellent score sur ARC-AGI-2. GPT-5.4 excelle en capacites agentiques (computer use natif). Claude Opus 4.6 offre le meilleur rapport qualite/prix sur le long contexte grace a l’absence de surcout. Le choix depend de vos priorites : multimodalite complete (Gemini), agents autonomes (GPT-5.4), ou traitement massif de documents (Claude).
Historique des versions Gemini
| Version | Date | Avancee principale |
|---|---|---|
| Gemini 1.0 | Decembre 2023 | Lancement initial (Pro, Ultra, Nano) |
| Gemini 1.5 | Fevrier 2024 | Fenetre de contexte etendue (1M tokens) |
| Gemini 2.0 | 2024-2025 | Flash et Pro ameliores |
| Gemini 2.5 | 2025 | Pro et Flash avec raisonnement avance |
| Gemini 3 Pro/Flash | Fin 2025 | Nouvelle architecture, performances accrues |
| Gemini 3.1 Pro | Fevrier 2026 | 77,1 % ARC-AGI-2, 2x raisonnement |
| Gemini 3.1 Flash-Lite | Mars 2026 | Tier ultra-economique |
Limites de Gemini
Malgre ses forces, Gemini presente plusieurs limites a connaitre. Le surcout applique au-dela de 200K tokens rend le traitement de longs documents plus cher que chez Anthropic. Les fonctionnalites varient selon les regions : certaines capacites (generation d’images, audio) ne sont pas disponibles partout. L’integration profonde avec l’ecosysteme Google peut etre un frein pour les entreprises qui ne sont pas sur Google Cloud.
L’app Gemini est encore en retard sur ChatGPT en termes de plugins et d’integrations tierces. Et sur les taches purement textuelles de haut niveau (redaction longue, analyse juridique), Claude Opus 4.6 conserve souvent un avantage qualitatif.
FAQ Gemini
Gemini est-il gratuit ?
Oui, Gemini est accessible gratuitement sur gemini.google.com et via Google AI Studio (pour les developpeurs). Le plan gratuit donne acces aux modeles de base avec des quotas limites. Pour un acces complet a Gemini 3.1 Pro et des quotas etendus, il faut souscrire a Google AI Pro (~19,99 $/mois) ou Ultra (~249,99 $/mois).
Quelle est la difference entre Gemini Pro et Gemini Flash ?
Gemini Pro est le modele premium pour les taches complexes (raisonnement, analyse, code avance). Gemini Flash est optimise pour la vitesse et le cout, ideal pour les applications a fort volume. Pro coute environ 4 fois plus cher que Flash en termes de prix API.
Gemini peut-il comprendre de la video ?
Oui, Gemini est l’un des rares modeles a pouvoir analyser nativement du contenu video : comprendre des scenes, extraire des informations temporelles, repondre a des questions sur une video. La generation de video est assuree par le modele separe Veo 3.1.
Comment acceder a Gemini via l’API ?
Deux options : Google AI Studio (ai.google.dev) pour le prototypage avec un tier gratuit, ou Vertex AI (Google Cloud) pour la production avec SLA et gouvernance. Les deux supportent les memes modeles avec des SDKs Python, Node.js et REST.
Gemini remplace-t-il Google Bard ?
Oui, Google Bard a ete renomme Gemini en fevrier 2024. L’interface chatbot accessible sur gemini.google.com est la suite directe de Bard, mais elle utilise desormais les modeles Gemini beaucoup plus puissants.