Windsurf Cascade : guide complet de l’agent IA

Cascade est l’agent IA agentique de Windsurf. Ce n’est pas un simple chatbot greffé sur un éditeur de code : c’est un système qui lit votre codebase entier, comprend les relations entre fichiers, planifie des modifications multi-étapes, exécute des commandes terminal, et corrige automatiquement ses propres erreurs de lint.

Type: Agent IA agentique (planification + exécution + vérification)
Raccourci: ⌘+L (macOS) / Ctrl+L (Windows/Linux)
Modes: Write (modifications de code), Chat (questions sans modifications)
Outils intégrés: Search, Analyze, Web Search, MCP, Terminal (jusqu’à 20 appels d’outils par prompt)
Contexte: Codebase complet via indexation + Fast Context
Modèles: Multi-modèle : GPT-5.4, Claude Sonnet 4.6, Opus 4.6, Gemini 3.1 Pro, SWE-1 (modèle interne)
Plan requis: Free (quotas limités), Pro (20 $/mois), Max (200 $/mois), Teams (40 $/user)

Qu’est-ce qui rend Cascade différent ?

La plupart des assistants IA de code fonctionnent en mode question-réponse : vous posez une question, le modèle répond. Cascade fonctionne en boucle continue : il lit votre codebase, planifie une séquence d’actions, exécute les modifications, vérifie les résultats (lint, tests, terminal), et itère pour corriger les problèmes. C’est la différence entre un assistant et un agent.

Cascade traque en permanence vos actions : fichiers édités, fichiers consultés, commandes terminal, historique du clipboard. Il infère votre intention et adapte ses suggestions en temps réel. Si vous venez de modifier un fichier de routes API et que vous ouvrez un fichier de tests, Cascade comprend que vous êtes probablement en train de tester votre route et ajuste ses propositions en conséquence.

Cette conscience contextuelle continue est ce que Windsurf appelle le « Flow paradigm ». L’objectif est de ne jamais vous faire sortir de votre état de flow : vous décrivez ce que vous voulez, Cascade exécute, vous validez.

Les deux modes : Write et Chat

Mode Write (modifications de code)

Le mode Write est le mode par défaut quand vous ouvrez Cascade. Dans ce mode, Cascade peut créer, modifier et supprimer des fichiers. Il propose des diffs que vous acceptez ou rejetez. Il peut aussi exécuter des commandes terminal (installation de packages, lancement de tests, build).

Un workflow typique en mode Write : vous décrivez une tâche (« Ajoute un endpoint GET /api/users avec pagination et filtrage par rôle »). Cascade analyse votre codebase, identifie les fichiers concernés (routes, services, modèles), crée un plan, génère le code, propose les modifications en diff, et suggère de lancer les tests. Vous validez chaque étape ou activez le Turbo Mode pour l’exécution autonome.

Mode Chat (questions et explications)

Le mode Chat permet de poser des questions sans que Cascade ne touche à votre code. Utile pour comprendre une partie du codebase, obtenir des explications, ou discuter d’une approche architecturale avant de se lancer. Les réponses sont basées sur le contexte de votre projet, pas sur des connaissances génériques.

Exemples : « Explique comment fonctionne l’authentification dans ce projet », « Quels sont les endpoints API définis et leurs paramètres ? », « Quelle serait la meilleure approche pour ajouter du caching sur ce service ? ».

Les outils de Cascade

Cascade dispose d’une palette d’outils qu’il invoque automatiquement selon la tâche. Jusqu’à 20 appels d’outils sont autorisés par prompt. Si la trajectoire s’arrête (limite atteinte), appuyez sur « Continue » et Cascade reprend où il s’est arrêté (chaque continuation consomme un prompt supplémentaire).

Search et Analyze

Cascade peut parcourir votre codebase pour trouver des fichiers, des symboles, des définitions et des références. L’outil Analyze construit un graphe de dépendances à partir de vos fichiers et traverse les imports pour identifier tous les fichiers impactés par une modification. C’est ce qui permet les opérations de renommage + mise à jour de tous les imports en une seule passe.

Web Search

Cascade peut chercher sur le web pour trouver de la documentation, des exemples, ou des solutions à des problèmes. Les résultats sont injectés dans le contexte de la conversation. Utile quand vous travaillez avec une API tierce ou une bibliothèque que Cascade ne connaît pas en détail.

Terminal

Cascade détecte les packages et outils que vous utilisez, identifie ceux qui doivent être installés, et peut les installer pour vous. Il exécute des commandes terminal (npm install, pytest, build, migrations) et lit les sorties stdout/stderr pour adapter sa stratégie. Si un test échoue, il lit l’erreur et propose une correction.

Depuis les mises à jour récentes, Cascade utilise un terminal dédié (Cascade Dedicated Terminal) au lieu de votre shell par défaut. Ce terminal zsh est configuré pour la fiabilité et supporte les variables d’environnement de votre .zshrc. Il est interactif : vous pouvez répondre aux prompts des scripts shell sans interrompre votre workflow.

Serveurs MCP

Le Model Context Protocol étend les capacités de Cascade avec des outils externes. Configurez des serveurs MCP dans les paramètres Windsurf pour connecter Cascade à des bases de données, des API, du monitoring (Sentry), de la gestion de tâches (Linear), ou le serveur GitHub MCP pour les issues et PR. Les serveurs MCP curés sont disponibles directement dans les paramètres Windsurf pour une configuration en un clic.

Live Preview et Browser

Windsurf intègre un navigateur fonctionnel qui se connecte à Cascade. Vous pouvez voir votre site en live dans l’IDE, cliquer sur un élément, et demander à Cascade de le modifier. Le preview fonctionne aussi dans un navigateur externe (Chrome, Arc, navigateurs basés sur Chromium). Cette fonctionnalité est gratuite et ne consomme pas de crédits.

Deploy

Un clic suffit pour déployer votre application depuis Windsurf. La fonctionnalité Deploy permet de packager et partager vos projets sur internet directement depuis l’IDE. Le nombre de déploiements par jour dépend de votre plan (1/jour sur Free, 5/jour sur Pro).

Plan Mode : planifier avant d’agir

Le Plan Mode (ajouté en janvier 2026) ajoute une couche de planification structurée. Un agent de planification spécialisé raffine continuellement le plan à long terme en arrière-plan, pendant que votre modèle sélectionné se concentre sur les actions à court terme.

Cascade crée une Todo list dans la conversation pour suivre la progression sur les tâches complexes. Vous pouvez modifier le plan en demandant à Cascade de mettre à jour la Todo list. L’agent met aussi à jour le plan automatiquement quand il découvre de nouvelles informations (par exemple via une Memory) pendant la conversation.

Le Plan Mode est particulièrement utile pour les tâches longues (plus de 10 étapes). Sans planification explicite, Cascade peut dériver et oublier des sous-tâches. Avec le Plan Mode, chaque étape est trackée et vérifiable.

Arena Mode : comparer les modèles

L’Arena Mode (janvier 2026) est une fonctionnalité unique à Windsurf. Lancez deux agents Cascade côte à côte avec des identités de modèles masquées. Posez la même question aux deux, comparez les résultats, et votez pour le meilleur. Vos votes alimentent un leaderboard personnel (vos préférences) et un leaderboard global (tous les utilisateurs Windsurf).

Les Battle Groups permettent de choisir des modèles spécifiques à comparer (par exemple « modèles rapides » vs « modèles intelligents ») ou de laisser Windsurf sélectionner aléatoirement. Vous pouvez envoyer des prompts de suivi aux deux agents simultanément (Sync) ou brancher pour explorer des chemins différents (Branch).

L’intérêt est de découvrir quels modèles fonctionnent réellement le mieux pour votre type de code et vos tâches, plutôt que de se fier aux benchmarks génériques. C’est un outil de découverte, pas un outil de production quotidien.

Mémoires : le contexte persistant

Cascade génère automatiquement des « Memories » pour retenir le contexte important entre les conversations. Les mémoires sont scopées au workspace et ne consomment pas de quotas. Quand Cascade apprend quelque chose d’important sur votre codebase (un pattern architectural, une convention de nommage, une contrainte technique), il le stocke comme mémoire et le réutilise dans les conversations futures.

Vous pouvez aussi créer des mémoires manuelles pour fixer des informations que Cascade doit toujours garder en tête. Les mémoires manuelles prennent priorité sur les mémoires automatiques en cas de conflit.

Les mémoires fonctionnent en tandem avec le fichier .windsurfrules (vos règles explicites) et les Windsurf Rules (rulebooks invocables via des slash commands). Ensemble, ces trois couches forment le système de personnalisation de Cascade. Consultez notre guide dédié sur les règles Windsurf pour les configurer.

Modèles disponibles

Cascade supporte un large éventail de modèles, sélectionnables via le menu sous la zone de saisie :

Modèle	Type	Coût en quotas
SWE-1	Modèle interne Windsurf (optimisé code)	Coût fixe par prompt
SWE-1 Lite	Version légère, rapide	0 (gratuit)
GPT-5.4	Flagship OpenAI	Variable (tokens)
Claude Sonnet 4.6	Équilibre performance/coût Anthropic	Variable (tokens)
Claude Opus 4.6	Modèle le plus puissant Anthropic	Variable (tokens, plus élevé)
Gemini 3.1 Pro	Flagship Google	Variable (tokens)
GPT-5.2-Codex	Spécialisé code agentique (OpenAI)	Variable (4 niveaux de raisonnement)

Le modèle SWE-1 Lite est gratuit et disponible même après épuisement de vos quotas. C’est le filet de sécurité qui garantit que Cascade reste toujours utilisable. Les modèles tiers (Claude, GPT, Gemini) consomment vos quotas proportionnellement aux tokens traités. Les conversations longues avec des modèles premium drainent les quotas plus vite.

Sur les plans Free et Pro, vous pouvez connecter votre propre clé API (BYOK, Bring Your Own Key) pour éviter de consommer les quotas Windsurf. Cette option n’est pas disponible sur les plans Teams et Enterprise (facturation centralisée obligatoire).

Fonctionnalités avancées

Turbo Mode

Le Turbo Mode permet à Cascade d’exécuter des commandes terminal de manière autonome sans demander votre validation à chaque étape. Activez-le dans les paramètres Windsurf. C’est l’équivalent du /yolo de Copilot Chat. Utile pour les tâches répétitives ou les environnements de test, à éviter sur du code de production sans supervision.

Auto-lint gratuit

Quand Cascade génère du code qui produit des erreurs de lint, il les détecte et les corrige automatiquement dans une étape suivante. Cette correction ne consomme pas de crédits supplémentaires. Le LLM décide quand il s’agit purement de corrections de lint (gratuites) vs de modifications substantielles (facturées).

Checkpoints et rollback

Cascade crée des checkpoints à chaque étape significative. Vous pouvez revenir en arrière à n’importe quel point si l’agent part dans une mauvaise direction. C’est un filet de sécurité essentiel pour les tâches complexes. Les checkpoints sont aussi utilisés par le Plan Mode pour tracker la progression.

Saisie vocale

Cascade supporte la saisie vocale pour interagir par la voix. La transcription speech-to-text convertit votre parole en texte dans le champ de saisie. Utile pour décrire des tâches complexes sans taper.

Partage de conversations

Vous pouvez partager vos conversations Cascade avec votre équipe via le bouton « Share Conversation ». Les conversations partagées incluent le contexte, les modifications, et le raisonnement de l’agent. Sur les plans Teams et Enterprise, c’est un outil puissant pour standardiser les bonnes pratiques : quand un développeur trouve une approche efficace, il partage la trajectoire complète.

Référence entre conversations

Vous pouvez référencer des conversations précédentes via un @-mention dans une nouvelle conversation. Cascade récupère les informations les plus pertinentes (résumés, checkpoints, parties spécifiques) sans charger l’intégralité de la conversation pour ne pas surcharger la fenêtre de contexte.

Sessions parallèles

Vous pouvez démarrer une nouvelle session Cascade pendant qu’une autre s’exécute. Jamais de temps d’attente : si Cascade travaille sur une tâche, ouvrez un second panneau et continuez sur autre chose.

Cascade vs les alternatives

Critère	Windsurf Cascade	Copilot Chat + Agent Mode	Cursor Composer
Type	Agent unique persistant	Chat + agent interactif	Éditeur multi-fichiers + subagents
Contexte codebase	Indexation complète + Memories	Fichier actif + @workspace + RAG	Indexation sémantique + Team Indexing
Planification	Plan Mode (Todo list, agent de planification)	Plan Mode (blueprint avant exécution)	Plan Mode (depuis Cursor 2.5)
Terminal	Terminal dédié zsh, Turbo Mode	Commandes terminal avec validation	Terminal inline
Auto-lint	✅ (gratuit)	❌	❌
Arena (comparaison modèles)	✅	❌	❌
Mémoires persistantes	✅ (auto + manuelles)	Agentic memory (Coding Agent)	❌
Live Preview + browser	✅ (intégré)	Agentic browser (preview)	❌
Deploy en un clic	✅	❌	❌
Sessions parallèles	✅	❌	✅ (Background Agents)
Prix (Pro)	20 $/mois	10 $/mois	20 $/mois

Cascade se distingue par son auto-lint gratuit, son Arena Mode unique, ses mémoires persistantes, et son deploy intégré. Copilot gagne sur le prix (10 $ vs 20 $) et la compatibilité multi-IDE. Cursor mène sur les subagents et les Background Agents cloud. Pour un comparatif prix complet, consultez Windsurf vs Cursor.

Bonnes pratiques avec Cascade

Écrivez un bon fichier .windsurfrules. C’est le levier de productivité n°1. Sans ce fichier, Cascade utilise des réglages par défaut conservateurs et ignore vos conventions. Consultez notre guide Windsurf rules.

Utilisez le Plan Mode pour les tâches longues. Toute tâche de plus de 5 étapes bénéficie d’un plan explicite. Vérifiez le plan avant l’exécution. Modifiez-le si nécessaire.

Privilégiez SWE-1 Lite pour les questions simples. Le modèle interne est gratuit. Réservez les modèles premium (Opus 4.6, GPT-5.4) pour les tâches complexes qui justifient la consommation de quotas.

Activez l’Auto-Continue avec prudence. Chaque continuation consomme un prompt supplémentaire. Sur les tâches complexes, cela peut drainer vos quotas rapidement. Préférez le Continue manuel pour garder le contrôle.

Exploitez les Memories. Après quelques sessions, Cascade accumule des mémoires sur votre projet. Vérifiez-les dans les paramètres et corrigez les informations incorrectes. Les mémoires de qualité améliorent chaque conversation future.

Questions fréquentes

Cascade fonctionne-t-il hors ligne ?

Non. Cascade nécessite une connexion internet active pour communiquer avec les serveurs de Windsurf. Le support de modèles locaux n’est pas disponible en mars 2026. Si votre connexion est coupée, les Tab completions et Cascade cessent de fonctionner. L’éditeur reste utilisable comme un éditeur de code classique (c’est un fork de VS Code).

Combien coûte une session Cascade ?

Chaque message envoyé à Cascade consomme un ou plusieurs crédits de votre quota, selon le modèle utilisé. SWE-1 Lite est gratuit. SWE-1 a un coût fixe par prompt. Les modèles tiers (Claude Sonnet 4.6, GPT-5.4) sont facturés au token (input + output). Une conversation longue avec un modèle premium peut consommer significativement plus qu’un prompt rapide. L’auto-lint est gratuit. Le « Continue » (quand Cascade atteint la limite de 20 appels d’outils) consomme un prompt supplémentaire.

Quelle est la différence entre Cascade et le chat de Copilot ?

La différence principale est la profondeur de contexte et l’autonomie. Copilot Chat a accès au fichier actif et aux fichiers ouverts (ou au workspace via @workspace). Cascade indexe votre codebase entier et maintient des mémoires persistantes entre les sessions. Cascade peut aussi exécuter des commandes terminal, déployer des apps, et utiliser un navigateur intégré pour vérifier visuellement les résultats. Le chat de Copilot évolue rapidement (Agent Mode, hooks, plugins), mais Cascade reste plus profond dans l’intégration IDE.

Cascade peut-il casser mon code ?

Oui, comme tout agent IA. C’est pourquoi les checkpoints existent. Chaque modification de Cascade est réversible. Avant d’accepter un diff, lisez-le. Si vous activez le Turbo Mode (exécution autonome), faites-le dans un environnement de test. L’auto-lint réduit les erreurs syntaxiques, mais les bugs logiques subtils (race conditions, edge cases) peuvent passer. Traitez le code de Cascade avec la même rigueur que celui d’un collègue junior.

Puis-je utiliser ma propre clé API avec Cascade ?

Oui, sur les plans Free et Pro. La fonctionnalité BYOK (Bring Your Own Key) permet de connecter vos propres clés API OpenAI, Anthropic, ou Google. Les requêtes sont envoyées directement au fournisseur, sans passer par le système de quotas Windsurf. C’est utile si vous avez déjà un budget API chez un fournisseur. BYOK n’est pas disponible sur les plans Teams et Enterprise (facturation centralisée obligatoire pour la gouvernance).