Prompt : l’art d’instruire une intelligence artificielle

Definition rapide Un prompt est le texte d’instruction que vous envoyez a un modele d’IA generative pour obtenir une reponse. C’est l’interface entre votre intention humaine et la capacite de calcul du modele. La qualite du prompt determine directement la qualite de la reponse.

Categorie: Concept fondamental IA generative
Types: Systeme, utilisateur, few-shot, zero-shot, chain-of-thought
Mesure en: Tokens
Discipline: Prompt Engineering
Voir aussi: Context Window, Temperature, Inference

Qu’est-ce qu’un prompt ?

Dans le contexte de l’IA generative, un prompt designe toute entree textuelle soumise a un LLM (Large Language Model) pour declencher une generation de texte, d’image, de code ou de tout autre contenu. Le terme vient de l’anglais « to prompt » : inciter, susciter.

Quand vous tapez une question dans ChatGPT ou Claude, vous redigez un prompt. Quand un developpeur envoie une requete a l’API d’OpenAI ou d’Anthropic, le contenu du champ « messages » constitue le prompt. Quand un outil de generation d’images comme Midjourney recoit une description textuelle, cette description est le prompt.

Le prompt n’est pas une simple question. C’est un ensemble d’instructions qui peut inclure du contexte, des contraintes, un format de sortie souhaite, des exemples et un role a jouer. Plus le prompt est precis et structure, plus la reponse du modele sera pertinente.

Les types de prompts

Prompt systeme (System Prompt)

Le prompt systeme definit le comportement global du modele pour toute la conversation. Il n’est pas visible par l’utilisateur final dans la plupart des interfaces. C’est l’espace ou vous definissez le role, le ton, les contraintes et les regles que le modele doit suivre.

Tu es un expert en droit fiscal francais. Tu reponds uniquement 
aux questions liees a la fiscalite. Tu cites les articles de loi 
pertinents. Tu utilises un langage accessible mais precis.
Tu refuses de donner des conseils personnalises.

Chez OpenAI, le prompt systeme est passe dans le role « system ». Chez Anthropic, il est defini via le parametre « system » de l’API Messages. Ce prompt est facture en tokens d’entree a chaque requete, mais il est generalement mis en cache cote serveur pour les requetes repetees.

Prompt utilisateur (User Prompt)

C’est le message que l’utilisateur envoie directement au modele. Il contient la question, la tache ou la demande concrete. Dans une application, c’est ce que l’utilisateur tape dans le champ de saisie.

Zero-shot prompt

Un prompt zero-shot demande au modele d’effectuer une tache sans lui fournir d’exemple prealable. Le modele s’appuie uniquement sur ses connaissances acquises durant le pre-entrainement.

Classifie ce commentaire client comme "positif", "negatif" ou "neutre" :
"La livraison etait rapide mais le produit est arrive endommage."

Les modeles recents (GPT-4o, Claude 3.5 Sonnet, Gemini 2.0) sont performants en zero-shot pour la plupart des taches courantes. C’est l’approche la plus economique en tokens.

Few-shot prompt

Un prompt few-shot inclut plusieurs exemples de la tache souhaitee avant de poser la question reelle. Ces exemples servent de demonstration pour calibrer le format et la logique de la reponse attendue.

Classifie ces commentaires :
"Excellent produit, je recommande" -> positif
"Tres decu, ne fonctionne pas" -> negatif
"Le produit correspond a la description" -> neutre

"La livraison etait rapide mais le produit est arrive endommage" ->

Le few-shot est particulierement utile pour les taches de classification, d’extraction structuree et de formatage specifique. Le compromis : chaque exemple consomme des tokens dans la fenetre de contexte.

Chain-of-thought prompt

Le prompt chain-of-thought (CoT) encourage le modele a decomposer son raisonnement en etapes intermediaires avant de donner sa reponse finale. C’est la technique la plus efficace pour les taches de logique, de mathematiques et de raisonnement complexe.

Un magasin propose 20 % de reduction sur un article a 85 euros, 
puis 10 % de reduction supplementaire pour les membres fidelite.
Quel est le prix final ? Raisonne etape par etape.

Ajouter « Raisonne etape par etape » ou « Reflechis avant de repondre » ameliore significativement la precision des reponses sur les taches complexes. Les modeles de raisonnement comme o1 et o3 d’OpenAI integrent cette approche nativement.

Anatomie d’un bon prompt

Un prompt efficace contient generalement ces composants, dans cet ordre :

Le role. Definissez qui est le modele dans cette interaction. « Tu es un developpeur Python senior » produit des reponses differentes de « Tu es un enseignant qui explique a des debutants ».

Le contexte. Fournissez les informations de fond necessaires. Sans contexte, le modele complete avec ses propres hypotheses, qui peuvent etre erronees.

La tache. Formulez clairement ce que le modele doit faire. Utilisez des verbes d’action precis : « Analyse », « Compare », « Redige », « Genere », « Traduis ».

Le format de sortie. Specifiez le format attendu : JSON, tableau, liste a puces, paragraphe, code, etc. Sans cette indication, le modele choisit un format generique qui ne correspond pas toujours a vos besoins.

Les contraintes. Indiquez les limites : longueur, langue, ton, ce qu’il ne faut PAS faire. Les contraintes negatives (« Ne mentionne pas X ») sont souvent aussi importantes que les instructions positives.

Les exemples. Si le format est complexe ou inhabituel, montrez un ou deux exemples de la sortie attendue.

Les erreurs les plus courantes

Le prompt vague. « Parle-moi de l’IA » produit une reponse generique. « Explique les 3 principales differences entre le deep learning et le machine learning, avec un exemple concret pour chaque » produit une reponse utile.

Le prompt trop long. Un prompt de 3 000 mots qui repete les memes instructions sous differentes formes ne gaspille des tokens sans ameliorer la reponse. La concision est une vertu en prompting.

L’absence de format. Sans indication de format, le modele repond en prose libre. Si vous voulez un JSON, un tableau ou une liste structuree, dites-le explicitement.

Les instructions contradictoires. « Sois bref mais couvre tous les aspects en detail » met le modele dans une situation impossible. Priorisez vos contraintes.

Ignorer le prompt systeme. Les developpeurs qui mettent toutes les instructions dans le prompt utilisateur passent a cote d’un outil puissant. Le prompt systeme isole les instructions recurrentes et ameliore la coherence.

Prompts et API : l’usage technique

Quand vous travaillez avec l’API d’un fournisseur d’IA, le prompt prend la forme d’un tableau de messages structures :

{
  "model": "gpt-4o",
  "messages": [
    {
      "role": "system",
      "content": "Tu es un assistant de traduction FR>EN."
    },
    {
      "role": "user",
      "content": "Traduis : Bonjour, comment allez-vous ?"
    }
  ],
  "temperature": 0.3,
  "max_tokens": 200
}

Les parametres temperature et top-p influencent la creativite de la reponse. Pour des taches factuelles (traduction, extraction), une temperature basse (0,1 a 0,3) produit des reponses plus deterministes. Pour des taches creatives (redaction, brainstorming), une temperature plus elevee (0,7 a 1,0) favorise la diversite.

Prompts pour la generation d’images

Les prompts pour les modeles text-to-image (Midjourney, DALL-E 3, Stable Diffusion, Flux) suivent des conventions specifiques. Ils combinent generalement un sujet, un style, un eclairage, une composition et des parametres techniques.

Un prompt efficace pour la generation d’images est descriptif et visuel, pas instructif. Au lieu de « Dessine-moi un chat mignon », preferez « Un chaton roux endormi sur un coussin de velours bleu, lumiere douce de fin d’apres-midi, style aquarelle, gros plan ».

L’evolution des prompts

Les prompts evoluent avec les modeles. Les premiers LLM necessitaient des prompts tres structures et des hacks specifiques pour obtenir de bons resultats. Les modeles actuels comprennent des instructions en langage naturel et sont beaucoup plus tolerants aux formulations imparfaites.

La tendance actuelle est a la simplification : les modeles de derniere generation (Claude 3.5, GPT-4o, Gemini 2.0) requierent moins de « tricks » de prompting et repondent mieux a des instructions directes et claires. La discipline du prompt engineering se concentre desormais moins sur les astuces techniques et plus sur la clarte de la communication.

FAQ

Quelle est la difference entre un prompt et une requete ?

En pratique, ces termes sont souvent utilises de maniere interchangeable. Techniquement, la requete (request) designe l’ensemble de l’appel API (incluant le modele, les parametres, les tokens max), tandis que le prompt designe specifiquement le contenu textuel envoye au modele. Dans le langage courant, « prompt » et « requete » designent la meme chose : le texte que vous envoyez a l’IA.

Faut-il ecrire ses prompts en anglais ou en francais ?

Les modeles actuels sont performants dans les deux langues. L’anglais consomme moins de tokens (environ 30 a 40 % de moins) et les modeles ont ete davantage entraines en anglais, ce qui peut donner un leger avantage en precision. En pratique, si votre sortie doit etre en francais, redigez votre prompt en francais pour eviter les problemes de traduction implicite.

Un prompt plus long donne-t-il de meilleurs resultats ?

Pas necessairement. Un prompt clair et concis de 100 mots peut largement surpasser un prompt confus de 500 mots. La qualite prime sur la quantite. L’objectif est de fournir exactement les informations necessaires au modele : ni trop (bruit), ni trop peu (ambiguite). Le sweet spot se situe generalement entre 50 et 300 mots pour les taches courantes.

Peut-on reutiliser un prompt entre differents modeles ?

Oui, mais les resultats varieront. Chaque modele a ses forces et ses particularites. Un prompt optimise pour GPT-4o peut necessiter des ajustements pour Claude ou Gemini. Les differences sont surtout visibles dans les prompts complexes avec des instructions de formatage specifiques. Pour les prompts simples, la portabilite est excellente.

Comment savoir si mon prompt est bon ?

Testez-le plusieurs fois (les reponses varient a chaque generation a cause de la temperature). Si la reponse correspond a ce que vous attendiez dans plus de 80 % des cas, votre prompt est efficace. Si les reponses sont incoherentes ou hors sujet, ajoutez du contexte, des exemples ou des contraintes. L’iteration est la cle du bon prompting.