Code Llama : le modele de code open-source de Meta

Definition rapide Code Llama est une famille de modeles de langage specialises en code, developpes par Meta a partir de la base LLaMA 2. Disponible en versions 7B, 13B, 34B et 70B parametres, il propose trois variantes (base, Python, Instruct) et supporte de nombreux langages de programmation. Publie sous licence Llama Community, il reste l’un des modeles de code open-source les plus deployes.

Editeur: Meta AI
Base: LLaMA 2
Tailles: 7B, 13B, 34B, 70B parametres
Entrainement: 500B tokens de code (1T pour 70B)
Contexte: 16K tokens (ameliore jusqu’a 100K)
HumanEval (70B): 67,8 %
Variantes: Base, Python, Instruct
Licence: Llama Community License
URL: llama.com/code-llama

Qu’est-ce que Code Llama ?

Code Llama est la specialisation code de la famille LLaMA de Meta. Il a ete cree en prenant LLaMA 2 comme base et en le fine-tunant sur un corpus massif de code (500 milliards de tokens pour les versions 7B-34B, 1 trillion pour le 70B).

L’objectif de Meta etait de fournir a la communaute open-source un modele de code performant et libre, capable de concurrencer des solutions proprietaires comme GitHub Copilot. Le resultat : un modele qui, a sa sortie en aout 2023, atteignait des scores comparables a ChatGPT sur la generation de code.

En mars 2026, Code Llama est considere comme un modele mature et largement deploye. Bien que des alternatives plus recentes existent (Codestral, StarCoder2, et meme Llama 4 pour le code), Code Llama reste pertinent grace a son ecosysteme de fine-tunes et sa large adoption dans l’industrie.

Les trois variantes

Code Llama (base)

Le modele fondation, fine-tune sur du code a partir de LLaMA 2. Il gere la generation de code, la completion et l’analyse dans de nombreux langages : Python, C++, Java, PHP, TypeScript, C#, Bash et d’autres. Les versions 7B et 13B supportent l’infilling (completion au milieu du code).

Code Llama – Python

Une specialisation supplementaire sur 100 milliards de tokens de code Python. Ce modele offre des performances superieures au modele base pour tout ce qui touche a Python : generation de fonctions, debug, refactoring, scripts de data science.

Code Llama – Instruct

Fine-tune pour suivre des instructions en langage naturel. C’est la variante a utiliser pour le chat : « Ecris une fonction qui trie une liste », « Debug ce code », « Explique cet algorithme ». Elle est disponible en 7B, 13B et 34B.

Variante	7B	13B	34B	70B
Base	Oui	Oui	Oui	Oui
Python	Oui	Oui	Oui	Oui
Instruct	Oui	Oui	Oui	Non
Infilling (FIM)	Oui	Oui	Non	Non

Benchmarks

Modele	HumanEval	MBPP
Code Llama 7B	~33 %	~47 %
Code Llama 13B	~36 %	~49 %
Code Llama 34B	53,7 %	56,2 %
Code Llama 70B	67,8 %	Non publie

Le 34B etait, a sa sortie, le modele open-source le plus performant sur HumanEval (53,7 %) et MBPP (56,2 %). Le 70B a pousse ces scores a 67,8 % sur HumanEval. En 2026, ces scores ont ete depasses par des modeles plus recents (Codestral a 86,6 %), mais Code Llama reste competitif dans sa tranche de prix (gratuit).

Deploiement local

Modele	VRAM (FP16)	VRAM (4-bit)	Recommandation
Code Llama 7B	~14 Go	~5 Go	RTX 3060 12 Go
Code Llama 13B	~26 Go	~8 Go	RTX 4070 Ti 16 Go
Code Llama 34B	~68 Go	~20 Go	RTX 4090 24 Go (4-bit)
Code Llama 70B	~140 Go	~40 Go	A100 80 Go

Le deploiement via Ollama est trivial : ollama run codellama:7b ou ollama run codellama:34b. Pour la production, vLLM et TGI offrent de meilleures performances de debit.

Code Llama 7B en quantification 4-bit (~5 Go VRAM) est l’un des modeles de code les plus accessibles : il tourne sur pratiquement n’importe quel GPU moderne, y compris les GPUs integres de certains MacBooks.

Code Llama vs StarCoder2 vs Codestral

Critere	Code Llama 34B	StarCoder2 15B	Codestral
HumanEval	53,7 %	Comparable	86,6 %
Langages	~20 principaux	619	80+
Base	LLaMA 2	From scratch	Proprietary
Taille max	70B	15B	Non public
FIM	7B/13B seulement	Toutes tailles	Oui
Specialisation Python	Variante dediee	Non	Non
Licence	Llama Community	OpenRAIL-M	Variable

Code Llama se distingue par sa specialisation Python et ses tailles allant jusqu’a 70B. StarCoder2 offre une couverture linguistique inegalee (619 langages) et une meilleure efficacite (15B rivalise avec 34B). Codestral domine en precision d’autocomplete. Pour un nouveau projet en 2026, Codestral ou StarCoder2 sont souvent preferes, mais Code Llama reste solide pour les pipelines existants.

Astuce Polydesk Si vous utilisez deja Code Llama en production, ne migrez pas en urgence. Mais pour un nouveau projet de code IA en 2026, evaluez d’abord Codestral (meilleure precision), StarCoder2 (plus de langages, plus efficient), ou les capacites code de Llama 4 (multimodal natif).

Statut en mars 2026

Code Llama est un modele mature et stable. Meta n’a pas annonce de Code Llama 2 base sur LLaMA 3 ou Llama 4, suggerant que l’entreprise considere que les capacites code des modeles generalistes recents (Llama 4 Scout/Maverick) sont suffisantes pour la plupart des cas d’usage.

Le modele reste neanmoins tres utilise grace a son ecosysteme de fine-tunes specialises et sa disponibilite sur toutes les plateformes d’inference (Ollama, vLLM, TGI, Amazon SageMaker, etc.).

FAQ Code Llama

Code Llama est-il gratuit ?

Oui, sous Llama Community License (usage commercial autorise pour les entreprises de moins de 700 millions d’utilisateurs actifs mensuels). Les poids sont telechargeables sur Hugging Face et via Ollama.

Quelle version de Code Llama choisir ?

7B pour l’autocomplete rapide et le deploiement leger. 13B pour un bon equilibre. 34B pour la generation de code complexe. 70B pour les performances maximales. Ajoutez le suffixe « -python » si votre projet est principalement Python, « -instruct » si vous avez besoin du mode chat.

Code Llama est-il meilleur que Copilot ?

En termes de performances brutes, GitHub Copilot (qui utilise des modeles proprietaires plus recents) est generalement superieur. L’avantage de Code Llama est d’etre gratuit, deployable localement, et personnalisable par fine-tuning.

Code Llama supporte-t-il l’infilling ?

Oui, mais uniquement les versions 7B et 13B. Les versions 34B et 70B ne supportent pas le fill-in-the-middle natif. Pour l’infilling a toutes les tailles, StarCoder2 est un meilleur choix.

Y aura-t-il un Code Llama 2 base sur Llama 4 ?

Pas d’annonce officielle en mars 2026. Meta semble considerer que les capacites code de Llama 4 Scout et Maverick sont suffisantes. Pour des besoins specifiques en code, les modeles existants de la gamme Code Llama ou des alternatives comme Codestral restent disponibles.