Code Llama : le modele de code open-source de Meta
- Editeur
- Meta AI
- Base
- LLaMA 2
- Tailles
- 7B, 13B, 34B, 70B parametres
- Entrainement
- 500B tokens de code (1T pour 70B)
- Contexte
- 16K tokens (ameliore jusqu’a 100K)
- HumanEval (70B)
- 67,8 %
- Variantes
- Base, Python, Instruct
- Licence
- Llama Community License
- URL
- llama.com/code-llama
Qu’est-ce que Code Llama ?
Code Llama est la specialisation code de la famille LLaMA de Meta. Il a ete cree en prenant LLaMA 2 comme base et en le fine-tunant sur un corpus massif de code (500 milliards de tokens pour les versions 7B-34B, 1 trillion pour le 70B).
L’objectif de Meta etait de fournir a la communaute open-source un modele de code performant et libre, capable de concurrencer des solutions proprietaires comme GitHub Copilot. Le resultat : un modele qui, a sa sortie en aout 2023, atteignait des scores comparables a ChatGPT sur la generation de code.
En mars 2026, Code Llama est considere comme un modele mature et largement deploye. Bien que des alternatives plus recentes existent (Codestral, StarCoder2, et meme Llama 4 pour le code), Code Llama reste pertinent grace a son ecosysteme de fine-tunes et sa large adoption dans l’industrie.
Les trois variantes
Code Llama (base)
Le modele fondation, fine-tune sur du code a partir de LLaMA 2. Il gere la generation de code, la completion et l’analyse dans de nombreux langages : Python, C++, Java, PHP, TypeScript, C#, Bash et d’autres. Les versions 7B et 13B supportent l’infilling (completion au milieu du code).
Code Llama – Python
Une specialisation supplementaire sur 100 milliards de tokens de code Python. Ce modele offre des performances superieures au modele base pour tout ce qui touche a Python : generation de fonctions, debug, refactoring, scripts de data science.
Code Llama – Instruct
Fine-tune pour suivre des instructions en langage naturel. C’est la variante a utiliser pour le chat : « Ecris une fonction qui trie une liste », « Debug ce code », « Explique cet algorithme ». Elle est disponible en 7B, 13B et 34B.
| Variante | 7B | 13B | 34B | 70B |
|---|---|---|---|---|
| Base | Oui | Oui | Oui | Oui |
| Python | Oui | Oui | Oui | Oui |
| Instruct | Oui | Oui | Oui | Non |
| Infilling (FIM) | Oui | Oui | Non | Non |
Benchmarks
| Modele | HumanEval | MBPP |
|---|---|---|
| Code Llama 7B | ~33 % | ~47 % |
| Code Llama 13B | ~36 % | ~49 % |
| Code Llama 34B | 53,7 % | 56,2 % |
| Code Llama 70B | 67,8 % | Non publie |
Le 34B etait, a sa sortie, le modele open-source le plus performant sur HumanEval (53,7 %) et MBPP (56,2 %). Le 70B a pousse ces scores a 67,8 % sur HumanEval. En 2026, ces scores ont ete depasses par des modeles plus recents (Codestral a 86,6 %), mais Code Llama reste competitif dans sa tranche de prix (gratuit).
Deploiement local
| Modele | VRAM (FP16) | VRAM (4-bit) | Recommandation |
|---|---|---|---|
| Code Llama 7B | ~14 Go | ~5 Go | RTX 3060 12 Go |
| Code Llama 13B | ~26 Go | ~8 Go | RTX 4070 Ti 16 Go |
| Code Llama 34B | ~68 Go | ~20 Go | RTX 4090 24 Go (4-bit) |
| Code Llama 70B | ~140 Go | ~40 Go | A100 80 Go |
Le deploiement via Ollama est trivial : ollama run codellama:7b ou ollama run codellama:34b. Pour la production, vLLM et TGI offrent de meilleures performances de debit.
Code Llama 7B en quantification 4-bit (~5 Go VRAM) est l’un des modeles de code les plus accessibles : il tourne sur pratiquement n’importe quel GPU moderne, y compris les GPUs integres de certains MacBooks.
Code Llama vs StarCoder2 vs Codestral
| Critere | Code Llama 34B | StarCoder2 15B | Codestral |
|---|---|---|---|
| HumanEval | 53,7 % | Comparable | 86,6 % |
| Langages | ~20 principaux | 619 | 80+ |
| Base | LLaMA 2 | From scratch | Proprietary |
| Taille max | 70B | 15B | Non public |
| FIM | 7B/13B seulement | Toutes tailles | Oui |
| Specialisation Python | Variante dediee | Non | Non |
| Licence | Llama Community | OpenRAIL-M | Variable |
Code Llama se distingue par sa specialisation Python et ses tailles allant jusqu’a 70B. StarCoder2 offre une couverture linguistique inegalee (619 langages) et une meilleure efficacite (15B rivalise avec 34B). Codestral domine en precision d’autocomplete. Pour un nouveau projet en 2026, Codestral ou StarCoder2 sont souvent preferes, mais Code Llama reste solide pour les pipelines existants.
Statut en mars 2026
Code Llama est un modele mature et stable. Meta n’a pas annonce de Code Llama 2 base sur LLaMA 3 ou Llama 4, suggerant que l’entreprise considere que les capacites code des modeles generalistes recents (Llama 4 Scout/Maverick) sont suffisantes pour la plupart des cas d’usage.
Le modele reste neanmoins tres utilise grace a son ecosysteme de fine-tunes specialises et sa disponibilite sur toutes les plateformes d’inference (Ollama, vLLM, TGI, Amazon SageMaker, etc.).
FAQ Code Llama
Code Llama est-il gratuit ?
Oui, sous Llama Community License (usage commercial autorise pour les entreprises de moins de 700 millions d’utilisateurs actifs mensuels). Les poids sont telechargeables sur Hugging Face et via Ollama.
Quelle version de Code Llama choisir ?
7B pour l’autocomplete rapide et le deploiement leger. 13B pour un bon equilibre. 34B pour la generation de code complexe. 70B pour les performances maximales. Ajoutez le suffixe « -python » si votre projet est principalement Python, « -instruct » si vous avez besoin du mode chat.
Code Llama est-il meilleur que Copilot ?
En termes de performances brutes, GitHub Copilot (qui utilise des modeles proprietaires plus recents) est generalement superieur. L’avantage de Code Llama est d’etre gratuit, deployable localement, et personnalisable par fine-tuning.
Code Llama supporte-t-il l’infilling ?
Oui, mais uniquement les versions 7B et 13B. Les versions 34B et 70B ne supportent pas le fill-in-the-middle natif. Pour l’infilling a toutes les tailles, StarCoder2 est un meilleur choix.
Y aura-t-il un Code Llama 2 base sur Llama 4 ?
Pas d’annonce officielle en mars 2026. Meta semble considerer que les capacites code de Llama 4 Scout et Maverick sont suffisantes. Pour des besoins specifiques en code, les modeles existants de la gamme Code Llama ou des alternatives comme Codestral restent disponibles.