Licence Apache 2.0 (Apache License 2.0)
La licence Apache 2.0 est une licence logicielle libre et permissive, publiée par l’Apache Software Foundation en 2004, qui autorise l’utilisation, la modification et la redistribution du code (y compris à des fins commerciales) sans obligation de partager vos modifications. Dans le monde de l’IA, c’est la licence de référence pour les modèles open source destinés à un usage professionnel.
- Type
- Licence logicielle libre, permissive (non copyleft)
- Auteur
- Apache Software Foundation (ASF), 2004
- Identifiant SPDX
Apache-2.0- Utilisation commerciale
- Oui, sans restriction
- Grant de brevets
- Oui, explicite (section 3)
- Obligation copyleft
- Non (vos dérivés peuvent être propriétaires)
- Compatibilité GPL
- Compatible GPL v3, incompatible GPL v2
- Modèles IA concernés
- Mistral Large 3, Mistral Small 4, gpt-oss (OpenAI), Qwen 3.5, Falcon, StarCoder
- Texte officiel
- apache.org/licenses/LICENSE-2.0
Pourquoi la licence Apache 2.0 domine l’IA open source
Si vous travaillez avec des modèles d’IA open source, vous croiserez la licence Apache 2.0 partout. C’est la licence sous laquelle Mistral AI publie toute sa gamme Mistral 3 (Large 3, Small 4, Ministral 3/8/14B), sous laquelle OpenAI a publié ses modèles gpt-oss (120B et 20B), et que choisissent Alibaba pour Qwen 3.5, Zhipu AI pour GLM-5, et de nombreux autres éditeurs.
La raison est simple : Apache 2.0 offre le maximum de liberté commerciale avec un minimum d’obligations. Vous pouvez prendre un modèle sous Apache 2.0, le fine-tuner sur vos données propriétaires, l’intégrer dans un produit commercial, et le redistribuer, le tout sans jamais publier votre code source ni payer de royalties. La seule contrepartie : conserver les mentions de licence et d’attribution.
C’est ce qui la distingue des licences custom plus restrictives comme la Llama License de Meta (qui impose un seuil de 700 millions d’utilisateurs) ou la Gemma License de Google (qui ajoute des restrictions d’usage spécifiques).
Les clauses principales de la licence Apache 2.0
Le texte complet de la licence compte environ 200 lignes. Voici ce que chaque clause signifie concrètement pour un développeur ou une entreprise qui utilise un modèle d’IA sous Apache 2.0.
Section 2 : Grant of Copyright License (licence de droits d’auteur)
Chaque contributeur vous accorde une licence perpétuelle, mondiale, non exclusive, gratuite et irrévocable de reproduire, préparer des œuvres dérivées, afficher publiquement, distribuer et sous-licencier le logiciel. En pratique : vous pouvez faire ce que vous voulez avec le modèle, y compris le vendre ou le redistribuer dans un produit propriétaire.
Section 3 : Grant of Patent License (licence de brevets)
C’est la clause qui différencie le plus Apache 2.0 de la licence MIT. Chaque contributeur vous accorde explicitement une licence sur ses brevets qui couvrent sa contribution au projet. Cette protection est perpétuelle, mondiale, gratuite et irrévocable.
Concrètement : si un contributeur possède un brevet qui couvre le code qu’il a contribué, il ne peut pas vous poursuivre pour violation de ce brevet lorsque vous utilisez le logiciel. C’est une garantie importante pour les entreprises, surtout dans le domaine de l’IA où les brevets sur les architectures et algorithmes sont de plus en plus nombreux.
Section 4 : Redistribution
Vous pouvez redistribuer le logiciel (original ou modifié) sous n’importe quelle forme, à condition de respecter quatre obligations :
- Fournir une copie de la licence Apache 2.0 aux destinataires
- Indiquer de façon visible les fichiers que vous avez modifiés (« state changes »)
- Conserver toutes les mentions de copyright, brevet, marque et attribution du code source original
- Si le projet original contient un fichier NOTICE, inclure une copie lisible de ce fichier dans votre distribution
Point crucial : contrairement aux licences copyleft (GPL, AGPL), vous n’avez pas l’obligation de publier le code source de vos modifications. Vous pouvez les garder propriétaires. C’est la raison fondamentale pour laquelle les entreprises préfèrent Apache 2.0 aux licences GPL pour leurs modèles d’IA.
Section 6 : Trademarks (marques)
La licence ne vous donne aucun droit d’utiliser les noms, marques ou logos du projet original, sauf pour décrire l’origine du logiciel. Vous ne pouvez pas appeler votre produit « Mistral » ou utiliser le logo Mistral AI simplement parce que votre modèle est basé sur un modèle Mistral sous Apache 2.0.
Sections 7 et 8 : Disclaimer of Warranty et Limitation of Liability
Le logiciel est fourni « en l’état » (« AS IS »), sans aucune garantie. Les contributeurs ne peuvent être tenus responsables de quoi que ce soit, y compris des dommages directs, indirects ou consécutifs. C’est la clause standard de toutes les licences open source, mais elle a des implications concrètes pour les modèles d’IA : si un modèle sous Apache 2.0 génère du contenu qui viole un copyright ou produit un résultat erroné qui cause un préjudice, personne ne vous indemnise. C’est l’une des raisons pour lesquelles certaines entreprises préfèrent les modèles propriétaires qui offrent des clauses d’indemnisation.
Apache 2.0 vs MIT : quelle différence pour l’IA ?
Les deux licences les plus populaires pour les modèles d’IA open source sont Apache 2.0 et MIT. La différence tient en trois points.
| Critère | Apache 2.0 | MIT |
|---|---|---|
| Grant de brevets | Explicite (section 3) | Implicite/ambigu |
| Clause de rétorsion brevets | Oui | Non |
| Obligation de signaler les modifications | Oui (« state changes ») | Non |
| Fichier NOTICE | Obligatoire si présent | Non applicable |
| Compatibilité GPL v2 | Non (clause de brevets jugée incompatible) | Oui |
| Compatibilité GPL v3 | Oui | Oui |
| Longueur du texte | ~200 lignes, termes précisément définis | ~20 lignes, minimaliste |
| Modèles IA notables | Mistral Large 3, gpt-oss, Qwen 3.5, Falcon | DeepSeek R1, GLM-5, GLM-4.7, Kimi K2.5 |
En résumé : Apache 2.0 offre une meilleure protection juridique grâce au grant de brevets explicite, au prix d’obligations légèrement plus lourdes (signaler les modifications, conserver le fichier NOTICE). Pour un modèle d’IA utilisé en production dans un produit commercial, la protection brevets d’Apache 2.0 est un avantage concret. Pour un petit projet ou une librairie utilitaire, la simplicité de MIT peut suffire.
Apache 2.0 vs licences copyleft (GPL, AGPL)
La différence fondamentale : les licences copyleft (GPL, AGPL) exigent que toute œuvre dérivée soit distribuée sous la même licence. Si vous fine-tunez un modèle sous GPL et distribuez le résultat, vous devez publier les poids de votre modèle fine-tuné sous GPL. Avec Apache 2.0, vous pouvez garder vos poids fine-tunés propriétaires.
Dans la pratique, aucun modèle d’IA majeur n’est publié sous GPL ou AGPL, précisément parce que ces licences freinent l’adoption commerciale. Les éditeurs qui veulent maximiser l’adoption de leur modèle choisissent Apache 2.0 ou MIT. Ceux qui veulent restreindre certains usages créent des licences custom (Llama License, Gemma License).
Apache 2.0 vs licences custom de l’IA
Plusieurs éditeurs de modèles d’IA ont créé des licences sur mesure qui ressemblent à de l’open source mais ajoutent des restrictions spécifiques. Comprendre ces différences est essentiel pour choisir un modèle en production.
| Licence | Éditeur | Usage commercial | Restrictions notables | Fine-tuning libre |
|---|---|---|---|---|
| Apache 2.0 | Mistral, OpenAI (gpt-oss), Alibaba (Qwen) | Oui, sans restriction | Aucune (hors attribution) | Oui |
| MIT | DeepSeek, Zhipu AI (GLM) | Oui, sans restriction | Aucune | Oui |
| Llama License | Meta | Oui, sauf > 700M d’utilisateurs actifs mensuels | Seuil d’utilisateurs, interdiction d’entraîner d’autres LLM | Oui (dérivés soumis à la licence) |
| Gemma License | Oui, avec restrictions | Restrictions d’usage spécifiques, outputs dérivés soumis à la licence | Oui (dérivés soumis à la licence) | |
| DeepSeek Model License | DeepSeek (certains modèles) | Oui, avec conditions | Les modèles entraînés sur les outputs deviennent dérivés | Oui (dérivés soumis à la licence) |
Modèles d’IA majeurs sous licence Apache 2.0
Voici la liste des modèles d’IA les plus significatifs publiés sous Apache 2.0 à date de mars 2026.
Mistral AI (France)
Mistral est l’acteur européen le plus engagé sur Apache 2.0. Toute la gamme Mistral 3, sortie fin 2025, est sous cette licence : Mistral Large 3 (675B paramètres totaux, 41B actifs, architecture MoE), Mistral Small 4 (119B paramètres totaux, 6B actifs, sorti le 16 mars 2026), et les trois tailles de Ministral (3B, 8B, 14B) en variantes base, instruct et raisonnement. Mistral a récemment publié Leanstral (agent de vérification formelle) également sous Apache 2.0.
La position de Mistral est stratégique : en choisissant systématiquement Apache 2.0, l’entreprise se positionne comme l’alternative ouverte et européenne aux modèles propriétaires américains et aux modèles chinois sous licences plus restrictives.
OpenAI (gpt-oss)
Fait marquant de 2025 : OpenAI, longtemps synonyme de modèles fermés, a publié ses premiers modèles open weights depuis GPT-2 sous licence Apache 2.0. Les modèles gpt-oss-120b (117B paramètres, 5,1B actifs, architecture MoE) et gpt-oss-20b (21B paramètres, 3,6B actifs) sont optimisés pour le raisonnement et les tâches agentiques. Le gpt-oss-120b tourne sur un seul GPU H100 (80 Go), et le gpt-oss-20b fonctionne sur du matériel grand public avec 16 Go de mémoire.
Le choix d’Apache 2.0 plutôt que d’une licence custom a été explicitement motivé par la demande des développeurs, selon OpenAI. C’est un signal fort : même l’acteur le plus « closed » du marché reconnaît l’avantage compétitif d’une licence véritablement permissive.
Alibaba (Qwen)
La gamme Qwen 3.5 d’Alibaba est publiée sous Apache 2.0. Le modèle phare Qwen 3.5 (397B paramètres totaux, 17B actifs) se classe parmi les meilleurs modèles open source sur les benchmarks de mars 2026. Les versions antérieures Qwen 2.5 étaient sous licence custom plus restrictive (seuil de 100M d’utilisateurs), ce qui montre une évolution vers plus de permissivité.
Autres modèles notables
De nombreux autres projets d’IA majeurs utilisent Apache 2.0 : Falcon (Technology Innovation Institute, UAE), StarCoder (BigCode), h2oGPT, et des frameworks critiques de l’écosystème comme TensorFlow, Kubernetes, et vLLM. Apache 2.0 est aussi la licence historique du serveur web Apache HTTP, de Hadoop et de Spark, ce qui lui donne une crédibilité juridique inégalée dans l’industrie.
Obligations pratiques : ce que vous devez faire
Si vous utilisez un modèle d’IA sous Apache 2.0 dans votre produit, voici vos obligations concrètes :
1. Conserver la licence et les attributions
Incluez une copie du texte de la licence Apache 2.0 dans votre distribution. Conservez toutes les mentions de copyright et d’attribution du code original. Si le projet inclut un fichier NOTICE (c’est fréquent), incluez-le dans votre distribution. C’est généralement aussi simple que de garder un dossier licenses/ dans votre projet.
2. Signaler vos modifications
Si vous modifiez des fichiers du code original, ajoutez une mention visible indiquant que vous avez apporté des changements. Vous n’avez pas à détailler la nature de vos modifications, juste à signaler qu’elles existent. C’est une obligation souvent négligée, mais elle fait partie du texte légal.
3. Ne pas utiliser les marques du projet
Vous n’avez pas le droit d’utiliser les noms de marque, logos ou noms de produit du projet original pour promouvoir votre produit, sauf pour indiquer l’origine du code. Votre modèle fine-tuné basé sur Mistral Large 3 ne peut pas s’appeler « Mistral [Votre Nom] » sans autorisation.
Ce que vous n’avez pas à faire
Pour être explicite : vous n’avez pas à publier le code source de vos modifications. Vous n’avez pas à publier les poids de votre modèle fine-tuné. Vous n’avez pas à payer de royalties. Vous n’avez pas à informer les contributeurs originaux. Vous n’avez pas à utiliser la licence Apache 2.0 pour votre propre produit, vous pouvez le licencier comme vous voulez (y compris sous licence propriétaire).
Implications pour les entreprises
Souveraineté des données
Un modèle sous Apache 2.0 peut être auto-hébergé sur votre propre infrastructure. Aucune donnée ne transite par des serveurs tiers. C’est un argument décisif pour les secteurs réglementés (finance, santé, défense) et pour la conformité avec le RGPD et les exigences de résidence des données en Europe.
Protection brevets
Le grant de brevets explicite de la section 3 est un argument de poids pour les services juridiques des grandes entreprises. Il élimine le risque qu’un contributeur au projet puisse un jour vous poursuivre pour violation de brevet liée au code qu’il a lui-même contribué. La licence MIT ne fournit pas cette protection de manière explicite, même si des juristes estiment qu’une licence implicite de brevets pourrait être inférée.
Absence d’indemnisation
Le revers de la médaille : la clause « AS IS » signifie zéro garantie et zéro indemnisation. Si le modèle génère du contenu qui viole les droits d’un tiers, vous portez seul la responsabilité. C’est un facteur de décision important quand vous comparez un modèle Apache 2.0 auto-hébergé à un modèle propriétaire via API qui offre des clauses d’indemnisation PI.
Auditabilité et AI Act
Les modèles sous Apache 2.0 dont les poids et (idéalement) le code d’entraînement sont publiés facilitent les audits de conformité exigés par le règlement européen sur l’IA (AI Act) pour les systèmes à haut risque. L’accès aux poids permet d’analyser les biais, de vérifier les comportements et de documenter le fonctionnement du modèle avec un niveau de transparence impossible à atteindre avec un modèle propriétaire.
Compatibilité avec d’autres licences
La question de compatibilité se pose quand vous combinez du code ou des modèles sous différentes licences dans un même projet.
| Licence combinée avec Apache 2.0 | Compatible ? | Détail |
|---|---|---|
| MIT | Oui | Vous pouvez combiner librement |
| BSD 2-Clause / 3-Clause | Oui | Aucun conflit |
| GPL v3 | Oui | Le projet combiné est sous GPL v3 |
| GPL v2 | Non | La clause de brevets Apache est considérée comme une « restriction additionnelle » par la FSF |
| AGPL v3 | Oui | Le projet combiné est sous AGPL v3 |
| CC BY 4.0 | Controversé | Des préoccupations existent sur la clause de contournement des DRM |
| Llama License | Variable | Les restrictions de la Llama License s’ajoutent, l’ensemble n’est plus « Apache 2.0 » |
Bref historique
L’Apache Software Foundation a été fondée en 1999. La première version de la licence Apache (1.0) était très proche de la licence BSD, avec une clause publicitaire contraignante. La version 1.1 (2000) a allégé cette clause. La version 2.0 (janvier 2004) a constitué une refonte majeure : définitions juridiques précises de chaque terme, grant de brevets explicite, clause de rétorsion, et suppression de la clause publicitaire.
Depuis 2004, le texte de la licence n’a pas changé. C’est cette stabilité qui rassure les services juridiques des entreprises : deux décennies de jurisprudence et de pratique industrielle ont clarifié l’interprétation de chaque clause.
L’adoption massive dans l’IA est plus récente. Elle a démarré avec les frameworks (TensorFlow sous Apache 2.0 dès 2015), puis s’est étendue aux modèles eux-mêmes avec Falcon (2023), Mistral (2023-2024), et l’explosion de 2025 (gpt-oss, Qwen 3, Mistral 3, StarCoder).
Verdict
La licence Apache 2.0 est, à notre avis, le meilleur choix pour publier ou utiliser un modèle d’IA destiné à un usage commercial. Le grant de brevets explicite élimine un risque juridique que MIT laisse dans l’ambiguïté. Les obligations sont légères et bien comprises par les équipes juridiques du monde entier. Et l’absence de copyleft garantit que vos modifications, vos données de fine-tuning et votre code d’intégration restent votre propriété intellectuelle.
Si vous évaluez des modèles open source pour votre entreprise, vérifiez toujours la licence avant d’investir du temps en intégration. Apache 2.0 et MIT sont les deux licences qui vous donnent une liberté totale. Toute licence custom (Llama, Gemma, etc.) mérite une lecture attentive par votre équipe juridique, car les restrictions peuvent impacter votre roadmap produit.
FAQ
La licence Apache 2.0 est-elle vraiment gratuite pour un usage commercial ?
Oui, sans aucune restriction. Vous pouvez utiliser, modifier, redistribuer et vendre un produit basé sur du code ou un modèle sous Apache 2.0 sans payer de royalties ni obtenir d’autorisation. Les seules obligations sont l’attribution (conserver la licence et les notices) et la mention des modifications. C’est l’une des licences les plus permissives qui existent, et c’est précisément pour cela que des entreprises comme Mistral AI, OpenAI (gpt-oss) et Alibaba (Qwen) la choisissent pour maximiser l’adoption de leurs modèles.
Quelle est la différence entre la licence Apache 2.0 et la licence MIT pour les modèles IA ?
La différence principale est le grant de brevets. Apache 2.0 accorde explicitement une licence sur les brevets des contributeurs et inclut une clause de rétorsion qui révoque vos droits si vous intentez une action pour violation de brevet contre le projet. MIT ne mentionne pas les brevets du tout, ce qui crée une ambiguïté juridique. Apache 2.0 exige aussi de signaler les modifications apportées aux fichiers et de conserver le fichier NOTICE, ce que MIT ne demande pas. En contrepartie, MIT est compatible GPL v2, ce qui n’est pas le cas d’Apache 2.0.
Puis-je fine-tuner un modèle Apache 2.0 et garder les poids résultants propriétaires ?
Oui. Apache 2.0 est une licence permissive, non copyleft. Vos œuvres dérivées (y compris les poids d’un modèle fine-tuné) peuvent être distribuées sous n’importe quelle licence, y compris propriétaire. Vous n’avez pas à publier vos poids fine-tunés ni votre code de fine-tuning. Vous devez simplement conserver les attributions du modèle original et indiquer que vous avez apporté des modifications.
Quels sont les principaux modèles d’IA sous licence Apache 2.0 en 2026 ?
Les modèles les plus importants sous Apache 2.0 à mars 2026 incluent : toute la gamme Mistral 3 (Large 3, Small 4, Ministral 3/8/14B), les modèles gpt-oss d’OpenAI (120B et 20B), Qwen 3.5 d’Alibaba, Falcon (TII), StarCoder (BigCode), et de nombreux modèles spécialisés. Côté MIT, qui offre une liberté comparable, on trouve DeepSeek R1, GLM-5 et GLM-4.7 de Zhipu AI, et Kimi K2.5 de Moonshot AI.
La licence Apache 2.0 protège-t-elle contre les risques de propriété intellectuelle liés aux données d’entraînement ?
Non. La clause « AS IS » de la section 7 exclut toute garantie, y compris la garantie de non-contrefaçon. Si un modèle sous Apache 2.0 a été entraîné sur des données protégées par le copyright et génère du contenu contrefaisant, la licence n’offre aucune protection ni indemnisation. Le risque PI repose entièrement sur l’utilisateur. C’est une différence notable avec les modèles propriétaires dont les éditeurs offrent parfois des clauses d’indemnisation. Si ce risque vous préoccupe, consultez un juriste spécialisé avant de déployer en production.