Meta AI

Meta AI est la division d’intelligence artificielle de Meta Platforms (anciennement Facebook), responsable du développement des modèles Llama, de l’assistant Meta AI intégré dans WhatsApp, Instagram et Facebook, et de la recherche fondamentale en IA. Avec plus d’un milliard de téléchargements de Llama et ses dérivés, et près de 600 millions d’utilisateurs mensuels de l’assistant Meta AI, la division incarne la stratégie radicale de Meta : donner gratuitement ses modèles pour faire de Llama le standard de facto de l’IA open-weight.

Entité parente: Meta Platforms (NASDAQ: META)
CEO Meta: Mark Zuckerberg
Siège: Menlo Park, Californie
Modèle phare: Llama 4 Maverick (400B params, 128 experts MoE)
Licence Llama: Llama Community License (open-weight, usage commercial autorisé) Open Source
Produit consumer: Meta AI (assistant intégré dans WhatsApp, Instagram, Messenger, Facebook)
Utilisateurs: ~600M mensuels (Meta AI), 1B+ téléchargements (Llama)
CapEx IA prévu 2026: ~$115B+
Hardware custom: MTIA (Meta Training and Inference Accelerator)
URL: ai.meta.com

Histoire de Meta AI

De FAIR à Meta AI

L’histoire de l’IA chez Meta commence avec FAIR (Facebook AI Research), fondé en 2013 sous la direction de Yann LeCun, l’un des pères du deep learning et lauréat du prix Turing 2018. FAIR a produit des contributions fondamentales en vision par ordinateur, traitement du langage naturel, apprentissage auto-supervisé et systèmes de recommandation.

Le rebranding de Facebook en Meta en octobre 2021 a coïncidé avec un virage stratégique vers l’IA. Mark Zuckerberg a progressivement repositionné l’entreprise : du métaverse (qui reste un investissement via Reality Labs, avec environ 19 milliards de dollars de pertes annuelles) vers l’IA comme priorité stratégique numéro un.

Le tournant a été le lancement de Llama en février 2023, suivi de Llama 2 (juillet 2023) et Llama 3 (avril 2024). Chaque itération a été plus ouverte, plus performante, et plus largement adoptée. Llama 3.1 405B, lancé en juillet 2024, est devenu le premier modèle open-weight de classe frontier.

La stratégie open-weight

La décision de Meta de publier Llama en open-weight est l’une des décisions stratégiques les plus marquantes de l’industrie IA. Là où OpenAI et Anthropic gardent leurs modèles propriétaires et vendent l’accès via API, Meta distribue les poids de Llama gratuitement. La logique est contre-intuitive pour une entreprise cotée : en donnant les modèles, Meta vise à faire de Llama l’infrastructure standard sur laquelle l’ensemble de l’écosystème construit.

Les bénéfices pour Meta sont multiples. D’abord, chaque développeur qui adopte Llama enrichit l’écosystème : plus de 85 000 modèles dérivés ont été publiés sur Hugging Face, soit une augmentation de 5x en un an. Ces contributions communautaires alimentent les décisions de produit chez Meta et améliorent les générations suivantes de Llama. Ensuite, les données d’utilisation de Llama via l’assistant Meta AI (déployé dans WhatsApp, Instagram, Messenger et Facebook dans 40 pays) créent une boucle de feedback massive qu’aucun modèle fermé ne peut égaler. Enfin, l’adoption de Llama par les gouvernements et les entreprises positionne Meta comme fournisseur d’infrastructure IA stratégique.

La contrepartie : Meta entraîne Llama sur les publications Instagram et Facebook, ce qui rend l’opt-out difficile pour les utilisateurs. Un juge fédéral a statué que cette pratique relevait du fair use pour l’entraînement, mais la responsabilité en cas de reproduction de contenu protégé dans les applications commerciales revient aux développeurs.

Llama 4 : la génération multimodale

Llama 4, lancé au printemps 2025, marque un saut générationnel. C’est la première famille Llama nativement multimodale, capable de traiter texte, images et vidéo en entrée. L’architecture Mixture of Experts (MoE) permet de maintenir des coûts computationnels raisonnables tout en augmentant la capacité.

Scout et Maverick

Llama 4 Scout : modèle compact avec 17 milliards de paramètres actifs, 16 experts et 109 milliards de paramètres totaux. Optimisé pour la vitesse et l’efficacité, il cible les cas d’usage à haut volume comme les chatbots, l’assistance technique et les assistants de code.

Llama 4 Maverick : le modèle phare avec 17 milliards de paramètres actifs, 128 experts et 400 milliards de paramètres totaux. C’est le « workhorse » pour les cas d’usage de chat et d’assistant général. Meta annonce qu’il surpasse GPT-4o et Gemini 2.0 sur les benchmarks de code, raisonnement, multilingue, contexte long et compréhension d’images, et qu’il est compétitif avec DeepSeek V3.1 sur le code et le raisonnement.

Llama 4 Behemoth : le modèle « poids lourd » avec 288 milliards de paramètres actifs sur plus de 2 000 milliards au total. Encore en entraînement, il est positionné comme « professeur » pour les modèles plus petits et cible la recherche avancée et les applications STEM.

Limites en coding Malgré ses performances multimodales impressionnantes, Llama 4 Maverick affiche un retard significatif en coding face aux modèles fermés. Sur LiveCodeBench, il obtient environ 40% contre 85% pour GPT-5. C’est un point faible à considérer pour les cas d’usage centrés sur le développement logiciel, où Claude Code et OpenAI Codex restent nettement supérieurs.

Llama 3 : l’écosystème open-weight

La famille Llama 3 (versions 3.1, 3.2, 3.3) reste largement déployée en production. Disponible en tailles de 8B à 70B paramètres, ces modèles tournent sur du hardware consumer, des serveurs cloud et des clusters de recherche. Ils sont utilisés pour les chatbots, l’analyse de données, les tâches multilingues et l’expérimentation. Les termes de licence sont permissifs et les modèles sont disponibles sur Hugging Face et les plateformes partenaires.

L’assistant Meta AI

L’assistant Meta AI est l’interface consumer de Llama, intégrée directement dans les applications sociales de Meta. Disponible dans 40 pays, il permet de poser des questions, générer des images, résumer des conversations et effectuer des recherches sans quitter WhatsApp, Instagram, Messenger ou Facebook. Avec environ 600 millions d’utilisateurs mensuels actifs, c’est l’un des assistants IA les plus utilisés au monde.

L’assistant utilise toujours la dernière variante de Llama 4, sans possibilité pour l’utilisateur de choisir le modèle. Meta AI est aussi accessible via meta.ai sur le web et en application mobile. L’expérience vocale est en cours de déploiement, avec la conviction de Meta que les interactions IA vont progressivement migrer du texte vers la voix.

Infrastructure et hardware

Meta investit massivement dans l’infrastructure IA. Le budget capex prévu pour 2026 dépasse 115 milliards de dollars, principalement pour l’achat de GPU Nvidia (H100, B200) et la construction de data centers. Meta développe aussi ses propres puces, les MTIA (Meta Training and Inference Accelerator), qui prennent en charge une part croissante des workloads d’inférence.

Les partenariats cloud sont un pilier de la stratégie de distribution : plus de 25 partenaires cloud (Nvidia, Databricks, Snowflake, AWS Bedrock, Azure, etc.) hébergent des instances Llama, créant un écosystème de partage de revenus sans vente directe de modèles. Le programme « Llama for Startups » offre un accès facilité et un potentiel de financement, créant une dépendance volontaire à l’écosystème Meta.

Outils de sécurité et protection

Meta accompagne les modèles Llama d’un écosystème d’outils de sécurité open source :

Llama Guard 4 : modèle de modération de contenu pour filtrer les entrées et sorties problématiques.

LlamaFirewall : framework de sécurité pour protéger les applications IA contre les abus.

Llama Prompt Guard 2 : protection contre les injections de prompt.

Code Shield : outil pour la programmation sécurisée.

CyberSecEval 4 : framework d’évaluation de la sécurité des systèmes IA.

Le programme Llama Defenders donne à des partenaires sélectionnés l’accès à des outils supplémentaires pour évaluer la sécurité de leurs systèmes.

LlamaCon et écosystème développeur

Meta a organisé la première LlamaCon en avril 2025, un événement dédié aux développeurs de l’écosystème Llama. Les annonces incluaient la Llama API (en preview limitée), des outils de fine-tuning et d’évaluation, et Llama Stack (infrastructure standardisée pour les déploiements enterprise, avec intégration NVIDIA NeMo, IBM, Red Hat et Dell Technologies).

L’API Llama offre une création de clé en un clic, des playgrounds interactifs et une promesse forte : les modèles fine-tunés via l’API appartiennent au développeur et peuvent être exportés vers n’importe quel hébergeur. Meta s’engage à ne pas utiliser les prompts ou les réponses pour entraîner ses modèles.

Les Llama Impact Grants (plus de 1,5 million de dollars) financent des projets utilisant Llama pour des applications sociales dans 10 pays.

Applications et intégration produit

IA et publicité

L’application la plus lucrative de l’IA chez Meta reste la publicité. Le moteur « Andromeda » automatise la création et la diffusion des publicités avec une précision sans précédent, générant directement des revenus pour la Family of Apps (Facebook, Instagram, Messenger, WhatsApp) qui touche collectivement plus de 4 milliards d’utilisateurs mensuels actifs. Les outils Advantage+ Creative permettent aux annonceurs de générer des variantes de texte et d’images à l’échelle. La startup e-commerce ObjectsHQ a rapporté une augmentation de 60% de son retour sur investissement publicitaire en utilisant la génération de texte IA dans les campagnes Advantage+.

C’est ici que la stratégie IA de Meta diffère fondamentalement de celle d’OpenAI ou d’Anthropic : Meta ne monétise pas directement les modèles Llama. Les modèles sont un moyen au service de l’objectif principal, améliorer les revenus publicitaires de la Family of Apps et créer un écosystème de dépendance autour de l’infrastructure Llama.

Ray-Ban Meta Glasses et hardware IA

Les lunettes Ray-Ban Meta sont devenues le produit hardware surprise de Meta, avec 7 millions d’unités vendues en 2025. Elles servent d’interface principale pour l’assistant Meta AI en mode vocal, permettant des interactions naturelles mains libres. L’intégration de Llama 4 dans les lunettes transforme un accessoire de mode en assistant IA wearable, préfigurant ce que Meta appelle l’ère « post-smartphone ».

Le casque Quest 3S maintient la position de Meta dans la VR gaming et fitness, tandis que Reality Labs continue de rechercher des avancées en réalité augmentée. Les pertes annuelles de Reality Labs (environ 19 milliards de dollars) restent un sujet de débat pour les investisseurs, mais Zuckerberg considère ce pari comme essentiel pour posséder l’interface de la prochaine décennie de computing.

Adoption gouvernementale

L’adoption de Llama par les gouvernements illustre l’ampleur de la stratégie open-weight. Meta a travaillé activement pour rendre Llama disponible aux agences gouvernementales américaines. En Inde, le ministère du Développement des Compétences utilise Llama pour améliorer les résultats d’apprentissage. En Argentine, le gouvernement a lancé un chatbot WhatsApp construit sur Llama pour optimiser la délivrance de services publics. L’accessibilité et la portabilité de Llama en font un choix naturel pour les gouvernements qui veulent des solutions IA souveraines, hébergées sur leur propre infrastructure.

Innovation en post-training

Avec Llama 4, Meta a revu en profondeur son pipeline de post-entraînement. L’approche suit trois étapes : un SFT (Supervised Fine-Tuning) léger, puis un reinforcement learning en ligne, puis un DPO (Direct Preference Optimization) léger.

La découverte clé : le SFT et le DPO peuvent sur-contraindre le modèle, limitant l’exploration pendant la phase RL et menant à des performances sous-optimales en raisonnement, coding et mathématiques. Meta a donc éliminé plus de 50% des données faciles (évaluées par des modèles Llama comme « juges ») pour ne garder que les exemples difficiles. La stratégie de RL en ligne continu, où le modèle est alternativement entraîné puis utilisé pour filtrer les prompts difficiles, s’est avérée très efficace en termes de rapport compute/précision.

Ces innovations techniques sont partagées ouvertement via les articles de recherche de Meta, contribuant à l’avancement de l’ensemble de la communauté IA. C’est un aspect souvent sous-estimé de la stratégie open-weight : en publiant les techniques, Meta bénéficie des améliorations apportées par la communauté tout en rendant plus difficile pour les concurrents de maintenir un avantage propriétaire durable.

Positionnement concurrentiel

Meta AI occupe une position unique dans l’écosystème IA : c’est le champion du modèle open-weight, face à des concurrents propriétaires. La stratégie est claire, chaque entreprise qui fine-tune Llama pour ses propres besoins est une entreprise qui n’a pas besoin d’une clé API OpenAI ou Anthropic.

Face à OpenAI : Llama offre liberté et personnalisation mais un lock-in technique moindre. GPT-5.4 reste supérieur en raisonnement pur et en coding. Face à Google DeepMind : Gemini a l’avantage de la distribution native dans l’écosystème Google, mais Llama peut être déployé n’importe où. Face à Mistral AI : les deux jouent la carte open-weight, mais Meta a des ressources incomparablement plus importantes.

Le gouvernement américain considère Llama comme un « actif stratégique national » dans la compétition IA avec la Chine, ce qui confère à Meta un positionnement géopolitique unique parmi les entreprises tech.

Llama 5 est en cours d’entraînement, avec des capacités multimodales natives pour la vidéo. Sa sortie pourrait consolider la position de Meta comme leader incontesté de l’IA open-weight.

Questions fréquentes

Les modèles Llama sont-ils vraiment open source ?

Pas au sens strict de l’Open Source Initiative. Meta utilise la « Llama Community License », qui autorise l’usage commercial et la modification des poids du modèle, mais impose certaines restrictions (notamment pour les entreprises de plus de 700 millions d’utilisateurs mensuels, qui doivent obtenir une licence séparée). On parle d’« open-weight » plutôt que d’open source : les poids du modèle sont publics, mais pas nécessairement le code d’entraînement complet ni les données.

Quelle est la différence entre Llama 4 Scout et Maverick ?

Scout est le modèle compact (17B actifs, 16 experts, 109B total) optimisé pour la vitesse et les cas d’usage à haut volume. Maverick est le modèle phare (17B actifs, 128 experts, 400B total) optimisé pour la qualité en raisonnement, multimodal et multilingue. Les deux utilisent l’architecture MoE. Pour la majorité des applications, Maverick offre le meilleur rapport qualité/prix. Scout est préférable quand la latence et le coût par requête sont critiques.

Meta AI utilise-t-il mes données pour entraîner ses modèles ?

Meta entraîne Llama sur les contenus publics de Facebook et Instagram. L’opt-out est techniquement possible mais difficile. En revanche, pour l’API Llama, Meta s’engage à ne pas utiliser les prompts ni les réponses des développeurs pour l’entraînement. Les modèles fine-tunés via l’API restent la propriété du développeur et peuvent être exportés librement.

Peut-on faire tourner Llama en local ?

Oui, c’est l’un des avantages majeurs. Les modèles Llama 3.x (8B, 70B) tournent sur du hardware consumer via des outils comme Ollama, llama.cpp ou vLLM. Pour Llama 4 Scout et Maverick, l’infrastructure cloud est généralement nécessaire en raison de la taille du modèle, sauf pour les versions quantifiées. Llama 3.x reste le meilleur choix pour le self-hosting accessible.

Llama 4 est-il meilleur que GPT-5 ou Claude Opus ?

Cela dépend du cas d’usage. Llama 4 Maverick surpasse GPT-4o sur les benchmarks multimodaux et multilingues. Cependant, il reste significativement inférieur à GPT-5.4 et Claude Opus 4.6 en coding et en raisonnement complexe. L’avantage de Llama est la personnalisation (fine-tuning sur vos données), le contrôle (déploiement on-premise), et le coût (pas de frais API). Pour le raisonnement frontier, les modèles fermés restent supérieurs.