Qwen : les modeles IA open-source d’Alibaba Cloud
- Editeur
- Alibaba Cloud (equipe Qwen)
- Generation actuelle
- Qwen3.5 (fevrier-mars 2026)
- Modele phare
- Qwen3.5-397B-A17B (MoE)
- Architecture
- Mixture-of-Experts + modeles denses
- Langues
- 201 langues et dialectes
- Licence
- Apache 2.0
- URL
- github.com/QwenLM
Qu’est-ce que Qwen ?
Qwen est le concurrent chinois direct de LLaMA (Meta) et Mistral (Mistral AI) dans l’ecosysteme des modeles open-source. Developpe par Alibaba Cloud, il s’est impose comme l’une des familles de modeles les plus prolifiques, avec des releases quasi-hebdomadaires et une gamme couvrant tous les segments du marche.
La strategie de Qwen est claire : offrir une alternative open-source complete, de l’edge (0,8B) au frontier (397B), avec un support multilingue massif (201 langues) et des capacites multimodales natives (texte, images, video). Cette approche agressive en termes de releases et de tailles lui a permis de capter une part significative du marche open-source, notamment en Asie.
Qwen3.5 : la generation actuelle
La serie Qwen3.5, lancee a partir du 16 fevrier 2026, est la generation la plus avancee. Elle comprend des modeles MoE (Mixture-of-Experts) et des modeles denses, deployes en seulement 16 jours.
Qwen3.5-397B-A17B (flagship)
Le modele phare : 397 milliards de parametres totaux, mais seulement 17 milliards actifs par token grace a l’architecture MoE. Alibaba affirme qu’il surpasse Qwen3-Max (le precedent flagship) sur les benchmarks tout en etant 60 % moins cher a executer et 8 fois plus capable de gerer des charges concurrentes.
Modeles Medium
Lances le 24 fevrier 2026 : Qwen3.5-122B-A10B, Qwen3.5-35B-A3B et Qwen3.5-27B. Ces modeles ciblent le segment intermediaire avec un bon equilibre performance/cout. Le 122B-A10B, en particulier, est annonce comme offrant des performances comparables a Claude Sonnet 4.5 sur certains benchmarks.
Modeles Small
Lances le 2 mars 2026 : quatre modeles denses (0,8B, 2B, 4B, 9B parametres) ciblent les appareils edge, les laptops et les configurations single-GPU. Ils supportent nativement le texte, l’image et la video.
| Modele | Params totaux | Params actifs | Type | Date |
|---|---|---|---|---|
| Qwen3.5-397B-A17B | 397B | 17B | MoE | 16 fev. 2026 |
| Qwen3.5-122B-A10B | 122B | 10B | MoE | 24 fev. 2026 |
| Qwen3.5-35B-A3B | 35B | 3B | MoE | 24 fev. 2026 |
| Qwen3.5-27B | 27B | 27B | Dense | 24 fev. 2026 |
| Qwen3.5-9B | 9B | 9B | Dense | 2 mars 2026 |
| Qwen3.5-4B | 4B | 4B | Dense | 2 mars 2026 |
| Qwen3.5-2B | 2B | 2B | Dense | 2 mars 2026 |
| Qwen3.5-0.8B | 0,8B | 0,8B | Dense | 2 mars 2026 |
Support multilingue massif
L’un des avantages distinctifs de Qwen3.5 est son support de 201 langues et dialectes, contre 82 pour la generation precedente. C’est le support linguistique le plus large parmi les modeles open-source, ce qui en fait un choix naturel pour les applications internationales.
En pratique, les performances varient selon les langues (l’anglais et le chinois sont les mieux supportes), mais la couverture est nettement superieure a celle de LLaMA ou Mistral sur les langues a faibles ressources.
Capacites multimodales
Les modeles Qwen3.5 Small (0,8B a 9B) integrent nativement le traitement d’images et de video en plus du texte. Cette multimodalite native sur des modeles aussi compacts est rare dans l’ecosysteme open-source et ouvre des possibilites pour le deploiement on-device.
Deploiement
Tous les modeles Qwen3.5 sont disponibles sur Hugging Face sous licence Apache 2.0. Ils sont compatibles avec Ollama, vLLM, TGI et la plupart des frameworks d’inference standards.
Le modele flagship (397B-A17B) necessite une infrastructure multi-GPU, mais les modeles Small (0,8B a 9B) tournent confortablement sur des appareils grand public. Le 4B, par exemple, necessite moins de 4 Go de RAM en quantification 4-bit.
Qwen vs LLaMA vs Mistral
| Critere | Qwen3.5 | Llama 4 | Mistral |
|---|---|---|---|
| Langues | 201 | ~40 | ~12 |
| Gamme | 0,8B a 397B | 17B a 288B actifs | 3B a 675B |
| Architecture | MoE + Dense | MoE | MoE |
| Multimodal | Texte, image, video | Texte, image | Texte, image |
| Licence | Apache 2.0 | Llama Community | Apache 2.0 |
| Origine | Chine (Alibaba) | USA (Meta) | France |
Qwen se distingue par son support multilingue inegale et sa gamme de tailles extremement large. LLaMA domine avec son contexte de 10M tokens (Scout) et son ecosysteme de fine-tunes. Mistral offre le meilleur rapport qualite/prix et l’avantage RGPD europeen.
FAQ Qwen
Qwen est-il gratuit ?
Oui, les modeles Qwen3.5 sont disponibles sous licence Apache 2.0 sur Hugging Face. Vous pouvez les telecharger, deployer et utiliser commercialement sans restriction. Alibaba Cloud propose aussi une API payante via Model Studio pour ceux qui preferent un service manage.
Qwen est-il aussi bon que ChatGPT ?
Le flagship Qwen3.5-397B-A17B atteint des performances competitives avec GPT-4o et Claude Sonnet 4.5 sur plusieurs benchmarks. Pour atteindre le niveau de GPT-5.4 ou Claude Opus 4.6, les modeles Qwen ne sont pas encore au meme niveau. Mais pour un modele gratuit et deployable localement, les performances sont remarquables.
Peut-on utiliser Qwen en francais ?
Oui, le francais fait partie des 201 langues supportees par Qwen3.5. Les performances en francais sont correctes pour la plupart des taches, mais inferieures a celles de Mistral (optimise pour le francais) et en retrait par rapport a l’anglais et au chinois.
Quel modele Qwen choisir ?
Pour le deploiement on-device : 0,8B a 4B. Pour un laptop ou single GPU : 9B ou 27B. Pour la production serveur : 35B-A3B ou 122B-A10B. Pour les performances maximales : 397B-A17B (necessite multi-GPU).
Qwen supporte-t-il la video ?
Oui, les modeles Small de Qwen3.5 (0,8B a 9B) integrent nativement le traitement de video en plus du texte et des images. C’est une capacite rare sur des modeles aussi compacts dans l’ecosysteme open-source.