Qwen : les modeles IA open-source d’Alibaba Cloud

Definition rapide Qwen (prononce « tchwen ») est la famille de modeles de langage developpee par l’equipe Qwen d’Alibaba Cloud. En mars 2026, la derniere generation Qwen3.5 propose des modeles MoE et denses allant de 0,8B a 397B parametres, supportant 201 langues et dialectes. C’est l’une des familles open-source les plus performantes et les plus completes du marche.

Editeur: Alibaba Cloud (equipe Qwen)
Generation actuelle: Qwen3.5 (fevrier-mars 2026)
Modele phare: Qwen3.5-397B-A17B (MoE)
Architecture: Mixture-of-Experts + modeles denses
Langues: 201 langues et dialectes
Licence: Apache 2.0
URL: github.com/QwenLM

Qu’est-ce que Qwen ?

Qwen est le concurrent chinois direct de LLaMA (Meta) et Mistral (Mistral AI) dans l’ecosysteme des modeles open-source. Developpe par Alibaba Cloud, il s’est impose comme l’une des familles de modeles les plus prolifiques, avec des releases quasi-hebdomadaires et une gamme couvrant tous les segments du marche.

La strategie de Qwen est claire : offrir une alternative open-source complete, de l’edge (0,8B) au frontier (397B), avec un support multilingue massif (201 langues) et des capacites multimodales natives (texte, images, video). Cette approche agressive en termes de releases et de tailles lui a permis de capter une part significative du marche open-source, notamment en Asie.

Qwen3.5 : la generation actuelle

La serie Qwen3.5, lancee a partir du 16 fevrier 2026, est la generation la plus avancee. Elle comprend des modeles MoE (Mixture-of-Experts) et des modeles denses, deployes en seulement 16 jours.

Qwen3.5-397B-A17B (flagship)

Le modele phare : 397 milliards de parametres totaux, mais seulement 17 milliards actifs par token grace a l’architecture MoE. Alibaba affirme qu’il surpasse Qwen3-Max (le precedent flagship) sur les benchmarks tout en etant 60 % moins cher a executer et 8 fois plus capable de gerer des charges concurrentes.

Modeles Medium

Lances le 24 fevrier 2026 : Qwen3.5-122B-A10B, Qwen3.5-35B-A3B et Qwen3.5-27B. Ces modeles ciblent le segment intermediaire avec un bon equilibre performance/cout. Le 122B-A10B, en particulier, est annonce comme offrant des performances comparables a Claude Sonnet 4.5 sur certains benchmarks.

Modeles Small

Lances le 2 mars 2026 : quatre modeles denses (0,8B, 2B, 4B, 9B parametres) ciblent les appareils edge, les laptops et les configurations single-GPU. Ils supportent nativement le texte, l’image et la video.

Modele	Params totaux	Params actifs	Type	Date
Qwen3.5-397B-A17B	397B	17B	MoE	16 fev. 2026
Qwen3.5-122B-A10B	122B	10B	MoE	24 fev. 2026
Qwen3.5-35B-A3B	35B	3B	MoE	24 fev. 2026
Qwen3.5-27B	27B	27B	Dense	24 fev. 2026
Qwen3.5-9B	9B	9B	Dense	2 mars 2026
Qwen3.5-4B	4B	4B	Dense	2 mars 2026
Qwen3.5-2B	2B	2B	Dense	2 mars 2026
Qwen3.5-0.8B	0,8B	0,8B	Dense	2 mars 2026

Support multilingue massif

L’un des avantages distinctifs de Qwen3.5 est son support de 201 langues et dialectes, contre 82 pour la generation precedente. C’est le support linguistique le plus large parmi les modeles open-source, ce qui en fait un choix naturel pour les applications internationales.

En pratique, les performances varient selon les langues (l’anglais et le chinois sont les mieux supportes), mais la couverture est nettement superieure a celle de LLaMA ou Mistral sur les langues a faibles ressources.

Capacites multimodales

Les modeles Qwen3.5 Small (0,8B a 9B) integrent nativement le traitement d’images et de video en plus du texte. Cette multimodalite native sur des modeles aussi compacts est rare dans l’ecosysteme open-source et ouvre des possibilites pour le deploiement on-device.

Deploiement

Tous les modeles Qwen3.5 sont disponibles sur Hugging Face sous licence Apache 2.0. Ils sont compatibles avec Ollama, vLLM, TGI et la plupart des frameworks d’inference standards.

Le modele flagship (397B-A17B) necessite une infrastructure multi-GPU, mais les modeles Small (0,8B a 9B) tournent confortablement sur des appareils grand public. Le 4B, par exemple, necessite moins de 4 Go de RAM en quantification 4-bit.

Qwen vs LLaMA vs Mistral

Critere	Qwen3.5	Llama 4	Mistral
Langues	201	~40	~12
Gamme	0,8B a 397B	17B a 288B actifs	3B a 675B
Architecture	MoE + Dense	MoE	MoE
Multimodal	Texte, image, video	Texte, image	Texte, image
Licence	Apache 2.0	Llama Community	Apache 2.0
Origine	Chine (Alibaba)	USA (Meta)	France

Qwen se distingue par son support multilingue inegale et sa gamme de tailles extremement large. LLaMA domine avec son contexte de 10M tokens (Scout) et son ecosysteme de fine-tunes. Mistral offre le meilleur rapport qualite/prix et l’avantage RGPD europeen.

Point de vigilance Qwen est developpe par Alibaba Cloud, une entreprise chinoise. Selon votre secteur et votre localisation, cela peut poser des questions de conformite ou de gouvernance des donnees. Pour un deploiement en Europe, verifiez la compatibilite avec votre politique de souverainete des donnees.

FAQ Qwen

Qwen est-il gratuit ?

Oui, les modeles Qwen3.5 sont disponibles sous licence Apache 2.0 sur Hugging Face. Vous pouvez les telecharger, deployer et utiliser commercialement sans restriction. Alibaba Cloud propose aussi une API payante via Model Studio pour ceux qui preferent un service manage.

Qwen est-il aussi bon que ChatGPT ?

Le flagship Qwen3.5-397B-A17B atteint des performances competitives avec GPT-4o et Claude Sonnet 4.5 sur plusieurs benchmarks. Pour atteindre le niveau de GPT-5.4 ou Claude Opus 4.6, les modeles Qwen ne sont pas encore au meme niveau. Mais pour un modele gratuit et deployable localement, les performances sont remarquables.

Peut-on utiliser Qwen en francais ?

Oui, le francais fait partie des 201 langues supportees par Qwen3.5. Les performances en francais sont correctes pour la plupart des taches, mais inferieures a celles de Mistral (optimise pour le francais) et en retrait par rapport a l’anglais et au chinois.

Quel modele Qwen choisir ?

Pour le deploiement on-device : 0,8B a 4B. Pour un laptop ou single GPU : 9B ou 27B. Pour la production serveur : 35B-A3B ou 122B-A10B. Pour les performances maximales : 397B-A17B (necessite multi-GPU).

Qwen supporte-t-il la video ?

Oui, les modeles Small de Qwen3.5 (0,8B a 9B) integrent nativement le traitement de video en plus du texte et des images. C’est une capacite rare sur des modeles aussi compacts dans l’ecosysteme open-source.