Pathology AI : l’intelligence artificielle en anatomopathologie

La pathology AI (IA en pathologie) désigne l’application de techniques de deep learning aux images de lames histologiques numérisées (Whole Slide Images, WSI) pour assister les anatomopathologistes dans le diagnostic de maladies, la classification tumorale, le scoring de biomarqueurs, la détection de métastases et la prédiction de la réponse au traitement.

Catégorie: Medical imaging appliqué, pathologie computationnelle
Données: Whole Slide Images (WSI) : images gigapixel (souvent 100 000 × 100 000 pixels) de lames de tissu numérisées
Tâches: Classification tumorale, détection de métastases, scoring PD-L1/HER2, prédiction pronostique, génération de rapports
Architectures: Multiple Instance Learning (MIL), Attention-based MIL, Vision Transformers, Foundation models (TITAN, Prov-GigaPath)
Entreprises: Paige.ai, PathAI, Lunit SCOPE, Ibex Medical Analytics, Roche/Ventana
FDA: Seulement 3 outils IA pathologie autorisés FDA (retard par rapport à la radiologie)

Qu’est-ce que la pathology AI ?

La pathologie est le « gold standard » du diagnostic en oncologie : c’est l’examen au microscope de tissus prélevés (biopsies, pièces opératoires) qui détermine le type de cancer, son grade, et guide les décisions de traitement. La pathology AI applique le deep learning à des versions numérisées de ces lames (les Whole Slide Images) pour assister le pathologiste dans cette tâche fondamentale.

La particularité technique de la pathology AI : les WSI sont des images gigapixel, typiquement 100 000 × 100 000 pixels, soit des milliards de pixels par lame. Aucun modèle ne peut traiter une telle image en une seule passe. Les WSI doivent être découpées en milliers de patches (tuiles de 224×224 ou 256×256 pixels) qui sont analysés individuellement puis agrégés pour produire un diagnostic au niveau de la lame ou du patient.

Malgré des avancées techniques considérables, l’adoption réglementaire de l’IA en pathologie est en retard par rapport à la radiologie : seulement 3 outils IA en pathologie ont reçu une autorisation FDA (contre plus de 1 000 en radiologie). Ce retard reflète non pas un manque de technologies viables mais un déficit de datasets de validation standardisés et des défis d’intégration dans les laboratoires de pathologie.

Le Whole Slide Imaging

Numérisation des lames

Le processus commence par la numérisation des lames de verre à l’aide de scanners automatisés (Leica Aperio, Hamamatsu NanoZoomer, Philips IntelliSite, 3DHISTECH) qui capturent les lames à des grossissements de 20x ou 40x. Le résultat est une image pyramidale multi-résolution stockée dans des formats spécifiques (SVS, NDPI, TIFF, DICOM). Une seule WSI pèse typiquement 500 Mo à 3 Go.

Prétraitement

Avant l’analyse IA, les WSI subissent un prétraitement : détection et masquage des zones de fond blanc (pas de tissu), normalisation des couleurs (les colorations histologiques varient entre laboratoires et lots de réactifs), et découpage en patches à la résolution appropriée. La normalisation des couleurs (stain normalization) est critique car les CNN sont sensibles aux variations de teinte entre les différents laboratoires et scanners.

Le défi de la taille

L’échelle des WSI est le défi technique central. Une lame numérisée à 40x peut contenir 10 milliards de pixels. Traiter cette quantité de données requiert des approches spécifiques : le Multiple Instance Learning (MIL), l’échantillonnage intelligent de patches, et les architectures hiérarchiques qui agrègent les informations à plusieurs échelles.

Techniques et architectures

Multiple Instance Learning (MIL)

L’approche dominante en pathology AI. Le principe : la WSI est divisée en milliers de patches (« instances »), chaque patch est encodé en un vecteur de features par un CNN pré-entraîné, puis un agrégateur (pooling, attention) combine ces features pour produire une prédiction au niveau de la lame entière (le « bag »). L’annotation se fait au niveau de la lame (pas au niveau du patch), ce qui réduit considérablement le coût d’annotation.

L’Attention-based MIL (ABMIL) ajoute un mécanisme d’attention qui pondère chaque patch selon son importance pour la prédiction finale. Les patches les plus informatifs (zones tumorales, zones de transition) reçoivent des poids élevés, tandis que les patches de tissu normal ou de fond reçoivent des poids faibles. La carte d’attention résultante offre une forme d’explicabilité : le pathologiste peut voir quelles régions ont influencé la décision du modèle.

Foundation models en pathologie

La tendance la plus transformatrice. Les foundation models sont des modèles pré-entraînés sur des centaines de milliers de WSI via l’apprentissage auto-supervisé, capables de générer des représentations universelles utilisables pour de multiples tâches sans ré-entraînement spécifique.

Prov-GigaPath (Nature, 2024) : un foundation model de pathologie pré-entraîné sur des données réelles à l’échelle des WSI entières, capable d’encoder les informations de la lame complète en une représentation vectorielle unique.

TITAN (Nature Medicine, 2025) : Transformer-based pathology Image and Text Alignment Network. Pré-entraîné sur 335 645 WSI via apprentissage visuel auto-supervisé et alignement vision-langage avec les rapports pathologiques correspondants (plus 423 122 légendes synthétiques générées par IA). Sans aucun fine-tuning ni label clinique, TITAN peut extraire des représentations de lames utilisables pour le diagnostic (y compris des cancers rares), la prédiction de survie, et même la génération automatique de rapports pathologiques.

CONCH, UNI, Virchow : autres foundation models développés par des laboratoires académiques et industriels, chacun avec des stratégies de pré-entraînement et des tailles de datasets différentes.

L’approche eye-tracking pour réduire les annotations Un travail innovant (Nature Communications, 2025) utilise des dispositifs de suivi oculaire (eye-tracking) pour capturer les patterns visuels des pathologistes pendant qu’ils examinent les lames. Le modèle PEAN (Pathology Expertise Acquisition Network) apprend des mouvements oculaires des experts plutôt que d’annotations manuelles, réduisant le temps d’annotation de 96 %. Sur 5 881 WSI et 5 catégories de lésions cutanées, PEAN atteint une AUC de 0,992 et une précision de 96,3 %.

Vision Transformers en pathologie

Les Vision Transformers sont particulièrement adaptés à la pathologie car ils capturent les dépendances longue distance entre les patches d’une WSI. Un Transformer hiérarchique peut d’abord encoder chaque patch, puis modéliser les relations spatiales entre les patches pour comprendre l’organisation tissulaire à l’échelle de la lame. Les architectures CWC-Transformer compressent les WSI tout en préservant les features discriminantes.

IA multimodale

L’intégration de la pathologie et de la radiologie via l’IA est une avancée récente. Des modèles de classification d’images basés sur le deep learning combinent les informations des WSI pathologiques et des images radiologiques (CT, IRM) pour un diagnostic plus complet. L’IA multimodale intègre aussi les données cliniques (âge, stade, marqueurs biologiques) avec les images pour des prédictions pronostiques plus précises.

Applications cliniques

Détection de métastases

La détection de métastases dans les ganglions lymphatiques est l’une des applications les plus matures. Le challenge Camelyon16 (400 WSI de ganglions sentinelles de cancer du sein avec annotations pixel) a démontré que les CNN pouvaient détecter les micro-métastases avec une AUC de 0,916 (ResNet), surpassant la moyenne des pathologistes (AUC 0,81) dans un contexte contrôlé. Paige.ai a obtenu une autorisation FDA pour la détection de cancer de la prostate sur biopsies.

Classification et grading tumoral

L’IA classifie les types histologiques de tumeurs (adénocarcinome vs carcinome épidermoïde vs carcinome à petites cellules dans le poumon, par exemple), évalue le grade tumoral (degré de différenciation), et identifie les sous-types moléculaires à partir de l’histologie seule. Des modèles prédisent le statut de mutations génétiques (KRAS, TP53, microsatellite instability) directement à partir des images histologiques, sans séquençage moléculaire.

Scoring de biomarqueurs

L’évaluation de l’expression de biomarqueurs (PD-L1 pour l’immunothérapie, HER2 pour le cancer du sein, Ki-67 pour la prolifération) est une tâche critique mais sujette à une forte variabilité inter-observateur. L’IA quantifie ces biomarqueurs de manière standardisée et reproductible. Lunit SCOPE IO prédit la réponse à l’immunothérapie en analysant l’infiltration immunitaire tumorale. L’IA en scoring de biomarqueurs est l’un des domaines à plus forte valeur ajoutée car elle réduit la variabilité et standardise les décisions thérapeutiques.

Prédiction pronostique et thérapeutique

Au-delà du diagnostic, l’IA extrait des informations pronostiques des lames que l’œil humain ne capture pas : patterns de stroma tumoral, organisation spatiale des cellules immunitaires, hétérogénéité intra-tumorale. Ces features « computationnelles » corrèlent avec le risque de récidive et la réponse au traitement. TITAN génère des prédictions de survie pour des cancers rares à partir de ses représentations apprises, sans fine-tuning spécifique.

Génération de rapports

TITAN démontre la capacité de générer des rapports pathologiques à partir des WSI, en utilisant l’alignement vision-langage appris pendant le pré-entraînement. Ces rapports décrivent les caractéristiques histologiques observées, le diagnostic probable, et les éléments cliniquement pertinents. Cette application reste au stade de recherche mais pourrait transformer le workflow pathologique en fournissant un premier brouillon de rapport que le pathologiste valide et corrige.

Entreprises et outils

Entreprise	Produits	Spécialité	Statut réglementaire
Paige.ai	Paige Prostate, Paige Breast	Détection cancer prostate/sein sur biopsies	FDA-cleared (prostate), CE
PathAI	AISight	Scoring biomarqueurs, essais cliniques, NASH	CE, partenariats pharma
Lunit	SCOPE IO, SCOPE PD-L1	Prédiction réponse immunothérapie, scoring PD-L1	CE, 125+ publications
Ibex Medical Analytics	Galen	Détection cancer (prostate, sein, gastrique, colon)	CE, déployé en routine clinique
Roche / Ventana	uPath, NAVIFY	Plateforme d’analyse d’images, scoring IHC	CE, intégration avec colorateurs Ventana
Aiforia	Aiforia Create, Aiforia Clinical	Plateforme cloud d’analyse d’images pathologiques	CE, FDA-cleared (certains modules)

Défis et limites

Retard réglementaire

Seulement 3 outils IA en pathologie ont reçu une autorisation FDA, contre plus de 1 000 en radiologie. Ce retard s’explique par un déficit de datasets de validation standardisés (pas d’équivalent au FaceForensics++ ou au DFDC de la radiologie), la complexité des tâches pathologiques (moins binaires que « fracture ou pas »), et les exigences de reproductibilité entre laboratoires utilisant des colorations et des scanners différents.

Coût d’annotation

L’annotation de WSI par des pathologistes experts est extraordinairement coûteuse en temps. Annoter pixel par pixel une seule WSI peut prendre des heures. Le MIL (annotation au niveau de la lame seulement), le self-supervised learning, et les approches innovantes comme l’eye-tracking (PEAN) réduisent ce coût mais ne l’éliminent pas. La génération de légendes synthétiques par IA (comme dans TITAN, avec 423 122 légendes synthétiques) est une autre approche pour pallier le manque de données annotées.

Variabilité inter-laboratoire

Les colorations histologiques (hématoxyline-éosine, immunohistochimie) varient entre laboratoires, lots de réactifs, et scanners. Un modèle entraîné sur des lames d’un laboratoire peut mal performer sur celles d’un autre. La normalisation des couleurs (stain normalization, Macenko, Reinhard) et les techniques de domain adaptation sont essentielles mais imparfaites.

Infrastructure et workflow

La numérisation systématique de toutes les lames est un prérequis non trivial : investissement en scanners (100 000 à 500 000 € par scanner), stockage massif (plusieurs To par jour pour un laboratoire actif), et réseau à haut débit. L’intégration avec les systèmes d’information de laboratoire (LIS) et les systèmes de gestion des lames est un défi organisationnel autant que technique.

Confiance et adoption

Les pathologistes sont légitimement prudents face à des « boîtes noires » qui prétendent diagnostiquer des cancers. L’explicabilité (cartes d’attention montrant les zones influentes), la validation clinique rigoureuse (études multi-centres prospectives), et l’intégration ergonomique dans les outils de lecture existants sont essentiels pour gagner la confiance des praticiens.

L’IA ne remplace pas le pathologiste Comme en radiologie, tous les outils IA en pathologie sont positionnés comme des aides au diagnostic. Le pathologiste reste responsable du diagnostic final. Les études montrent que la combinaison pathologiste + IA améliore à la fois la sensibilité et la rapidité du diagnostic, surtout pour les cas subtils (micro-métastases, lésions pré-néoplasiques). L’IA est un « second regard » qui complète l’expertise humaine.

Concepts connexes

La pathology AI fait partie du domaine plus large de l’imagerie médicale par IA et de la healthcare AI. La radiology AI est son pendant en imagerie diagnostique. Le drug discovery utilise la pathologie computationnelle pour évaluer l’efficacité des candidats médicaments dans les essais cliniques. Les techniques sous-jacentes incluent les CNN, les Vision Transformers, le transfer learning, le self-supervised learning, et la segmentation d’images. La classification d’images au niveau du patch et l’agrégation MIL au niveau de la lame sont les paradigmes centraux.

Questions fréquentes sur la pathology AI

Pourquoi la pathology AI a-t-elle moins d’autorisations FDA que la radiology AI ?

Le retard n’est pas dû à un manque de technologies viables mais à plusieurs facteurs spécifiques. Premièrement, les datasets de validation standardisés manquent en pathologie (contrairement à la radiologie qui dispose de benchmarks comme FaceForensics++, DFDC). Deuxièmement, les tâches pathologiques sont souvent plus complexes et moins binaires que les tâches radiologiques (classification histologique multi-classe vs détection fracture oui/non). Troisièmement, la numérisation systématique des lames est un prérequis coûteux que de nombreux laboratoires n’ont pas encore atteint. Le NCI a identifié ce « validation dataset gap » comme le principal obstacle et travaille à le combler.

Qu’est-ce qu’un foundation model en pathologie ?

Un foundation model en pathologie est un modèle de deep learning pré-entraîné sur des centaines de milliers de WSI via l’apprentissage auto-supervisé (sans annotations manuelles). Il apprend des représentations visuelles universelles des tissus qui sont ensuite transférables à de multiples tâches cliniques (diagnostic, pronostic, scoring) avec peu ou pas de données annotées supplémentaires. TITAN (Nature Medicine, 2025) est le plus avancé : pré-entraîné sur 335 645 WSI avec alignement vision-langage, il peut diagnostiquer des cancers rares et générer des rapports pathologiques sans aucun fine-tuning spécifique.

L’IA peut-elle prédire le statut moléculaire à partir de l’histologie seule ?

Oui, c’est l’un des résultats les plus remarquables de la pathology AI. Des modèles de deep learning prédisent des mutations génétiques (KRAS, TP53, EGFR), l’instabilité microsatellitaire (MSI), et le statut de déficience de réparation des mésappariements (dMMR) directement à partir des images histologiques, sans séquençage moléculaire. La précision n’est pas encore suffisante pour remplacer le séquençage, mais elle permet un tri rapide des patients qui bénéficieraient d’un test moléculaire complet, accélérant l’accès aux thérapies ciblées.

Comment les foundation models résolvent-ils le problème de la taille des WSI ?

Les foundation models utilisent une approche hiérarchique. D’abord, un encodeur de patches (souvent un ViT pré-entraîné) encode chaque patch 256×256 en un vecteur de features. Ensuite, un agrégateur (typiquement un Transformer avec attention) combine les milliers de vecteurs de patches en une représentation unique de la lame. TITAN ajoute une troisième étape : l’alignement avec le langage (rapports pathologiques) pour enrichir la représentation avec une compréhension sémantique. Cette approche multi-échelle permet de capturer à la fois les détails cellulaires (au niveau du patch) et l’organisation tissulaire (au niveau de la lame).

Quels sont les cas d’usage les plus matures en pathology AI ?

Trois applications sont les plus avancées cliniquement. Premièrement, la détection de cancer de la prostate sur biopsies (Paige.ai, FDA-cleared, Ibex Galen, CE-marqué et déployé en routine dans plusieurs laboratoires européens). Deuxièmement, le scoring quantitatif de biomarqueurs (PD-L1, HER2, Ki-67) qui réduit la variabilité inter-observateur et standardise les décisions thérapeutiques (Lunit SCOPE, PathAI AISight). Troisièmement, l’analyse d’images pour les essais cliniques en oncologie, où PathAI et d’autres fournissent des services d’analyse d’images standardisés aux laboratoires pharmaceutiques pour évaluer l’efficacité des traitements.