Provenance Numérique (Content Provenance)

La provenance numérique désigne l’ensemble des faits vérifiables concernant l’origine, l’historique et les modifications d’un contenu numérique (image, vidéo, audio, document), enregistrés dans une structure cryptographiquement signée qui accompagne le fichier tout au long de son cycle de vie.

Concrètement : quand vous prenez une photo avec un Google Pixel 10, un certificat de provenance (appelé « Content Credential ») est automatiquement intégré au fichier. Ce certificat enregistre que la photo a été prise avec tel appareil, à telle date, en tel mode. Si vous la retouchez dans Google Photos (avec ou sans IA), chaque modification est ajoutée à la chaîne. Si quelqu’un la télécharge et tente de la modifier sans outil compatible, la signature cryptographique signale que le contenu a été altéré. C’est une traçabilité de bout en bout, de la capture à la consultation.

La provenance est devenue un enjeu central avec l’explosion du contenu généré par IA. Quand n’importe qui peut créer une image réaliste en quelques secondes avec un modèle de diffusion, la question n’est plus « est-ce que cette image est belle ? » mais « est-ce que cette image est vraie, et d’où vient-elle ? ». La provenance répond à cette question. Le standard technique qui la rend possible s’appelle C2PA (Coalition for Content Provenance and Authenticity), et son implémentation grand public s’appelle Content Credentials.

Définition: Ensemble vérifiable des faits sur l’origine, l’historique et les modifications d’un contenu numérique
Standard: C2PA (Coalition for Content Provenance and Authenticity), version 2.3 (février 2026)
Implémentation: Content Credentials (« étiquette nutritionnelle » du contenu numérique)
Coalition: 300+ organisations (Adobe, Microsoft, Google, Intel, BBC, Sony, Nikon, Leica, OpenAI, Meta, Amazon)
Communauté: Content Authenticity Initiative (CAI), 6 000+ membres
Réglementation: AI Act art. 50 (marquage machine-readable obligatoire), fast-track ISO
Vérification: verify.contentauthenticity.org, Google Photos « About this image »

Le standard C2PA

C2PA est un projet de la Linux Foundation (Joint Development Foundation), fondé en 2021 par l’alliance d’Adobe, Arm, Intel, Microsoft et Truepic. Il unifie deux initiatives antérieures : la Content Authenticity Initiative (CAI, menée par Adobe, axée sur les outils et la communauté) et Project Origin (mené par Microsoft et la BBC, axé sur la désinformation dans les médias).

C2PA produit une spécification technique ouverte, pas un produit. N’importe quelle organisation peut l’implémenter dans ses appareils, logiciels ou plateformes. La version actuelle est la 2.3, publiée début 2026. La spécification est en cours de normalisation ISO (fast-track).

Le Content Credential (manifeste C2PA)

Au cœur de C2PA se trouve le Content Credential (aussi appelé manifeste C2PA). C’est une structure de données cryptographiquement signée qui contient les informations de provenance d’un contenu. Le manifeste est composé de plusieurs éléments :

Assertions. Des déclarations factuelles sur le contenu : quel appareil l’a capturé, quel logiciel l’a modifié, quelles actions ont été appliquées (recadrage, redimensionnement, retouche, marquage, rédaction), si de l’IA a été utilisée, et quel type d’IA. Chaque modification crée une nouvelle assertion dans la chaîne.

Claim (revendication). Un claim regroupe toutes les assertions à un instant donné. Il inclut les liaisons (bindings) entre les assertions et le contenu réel du fichier (pixels, audio, texte). Le claim est encodé en CBOR (Concise Binary Object Representation), un format binaire compact et standardisé.

Signature cryptographique. Le claim est signé numériquement par le « claim generator » (l’appareil ou le logiciel qui crée le manifeste) avec un certificat X.509. Cette signature rend toute falsification détectable : si le contenu ou les assertions sont modifiés après la signature, la vérification échoue.

Horodatage (timestamp). Un horodatage cryptographique prouve que le manifeste existait à un instant précis. Le Pixel 10 de Google intègre un TSA (Time-Stamping Authority) embarqué sur la puce Tensor G5, ce qui permet de créer des horodatages vérifiables même hors connexion. Cela résout un problème historique des systèmes à certificats : les images restent vérifiables même après l’expiration du certificat.

Manifest Store. L’ensemble des manifestes associés à un contenu forme un Manifest Store. Ce store représente l’intégralité des Content Credentials du contenu et peut être intégré directement dans le fichier ou stocké dans un dépôt externe.

L’analogie de l’étiquette nutritionnelle C2PA décrit les Content Credentials comme une « étiquette nutritionnelle pour le contenu numérique ». Comme sur un emballage alimentaire, vous pouvez voir les ingrédients (quel appareil, quel logiciel), le processus de fabrication (quelles modifications), et le producteur (qui a signé). Mais vous n’êtes pas obligé de regarder l’étiquette, et elle ne vous empêche pas de consommer le contenu. Elle vous donne les informations pour prendre une décision éclairée.

Évolution des versions

Version	Date	Apports principaux
1.0	Janvier 2022	Spécification fondatrice : manifestes, assertions, signatures, hard binding
2.0	Janvier 2024	Trust List officielle, modèle de confiance renforcé, nouveau format de claim (v2)
2.1	2025	Soft binding (watermark + fingerprint pour retrouver les manifestes perdus), Soft Binding Resolution API
2.2	Mai 2025	Corrections de sécurité, améliorations de fiabilité, clarifications techniques
2.3	Début 2026	Historique d’édition plus détaillé, meilleure intégration cloud, renforcement de la validation anti-falsification

La chaîne de provenance

La provenance n’a de valeur que si elle couvre l’intégralité du cycle de vie du contenu. C2PA définit six étapes dans cette chaîne :

1. Capture. L’appareil (caméra, smartphone, micro) crée le contenu et signe le premier manifeste. C’est le point d’ancrage de toute la chaîne. Plus la capture est sécurisée (puce dédiée, attestation matérielle), plus la provenance est fiable. Le Google Pixel 10 a atteint le niveau d’assurance 2 du programme de conformité C2PA (le plus élevé actuellement défini), grâce à la combinaison Tensor G5 + Titan M2 + attestation matérielle Android.

2. Édition. Quand le contenu est modifié dans un logiciel compatible (Adobe Photoshop, Lightroom, Google Photos), chaque modification est enregistrée comme une nouvelle assertion dans le manifeste. Le manifeste s’enrichit à chaque étape. C2PA 2.3 offre un historique d’édition plus granulaire (redimensionnement, marquage, rédaction identifiés séparément).

3. Watermarking/Soft binding. Un watermark invisible est intégré dans le contenu pour servir de lien de secours vers le manifeste. Si les métadonnées sont perdues (screenshot, upload sur un réseau social qui les supprime), le watermark permet de retrouver le manifeste via la Soft Binding Resolution API. Le fingerprinting (empreinte numérique du contenu) sert de troisième mécanisme de fallback.

4. Intégration. Le manifeste C2PA est intégré directement dans le fichier (pour les formats qui le supportent : JPEG, PNG, WebP, MP4, PDF, WAV, etc.) ou stocké dans un dépôt externe (manifest repository) lié au contenu par watermark ou fingerprint.

5. Distribution. Le contenu est publié sur des plateformes (réseaux sociaux, sites d’actualités, places de marché). Le manifeste voyage avec le fichier. Les plateformes compatibles (Google Search, Google Ads, YouTube en cours) vérifient et affichent les informations de provenance.

6. Vérification. L’utilisateur final consulte les Content Credentials via un outil compatible : le site verify.contentauthenticity.org, Google Photos (« About this image »), une extension de navigateur, ou une application tierce. L’outil vérifie que la signature est valide, que le contenu n’a pas été altéré depuis la dernière signature, et que le certificat provient d’une source de confiance (via la Trust List C2PA).

L’écosystème de la provenance

Les acteurs

C2PA (standard). Produit les spécifications techniques. Plus de 300 organisations participent, incluant des géants tech, des médias, des constructeurs et des organismes publics. La gouvernance est assurée par un Steering Committee et un Technical Working Group. La spécification est open source (licence Creative Commons).

Content Authenticity Initiative (CAI). Fondée par Adobe en 2019, la CAI est la communauté qui développe les outils open source, pilote l’exploration de fonctionnalités et favorise l’adoption. Plus de 6 000 membres en 2026. La CAI produit le SDK open source (c2pa-rs en Rust), les outils de vérification, et les guides d’implémentation.

Creator Assertions Working Group (CAWG). Un groupe de travail qui développe des extensions à C2PA pour les besoins spécifiques des créateurs (identité, attribution, droits d’auteur). CAWG opère en parallèle de C2PA et produit des spécifications complémentaires.

JPEG Trust. Un standard de l’ISO/JPEG qui intègre C2PA dans l’écosystème JPEG, assurant la compatibilité native avec les formats d’image les plus répandus.

Hardware compatible

Appareil	Type	Niveau C2PA	Détails
Google Pixel 10	Smartphone	Assurance Level 2 (max)	C2PA natif dans Pixel Camera et Google Photos, horodatage offline via Tensor G5 + Titan M2, activé par défaut
Leica M11-P, SL3	Appareil photo	Signature à la capture	Premier constructeur à intégrer C2PA dans un appareil photo professionnel
Sony Alpha 1, A9 III, A7S III, A7 IV	Appareil photo	Signature à la capture	Gamme professionnelle avec Content Credentials intégrés
Sony PXW-Z300	Caméra vidéo pro	Signature à la capture	Première caméra vidéo professionnelle avec Content Credentials
Nikon Z6 III	Appareil photo	Prévu	Intégration C2PA annoncée

Software compatible

Adobe Photoshop et Lightroom (création et préservation de Content Credentials), Capture One (édition photo professionnelle), Google Photos (création, édition, vérification et affichage), Google Search via « About this image » (vérification et affichage des métadonnées C2PA), Google Ads (intégration des signaux C2PA dans l’application des politiques publicitaires). YouTube explore l’affichage de la provenance pour le contenu capturé à la caméra. LinkedIn et les produits Meta intègrent progressivement C2PA.

Le SDK open source c2pa-rs (Rust) est la référence d’implémentation. Des bindings existent pour Python, JavaScript/Node.js, et d’autres langages. Le coût d’implémentation est réduit : le standard et les outils sont gratuits, seuls les certificats de signature coûtent entre 50 et 500 $ par an selon le fournisseur.

Le modèle de confiance

Un manifeste C2PA est vérifiable, mais il n’est pas automatiquement « vrai ». La signature prouve que le manifeste n’a pas été altéré depuis sa création et qu’il a été créé par un logiciel ou un appareil spécifique. Elle ne prouve pas que le contenu du manifeste est exact. Un logiciel malveillant pourrait créer un manifeste mensonger (« cette image a été prise avec un appareil photo ») et le signer avec un certificat valide.

C’est là qu’intervient le modèle de confiance. C2PA utilise un système de Trust List, similaire à celui utilisé par les navigateurs web pour les certificats HTTPS. Les autorités de certification (CA) qui veulent émettre des certificats C2PA doivent respecter une Certificate Policy stricte et passer le programme de conformité C2PA. Seuls les certificats émis par des CA incluses dans la Trust List sont considérés comme « de confiance ». Les produits (generators et validators) doivent aussi passer la conformité pour figurer sur la liste publique.

Ce système n’est pas infaillible. Des chercheurs en sécurité ont documenté des vecteurs d’attaque : falsification de métadonnées, suppression ou contournement de watermarks, imitation de fingerprints. La critique la plus notable concerne l’implémentation du Pixel 10 : un chercheur en sécurité a démontré que la signature cryptographique de Google exclut certaines métadonnées et que toutes les photos sont marquées comme « images composites » (en raison de la photographie computationnelle), ce qui limite la valeur juridique de la provenance pour certains usages (preuves légales, journalisme).

Provenance ≠ vérité La provenance prouve l’origine et l’historique d’un contenu, pas sa véracité. Une photo authentique prise avec un Pixel 10 (C2PA Assurance Level 2) peut montrer une scène mise en scène. Un article avec des Content Credentials valides peut contenir des informations fausses. La provenance est un signal de confiance parmi d’autres, pas une garantie de vérité. Elle doit être combinée avec le fact-checking, la détection de deepfakes, et l’éducation aux médias.

Provenance et réglementation

L’AI Act (article 50) impose que les fournisseurs de systèmes d’IA génératifs marquent leurs sorties en format machine-readable. La provenance C2PA est le mécanisme technique privilégié pour satisfaire cette obligation. Le Code de pratique sur la transparence du contenu IA (finalisation prévue juin 2026) recommande explicitement l’adoption de C2PA.

La spécification C2PA est en cours de normalisation ISO (fast-track), ce qui lui donnerait un statut de standard international reconnu par les régulateurs du monde entier. L’EU AI Office cite C2PA comme standard de référence pour la conformité article 50.

Au-delà de l’Europe, la provenance est intégrée dans les réglementations IA émergentes. La Chine impose le marquage obligatoire du contenu de « synthèse profonde ». Les États-Unis (California AI Transparency Act) et les recommandations du NIST (AI 100-4, « Reducing Risks Posed by Synthetic Content ») citent C2PA comme approche technique de référence. La NSA a publié en janvier 2025 un guide de cybersécurité spécifiquement dédié à l’implémentation de Content Credentials.

Cas d’usage par secteur

Médias et journalisme

La BBC (cofondatrice de Project Origin), le New York Times, Reuters et Associated Press utilisent ou expérimentent C2PA pour certifier l’authenticité de leur contenu éditorial. Le photojournalisme est le cas d’usage le plus évident : une photo prise avec un appareil C2PA, éditée dans un logiciel compatible, et publiée sur une plateforme qui vérifie les credentials, offre une chaîne de confiance vérifiable de bout en bout. Pour les agences de presse, cela réduit le risque de publier involontairement du contenu manipulé.

Patrimoine culturel et archives

La Bibliothèque du Congrès américain a créé en 2025 un groupe de travail « C2PA for G+LAM » (Government plus Libraries, Archives and Museums) pour explorer l’utilisation de C2PA dans la préservation numérique. L’idée : les institutions culturelles peuvent utiliser les Content Credentials pour documenter l’historique de leurs fichiers numériques (numérisation, restauration, migration de format) de manière standardisée et vérifiable. Plusieurs cas d’usage et modèles d’assertions ont déjà été développés par le groupe.

Marques et marketing

Les marques utilisent la provenance pour protéger l’intégrité de leurs actifs numériques. Un contenu de marque watermarké et accompagné de Content Credentials peut être tracé même s’il est repris sur des sites tiers non autorisés. Le watermark invisible permet de relier le contenu à ses credentials même quand les métadonnées sont perdues. C’est une protection contre les contrefaçons, le détournement de visuels et le « brand slop » (contenu synthétique imitant une marque).

IA générative

Les fournisseurs de modèles génératifs (Google Gemini, Adobe Firefly, Stability AI) intègrent C2PA pour marquer le contenu synthétique dès sa création. Le manifeste indique que le contenu a été généré par IA, quel modèle a été utilisé et, dans certains cas, le prompt de génération. C’est une obligation réglementaire (AI Act art. 50) mais aussi un outil de responsabilité : si un contenu IA cause un préjudice, la provenance permet d’identifier le système qui l’a produit.

Limites et défis

Fragilité de la chaîne. La provenance ne fonctionne que si chaque maillon de la chaîne (capture, édition, publication, distribution) préserve les credentials. Un seul outil non compatible suffit à briser la chaîne. En pratique, de nombreux éditeurs d’images, applications de messagerie et plateformes de réseaux sociaux ne supportent pas encore C2PA. Le soft binding (watermark + fingerprint) atténue ce problème mais ne l’élimine pas.

Photographie computationnelle. Les smartphones modernes ne prennent pas de « vraies » photos au sens classique. Ils capturent une séquence d’images à grande vitesse et les assemblent en une image unique via des algorithmes de traitement. Un chercheur du MIT qualifie ces photos de « hallucinations ». Le Google Pixel 10 marque toutes ses photos comme « images composites », ce qui soulève la question de ce que « provenance authentique » signifie réellement pour un smartphone.

Adoption incomplète. C2PA fonctionne sur un modèle opt-in. L’absence de credentials ne prouve pas que le contenu est faux ou manipulé, cela peut simplement signifier que l’outil utilisé ne supporte pas C2PA. Tant que l’adoption n’est pas universelle, l’absence de provenance n’est pas un signal négatif fiable.

Vie privée. La provenance enregistre des informations sur l’appareil, le logiciel, et potentiellement la localisation et l’identité du créateur. C2PA est conçu pour permettre le contrôle par l’utilisateur (opt-in, identité optionnelle), mais le risque de surveillance ou de traçage existe si les implémentations ne respectent pas ces principes. Le Pixel 10 utilise des clés cryptographiques à usage unique et l’attestation anonyme pour empêcher la traçabilité entre images.

Attaques et contournement. Des chercheurs ont documenté des méthodes pour contourner C2PA : altération des métadonnées de provenance, suppression de watermarks, imitation de fingerprints. C2PA n’est pas une solution parfaite. C’est une couche de défense dans une stratégie multicouche qui inclut aussi la détection de deepfakes, le fact-checking et l’éducation aux médias.

Provenance vs Provenance Tracking

La provenance (cette page) concerne la traçabilité de l’origine et de l’historique d’un contenu numérique via des standards comme C2PA. Le provenance tracking est un concept plus large qui couvre la traçabilité des données dans les pipelines de machine learning : d’où viennent les données d’entraînement, comment elles ont été transformées, quel modèle a été entraîné dessus. Les deux concepts partagent le principe de traçabilité mais s’appliquent à des contextes différents (contenu final vs données d’entraînement).

Questions fréquentes sur la provenance numérique

Quelle est la différence entre provenance et watermarking ?

La provenance est le concept : tracer l’origine et l’historique d’un contenu. Le watermarking est une technique au service de la provenance. C2PA combine trois couches : les métadonnées cryptographiques (manifeste signé), le watermark invisible (lien de secours vers le manifeste) et le fingerprinting (empreinte du contenu). Le watermark est un composant de l’infrastructure de provenance C2PA, pas un synonyme.

Les Content Credentials ralentissent-ils la prise de photo ?

Non. Sur le Google Pixel 10, la création du manifeste C2PA est intégrée au processus de capture et s’exécute sur la puce dédiée (Tensor G5 + Titan M2). L’opération est transparente et n’ajoute aucun délai perceptible. Le manifeste ajoute quelques Ko au fichier, ce qui est négligeable par rapport à la taille d’une photo haute résolution. L’horodatage est généré localement, même hors connexion.

Un contenu sans Content Credentials est-il forcément suspect ?

Non. L’adoption de C2PA est en croissance mais loin d’être universelle. La majorité des contenus en circulation aujourd’hui n’ont pas de credentials, simplement parce qu’ils ont été créés avec des outils non compatibles. L’absence de provenance est un signal neutre, pas un signal négatif. C’est différent d’un manifeste invalide (signature cassée), qui indique que le contenu a été altéré après signature et qui est un signal négatif.

La provenance C2PA est-elle compatible avec le RGPD ?

Oui, si elle est implémentée correctement. C2PA est conçu avec le respect de la vie privée comme principe fondateur. L’inclusion d’informations d’identité (nom du créateur) est optionnelle. Le standard recommande le contrôle utilisateur (opt-in). Le Pixel 10 utilise l’attestation anonyme et des clés cryptographiques à usage unique pour empêcher la traçabilité entre images. Cependant, certaines assertions (appareil, localisation, date) peuvent constituer des données personnelles au sens du RGPD. Les implémenteurs doivent s’assurer que le traitement est conforme (base légale, minimisation des données, information de la personne).

Comment vérifier les Content Credentials d’une image ?

Trois méthodes principales. La première : uploadez l’image sur verify.contentauthenticity.org (outil gratuit de la CAI). Le site affiche le manifeste complet : origine, modifications, signature, certificat. La deuxième : dans Google Photos, ouvrez l’image, faites glisser vers le haut pour voir les détails, puis encore vers le haut pour voir la provenance (disponible sur les images prises avec un Pixel 10 ou éditées avec Google Photos). La troisième : utilisez le SDK open source c2pa-rs pour intégrer la vérification dans vos propres outils. Le SDK est disponible sur GitHub avec des bindings pour Rust, Python et JavaScript.