Les géants de l’IA encore loin des exigences de transparence de l’UE
Plusieurs grandes entreprises du secteur de l’intelligence artificielle ayant récemment lancé de nouveaux modèles ne semblent pas se conformer pleinement aux obligations de transparence prévues par la règlementation européenne.
En vertu du règlement européen sur l’IA (AI Act), les entreprises qui développent des modèles de fondation à grande échelle, tels que ceux qui sous-tendent les chatbots populaires comme ChatGPT ou Gemini de Google, sont tenues de divulguer publiquement les informations relatives aux données utilisées pour entraîner les modèles d’IA.
Ces divulgations sont particulièrement importantes pour les artistes, les écrivains et autres créateurs de contenus protégés par le droit d’auteur. L’UE souhaite permettre aux créatifs de vérifier si leur travail a été utilisé pour entraîner un modèle, ce qui pourrait les aider à intenter une action en justice s’ils estiment que leurs droits ont été violés.
Les développeurs d’IA sont tenus de divulguer s’ils ont utilisé des ensembles de données accessibles au public ou des informations sous licence provenant de titulaires de droits. Ils doivent également dresser la liste des sites web les plus importants qu’ils ont explorés pour obtenir des données d’entraînement et préciser le contenu qu’ils ont utilisé.
La Commission européenne a formalisé ces exigences dans un modèle de déclaration destiné à servir de « socle minimal commun » pour l’ensemble du secteur.
Mais les principaux développeurs d’IA ne se précipitent pas pour soumettre leurs informations, ce qui soulève la question de savoir si la Commission devra intervenir pour les contraindre à se conformer à ces règles une fois que la période de grâce pour leur mise en application aura pris fin cet été.
Des obligations encore en suspens
Les délais de mise en conformité avec les obligations de divulgation des données d’entraînement dépendent de la date de production du modèle. Les entreprises qui ont mis un modèle d’IA sur le marché européen avant le 2 août 2025 ont jusqu’au mois d’août 2027 pour se conformer à la règle. Cependant, les modèles commercialisés après le 2 août 2025 doivent se conformer immédiatement.
Il est toutefois essentiel de noter que la Commission ne commencera officiellement à superviser et à appliquer ces règles de divulgation des données d’entraînement qu’en août prochain, prolongeant ainsi le délai de mise en conformité accordé aux développeurs d’IA jusqu’à l’été, même si les entreprises sont libres de se conformer à la loi plus tôt si elles le souhaitent.
C’est exactement ce qu’a fait Hugging Face, une entreprise spécialisée dans les modèles d’IA open source, qui a rempli et publié le modèle pour un modèle qu’elle a commercialisé avant même la date limite fixée par l’AI Act.
« Félicitations au bureau de l’IA de la Commission européenne pour avoir rendu cela si simple ! », a écrit Yacine Jernite, responsable de l’apprentissage automatique de l’entreprise, dans un article de blog. Il a suggéré que le remplissage et la publication du modèle étaient faisables même pour les petites organisations, affirmant que cela ne lui avait pris que deux heures.
Manque d’informations
Pour d’autres développeurs d’IA, avouer les informations utilisées pour former leurs modèles ne semble pas si facile.
OpenAI a mis en ligne GPT-5 quelques jours seulement après la date limite du 2 août 2025 ; Google a lancé Gemini 3 en novembre ; et en décembre, l’entreprise européenne Mistral a suivi avec Mistral 3.
Au moment de la rédaction de cet article, aucun de ces modèles d’IA de base ne semble avoir publié les informations requises par la loi européenne sur l’IA. Ils n’ont fourni que des informations générales sur les données utilisées.
La fiche technique du modèle GPT-5 mentionne des « ensembles de données diversifiés », comprenant des informations provenant de l’internet public, des données fournies par des partenaires et générées par des formateurs humains. Google et Mistral indiquent également avoir utilisé des données diversifiées pour entraîner leurs modèles, sans toutefois nommer les ensembles de données ou les sites web spécifiques.
Euractiv a demandé aux trois entreprises où trouver la documentation sur leurs modèles exigée par la loi européenne sur l’IA. Google nous a répondu qu’il évaluait actuellement la manière de mettre en œuvre les exigences de la loi, ajoutant qu’il travaillait de bonne foi pour s’y conformer. OpenAI a déclaré qu’il continuait à collaborer avec le Bureau de l’IA. Mistral n’a pas répondu.
Que va faire la Commission ?
« Ce manque de transparence a des conséquences réelles », a confié Maximilian Gahntz, responsable de la politique en matière d’IA à la Fondation Mozilla, à Euractiv. « Sans une idée claire des données utilisées par les développeurs d’IA pour former leurs modèles, les titulaires de droits ne savent pas si leurs articles ou leurs œuvres d’art sont utilisés pour la formation de l’IA contre leur gré. »
Zuzanna Warso, directrice de recherche à l’organisation à but non lucratif Open Future, a déclaré que les exigences de transparence de la loi étaient relativement modestes, ajoutant qu’elles s’appliquaient également aux fournisseurs européens et qu’elles devaient donc être appliquées à ces derniers également.
Mais toute application future de l’AI Act à venir sera presque certainement entraînée dans la querelle transatlantique en cours sur l’état de droit numérique de l’UE.
Il y a près d’un an, le vice-président américain JD Vance a profité d’un discours prononcé lors d’une conférence sur l’IA à Paris pour s’en prendre à ce qu’il a qualifié de règlementation « excessive » de l’IA en Europe.
Une première amende infligée par l’UE à X, la société d’Elon Musk, en vertu de règles distinctes applicables aux plateformes, a également donné lieu à une vive polémique plus tard dans l’année, bien que la sanction elle-même ait été relativement modeste et que la cible n’ait guère d’importance sur le plan économique. Toute mesure coercitive de l’UE à l’encontre des technologies américaines est considérée comme inacceptable par Washington.
Les règles de transparence de l’AI Act, en revanche, pourraient porter atteinte au cœur même — peut-être protégé par des droits d’auteur — des entreprises d’IA pesant plusieurs milliards de dollars et dirigées par des entités américaines telles qu’OpenAI, Google, Meta et Microsoft.
En septembre 2025, la Commission avait indiqué à Euractiv qu’elle analysait toujours si GPT-5, d’OpenAI, pouvait être considéré comme un nouveau modèle au sens de l’AI Act, mais a affirmé qu’elle veillerait au respect de la réglementation, y compris en infligeant des amendes si nécessaire.
La Commission a refusé de commenter officiellement lorsque Euractiv lui a demandé si elle était parvenue à une conclusion concernant GPT-5 et si elle prenait des mesures concernant d’autres modèles commercialisés depuis lors.
Déplorant une « discrimination », Washington menace les entreprises technologiques de l’UE de sanctions financières
Dans un message publié mardi sur X, le représentant américain au commerce a accusé l’Union…
3 minutes