In the Weights : vérifier si l'IA te connaît

// IA7 · 19/06/26 - 08:30

Hans Olo19/06/26 - 08:30·2 min·actu·The Decoder

In the Weights : vérifier si l'IA te connaît

// illustration générée — IA7

0:00 / 0:00

Deux anciens d'OpenAI lancent « In the Weights », un site qui mesure l'empreinte d'une personne dans les données d'entraînement des modèles IA. Un score de 0 à 996 indique le degré d'exposition : Mozart, Shakespeare et Taylor Swift dominent le classement, mais tu peux aussi chercher ton propre nom ou celui de tes proches.

L'outil pose une question dérangeante : les modèles gardent-ils des traces trop précises de qui nous sommes ? Non seulement des célébrités, mais aussi des personnes ordinaires dont les textes, photos ou données personnelles traînent sur le web et se retrouvent aspirées pendant l'entraînement sans consentement explicite.

La parade existe, mais elle est insuffisante. Tu peux demander le retrait de tes données via RGPD ou opt-out direct auprès des entreprises — sauf que les modèles existants ne « oublient » pas vraiment : ils sont déjà entraînés. Le vrai levier, c'est la transparence en amont et les choix de données plus stricts dès le départ.

Cet outil est utile pour prendre conscience du problème, mais il rappelle surtout que ton empreinte numérique n'est pas vraiment tienne une fois qu'elle touche un modèle de langage.

// à savoir

Score d'empreinte

— Mesure de 0 à 996 indiquant à quel point une personne ou une entité est représentée dans les données d'entraînement d'un modèle IA, basée sur la fréquence et la profondeur de sa présence.

Aspiration de données

— Processus automatisé de collection massive de textes, images et contenus disponibles publiquement sur internet pour l'entraînement des modèles IA, souvent sans consentement explicite des auteurs.

source

/ feed ↩

In the Weights : vérifier si l'IA te connaît

// à savoir

Score d'empreinte

Aspiration de données

OpenAI brûle 3,7 milliards pour en gagner 5,7

Mythos : pourquoi l'embargo cyber ne marche jamais

Les meilleurs modèles IA échouent à 97% sur le vrai travail