Deux anciens d'OpenAI lancent « In the Weights », un site qui mesure l'empreinte d'une personne dans les données d'entraînement des modèles IA. Un score de 0 à 996 indique le degré d'exposition : Mozart, Shakespeare et Taylor Swift dominent le classement, mais tu peux aussi chercher ton propre nom ou celui de tes proches.
L'outil pose une question dérangeante : les modèles gardent-ils des traces trop précises de qui nous sommes ? Non seulement des célébrités, mais aussi des personnes ordinaires dont les textes, photos ou données personnelles traînent sur le web et se retrouvent aspirées pendant l'entraînement sans consentement explicite.
La parade existe, mais elle est insuffisante. Tu peux demander le retrait de tes données via RGPD ou opt-out direct auprès des entreprises — sauf que les modèles existants ne « oublient » pas vraiment : ils sont déjà entraînés. Le vrai levier, c'est la transparence en amont et les choix de données plus stricts dès le départ.
Cet outil est utile pour prendre conscience du problème, mais il rappelle surtout que ton empreinte numérique n'est pas vraiment tienne une fois qu'elle touche un modèle de langage.



