Des chercheurs proposent SemantiClean, un framework qui démonte la boîte noire des systèmes de prédiction e-commerce. Au lieu d'optimiser brut sur l'exactitude, il construit des prédictions (intention d'achat, segmentation client, affinité produit) à partir d'une bibliothèque d'éléments comportementaux explicites — 24 signaux organisés en quatre niveaux (fonctionnel, interaction, système, contextuel).
L'intérêt : chaque décision reste auditable. Quand le système te propose un produit ou classe ton profil, tu peux tracer exactement quel geste (scroll, temps passé, abandon du panier) a pesé. C'est l'inverse du deep learning classique où même les chercheurs ne savent pas pourquoi le modèle conclut.
Le compromis assumé : SemantiClean gagne moins d'exactitude pour gagner en défendabilité. Les auteurs testent sur le dataset OSPI (sessions d'achat réelles) et mettent en avant « sigma=0 reproducibilité » — pas de variance cachée entre deux exécutions.
Pour les équipes compliance et les régulateurs européens (RGPD, obligation d'explicabilité), c'est un signal : oui, tu peux construire un système prédictif sans renoncer à la transparence.




