Le mixeur commandé sur Amazon à prix plancher quatre mois plus tôt ne fonctionne plus. Vous appelez le service client de la firme. Après quelques secondes d'attente, une voix aimable vous annonce qu'il vous suffit de déposer l'objet à la poste et qu'il vous sera remboursé dans une poignée de jours.

Même scénario, autre cas: on vous fait poireauter dix minutes, puis on vous pose mille questions. On vous explique que la machine défectueuse n'est garantie que par son fabricant (sis à Jinan, Chine), que le délai de recours est dépassé ou que c'est de votre faute –bref, on ne vous facilite pas la vie.

Dans le premier cas, il est probable que l'entreprise à laquelle vous avez affaire vous considère comme un·e bon·ne client·e. À l'inverse, dans le second cas, une note défavorable s'est peut-être affichée, en rouge, en haut de la fiche que l'opérateur ou l'opératrice avait devant les yeux lors de votre appel.

Comment ces scores sont-ils calculés? Qui les calcule? Pour qui? Pourquoi? À partir de quelles données? Nul ne le sait précisément. Beaucoup ignorent même leur existence, comme le relevait une enquête parue dans le Washington Post en 2018.

Pour le New York Times, la journaliste Kashmir Hill a essayé d'en savoir plus, profitant d'une récente loi californienne permettant aux citoyen·nes des États-Unis, à l'image du RGPD européen, de réclamer aux data miners un fichier contenant les données personnelles récoltées.

400 pages et beaucoup de détails

Ces entreprises compilent tout ce qu'il est possible de collecter sur vous: votre activité en ligne, vos dépenses, vos cartes, vos plaintes, vos messages, vos clics. Partenaire de sociétés comme Airbnb ou OKCupid, l'une de ces officines nommée Sift assemble des dossiers individuels à partir de 16.000 points d'entrée. L'entreprise jure publiquement ne destiner ses services qu'à la seule lutte contre la fraude.

Kashmir Hill a obtenu son fichier. Il faisait 400 pages et comprenait tous les messages échangés avec ses hôtes sur Airbnb, ses commandes passées sur Yelp, ses utilisations de l'application Coinbase, etc. À chaque fois étaient associées les données concernant l'appareil utilisé, ainsi qu'une adresse IP.

«Sift savait, par exemple, que j'avais utilisé mon iPhone pour commander un poulet tikka masala, des samoussas aux légumes et un naan à l'ail un samedi soir d'avril, il y a trois ans», raconte la journaliste.

À lire aussi Internet, une décharge à ciel ouvert pour nos données personnelles

Hill liste les compagnies qui pratiquent ce type de data mining. Parmi elles, Retail Equation, qui aide des firmes comme Sephora ou Best Buy à déterminer s'il faut ou non accepter un retour, ou Kustomer, qui offre selon ses termes «une vision sans précédent des expériences passées et du sentiment actuel d'un client».

Que les grandes entreprises modernes regroupent une infinité de données personnelles sur nos activités n'est certes pas une surprise. Mais comme le souligne la Consumer Education Foundation, c'est la grande opacité du système de calcul, les biais qu'il peut présenter et le mystère entourant son utilisation réelle (dans le e-commerce, mais aussi par des employeurs ou des loueurs potentiels) qui posent de profondes questions.