Tout le monde semble scandalisé par l’usage des données FB par la société Cambridge Analytica, mais ce n’est pas pour autant que tout le monde va changer ses habitudes. Je vais donc m’efforcer ici de vous montrer comment Cambridge Analytica fonctionne pour que vous puissiez vous rendre compte que vous avez tous, à un moment ou un autre, été acteur de cette approche et probablement à l’insu de votre plein gré.
Tout d’abord, situons quelque peu la société elle-même et dont le slogan n’est autre que « data drives all we do », traduisez par « les données nous mènent à ce que nous faisons ». Si pour le simple des mortels, cette phrase pourrait apparaitre un peu abscons, les data Scientist vous expliqueront que CA (Cambridge Analytica) fait de l’analyse de méta données pour prévoir les comportements humains. En ce sens, ils ont raison en précisant que les données sont ce que nous faisons ; mieux, avec les données nous savons ce que vous allez faire. Encore mieux, elle précise qu’elle se donne pour mission « de changer le comportement grâce aux données » et fonctionne en mélangeant le traitement quantitatif de données, la psychométrie et la psychologie comportementale. (Le Monde, 11 mars 2018). C’est ce qu’on appelle également Custom Data Manipulation.
Un processus disponible presque pour tous, tout du moins, d’un point de vue hardware. Le plus important étant devenu la qualité des algorithmes qui vont permettre de faire ressortir les données qui intéressent ceux qui les achètent. En l’occurrence, CA offre ses services pour le commerce et pour la politique. Alors, me direz-vous, comment ça marche ?
CA est une entreprise de psychologie numérique qui développe des scénarii comportementaux en fonction des données fournies par toutes formes de systèmes de collecte de données, mais plus particulièrement les réseaux. Ces données sont traitées par des algorithmes qui ont besoin des moissonneuses à données que sont les GAFA. Généralement, ils gardent cet or noir pour eux et les monétisent. Néanmoins, ils sont également avides de recherches universitaires pour l’amélioration de leurs algorithmes. De fait, quelle que soit la puissance économique des GAFA, ils ne peuvent arriver seuls à produire l’ensemble des programmes qui améliorent leurs systèmes. C’est comme cela qu’ils acceptent parfois des partenariats avec des universités, des laboratoires privés, start-up, etc. C’est le profil type de CA qui est issue d’un Start up financée par le hedge fund Renaissance Technologies dont le CEO est Robert Mercer, ayant financé massivement Trump en 2016, Climatosceptique et Brexiter. Parallèlement, c’est un poucet qui a grandi très vite, démarrée en 2013 et devint partenaire aux primaires américaines avec l’ultraconservateur Ted CRUZ. Il est bien question ici de Strat Up.
Mais comment cela fonctionne-t-il et êtes-vous concernés (mes chers amis) sur Facebook?
La psychologie algorithmique se base sur le principe de corrélation propre à l’analyse des métadonnées. En d’autres termes, il n’est pas possible d’avoir de corrélation suffisamment précise si on n’a pas des millions de données : le fameux Big Data. Plus les données sont importantes, plus les lieux sont précis. Donnons un exemple fictif :
Sur votre page FB, vous « likez » régulièrement les actions du gouvernement belge pour le renvoi des migrants. Par ailleurs vous adorez le rugby et vous êtes fan de la gueuze Faro. L’équation est donc :
MIGRANTS + RUGBY + FARO = votre profil.
Cela devient intéressant lorsqu’on se rend compte que de nombreuses personnes qui like le renvoi des migrants adorent également le Rugby. Et dans ces conditions, il est probable que les personnes voulant renvoyer les migrants et aimant le Rugby devraient aimer… la Lambic FARO ! Jusque-là, le processus semble simple. Il devient vraiment intéressant lorsque les associations peuvent se faire dans l’autre sens : ceux qui aiment la FARO et le Rugby sont probablement sensibles au renvoi des migrants.
C’est comme cela que Trump a gagné les élections américaines, c’est-à-dire en ciblant des profils de personnes qui seraient sensibles à son programme, mais continueraient à hésiter. Il a donc ciblé de nombreux microprofils au travers de tous les États. En effet, Cambridge Analytica est accusée d’avoir utilisé des données de 30 à 70 millions d’utilisateurs de Facebook, recueillies sans leur consentement, en passant par un quiz développé par un universitaire anglais, Aleksandr Kogan, et sa société Global Science Research (GSR) : le professeur Paul-Olivier DELHAYE explique que « La société privée Cambridge Analytica a établi un contrat avec un académique de l’université de Cambridge. Il lui a construit une App Facebook, qu’il présentait comme un outil pour une recherche affiliée à l’université de Cambridge. Cette application a été suggérée aux utilisateurs américains de Facebook. Elle proposait, contre échange de paiement, que l’utilisateur remplisse des questionnaires psychologiques pour « mieux se connaitre », et qu’en plus il partage le contenu de leur compte Facebook avec l’application. Près de 270 000 utilisateurs l’ont fait. » (RTBF 21 mars 2018)
Jusque-là, le grand méchant semble donc être Facebook qui aurait vendu les données de ses utilisateurs à CA. Mais, rappelez-vous, à l’instant, je vous expliquais que les GAFA n’aimaient pas vendre leurs données, un trésor de guerre. Alors que s’est-il passé ? En fait, CA a seulement obtenu le droit de faire circuler une petite publicité pour vous inciter à jouer pour définir votre profil. Au moment où j’écris ces lignes nombre de mes « amis » s’amusent à remplir un micro formulaire pour définir leurs coordonnées politiques (cf. Ci-dessous).
Ces micros applications sont fournies par des sociétés comme CA ! Et on en redemande puisque, sur le fond, ce ne sont pas des escrocs et généralement ils offrent une réponse sérieuse qui vous conforte d’avoir fait un bon choix et que cette micro application (ici elle s’appelle Thisisyourdigitallife) était un truc sérieux. Cambridge Analytica ne semble rien devoir se reprocher et précise dans son communiqué de presse, sa vision de la problématique FB : « En 2014, nous avons reçu des données Facebook et des dérivés de données Facebook d’une autre société, GSR, selon lesquelles nous nous sommes engagés de bonne foi à fournir légalement des données pour la recherche. Après avoir appris par la suite que GSR avait rompu son contrat avec Cambridge Analytica parce qu’elle n’avait pas respecté la réglementation sur la protection des données, Cambridge Analytica a supprimé toutes les données et produits dérivés de Facebook, en coopération avec Facebook. » (19 mars 2018). Il est impossible de démonter à notre niveau ces vérités. Reconnaissons que nous sommes très étonnés que CA détruise ces données qui sont leur or et argent. Difficile d’ailleurs de les croire, eu égard au communiqué de presse présenté quelques jours avant le grand déballage et où CA nous informe que « Les divisions commerciales et politiques de Cambridge Analytica utilisent des plateformes de médias sociaux pour le marketing sortant, offrant un contenu créatif et orienté données à des publics ciblés. Ils n’utilisent pas ou ne conservent pas les données des profils Facebook. » (17 mars 2018) . Étonnant, me direz-vous, pour une entreprise qui a besoin des données pour exister.
Nonobstant, l’enjeu ne nous semble pas être là et où cela se corse c’est que vous avez dû permettre à l’algorithme sous-jacent à l’application logicielle de « visiter » votre profil. C’est d’ailleurs souvent cela qui vous est demandé en premier lieu, avant de répondre aux questions posées. Les questions posées permettent juste de télécharger vos données. Toutefois, soyons de bon compte : nous sommes relativement peu nombreux à utiliser ce type d’application. Dans le cas de CA, seulement 270.000 Américains ont répondu à un questionnaire de CA via GSR. Une paille. Malheureusement, ces algorithmes ne s’arrêtent pas là : ils peuvent également scanner les profils de vos amis… donc moi ! avec une moyenne de 150 amis/profils, le chiffre de 270.000 devient 40.500.000. Et dans la réalité, CA a récolté plus de 50.000.000 de profils. Une situation embarrassante pour Facebook, n’ayant pas vu venir la prolifération et l’usage d’autant de données à partir d’une simple application sponsorisée. Et rappelez-vous l’objectif de tout algorithme de data analyse : plus j’ai de données mieux je profile. C’est donc dans l’ADN de ces sociétés de profilage que de tenter, par tous les moyens possibles, de récolter le maximum de données. Sinon et malgré le meilleur algorithme du monde, la prédictibilité sera réduite et le taux d’erreur énorme sans suffisamment de données, c’est l’or noir… Notons toutefois ici que l’escroquerie est issue d’une spin off de l’université de Cambridge qui faisait, selon eux, de la recherche.
Pas difficile donc de comprendre qu’en fait, CA a arnaqué Facebook et que FB n’a absolument pas fait son travail de protection de la vie privée, car l’enjeu est non pas pour ceux qui se font attraper avec ce type de questionnaire douteux, mais bien ceux qui ne savent pas qu’ils sont profilés par des tiers. A cet effet, le RGDP (Règlement Général des Données Personnelles) qui sera mis en vigueur en Europe à partir du mois de mai est une bonne chose. Il obligera les GAFA à être bien plus vigilants, car vous aurez alors le droit de demander des comptes à Facebook.
Donc, mes amis, ne m’en veuillez pas, je vous aime encore bien. Je voulais juste vous prévenir que vous avez ouvert mon intimité sans mon consentement. La prochaine fois, soyez mieux vigilants.
Pascal SIMOENS, Urbaniste architecte , Data Scientist.
Plus d’infos :
Ce qu’il faut savoir sur Cambridge Analytica, la société au cœur du scandale Facebook (Le Monde, 22 mars 2018)
Quelle a été l’importance réelle de Cambridge Analytica dans la campagne de Trump ? (Le Monde, 23 mars 2018)
Cambridge Analytica, la start-up qui influence les électeurs (Le Monde , 14 avril 2017)
Cambridge Analytica réagit aux fausses allégations dans les médias (CA, 19 mars 2018)
Cambridge Analytica répond à l’annonce de Facebook, (CA, 17 mars 2018)
Cambridge Analytica: « C’est du hacking », selon le mathématicien belge Paul-Olivier Dehaye, (RTBF, 21 mars 2018)
Scandale Facebook et Cambridge Analytica : Zuckerberg annonce des mesures, Futura Tech, 22 mars 2018