Not Provided : Une donnée peut exister sans être vue

Publié le 27 septembre 2013 par Ecribouille @Ecribouille

Cette semaine la grande annonce dans la sphère du webmarketing était celle du passage au 100% Not Provided. Chèrs amis non-habitués à ces termes, ne vous inquiétez pas, je vais vous expliquer cela en essayant de ne pas vous raconter de bêtise non plus.

Je sniffe tes recherches

Lorsque quelqu’un tape une suite de caractères dans un moteur de recherche tel que celui de Google, il envoie une requête à laquelle Google répond en affichant une liste de résultats. Cette dernière concerne la liste de liens qui ne sont pas des liens sponsorisés correspondant à de la publicité achetée au même titre que celle entre Plus Belle la Vie et la Météo.
On appelle ces résultats les résultats naturels car leur classement est dépendant d’un algorithme de Google qui va déterminer ce qui est le plus pertinent sur le terme de recherche tapé.

Ces mots-clés sont enregistrés et permettent ainsi aux personnes qui possèdent un site Internet de suivre par quel biais des visites organiques se font. Ce sont les visites depuis un résultat d’un moteur de recherche.

Cela a plusieurs effets :

  • la curiosité, tout le monde aime bien savoir comment on est arrivé à être lu
  • la recherche de sujets connexes, pour savoir par quoi sont interessés les personnes qui finissent par cliquer sur le lien de ton site
  • l’optimisation, pour savoir quelle requête génère un trafic intéressant et éventuellement permettre de rendre la page de destination plus attractive pour être mieux lue, générer un revenu publicitaire, vendre le produit présenté…
  • et tant d’autres choses.

La trace de la requête est l’empreinte que laisse un internaute sur son passage et elle est utile d’un point de vue d’analyse de trafic. Bien entendu, c’est une chose plus que généreusement utilisée par la branche marketing de l’Internet. Elle permet de connaître la typologie des visiteurs d’un site, ce qui les intéresse, leur proposer ce qui les intéresse, essayer de les attirer vers d’autres thématiques tout en les satisfaisant.

Voilà concrètement, chers amis, pourquoi nous aimons savoir ce que vous avez tapé dans un moteur de recherche, qu’on pose des cookies sur votre navigateur. Tout cela permet de récolter un grand nombre de données, en masse, et en réalité les outils que les marketeux ont à leur disposition ne permet pas vraiment de savoir si ma voisine Ginette a visité un site porno ou pas, à moins que j’aille poser un mouchard sur son ordinateur.

Les commerces offlines tel que les supermarchés de quartier font la même chose mais d’une façon qui a l’air de faire moins peur : ils font remplir des formulaires de satisfaction.
La seule différence est qu’on choisit de remplir le formulaire ou non.

À un moment donné, il n’y a pas si longtemps que cela, Google a proposé de cacher aux outils d’analyse utilisés par les gens du WebMarketing – dont je fais partie – aux personnes enregistrées sur leur compte Gmail. La montée en puissance de Google Chrome a permis à de plus en plus de personnes d’être en permanence connectées à leur compte.

Le résultat concret est le suivant : un webmaster voit les visites sur son site s’enregistrer, mais il ne sait pas par quelle requête cette visite s’est réalisée. C’est le Not Provided.

Une volonté de discrétion par les internautes

Mais chers amis internautes, vous êtes des flippés. Et c’est compréhensible. Des tonnes de données circulent dont certaines venant de vous personnellement, et vous ne savez pas vraiment ce qu’on en fait.

En revanche, il ne faut pas tellement s’inquiéter sur le fait qu’on sache que tu cherches à acheter des Tupperwares, ta donnée et ta trace sont noyées dans la masse. Sauf potentiellement pour ceux qui ont vraiment envie de savoir qui a voulu fabriquer une bombe avec une cocotte minute et un sac à dos. Cela se résume au Ministère de l’intérieur (coucou), au Ministère de la Défense (coucou), à la NSA (kikoo lol), à la CIA (ouaich, bien ou bien ?).

L’effet de la corbeille opaque

La protection de la donnée a toujours eu une image relative. Une donnée existante, si on ne la voit pas, c’est comme si elle n’existait pas. Ce phénomène est similaire à celui de la poubelle, que j’ai réétudié à l’occasion du mémoire Déchet Web, jeter, conserver, recycler le duplicable, lorsqu’Eugène Poubelle fut à l’initiative de la boîte à ordures à Paris par l’arrêté publié le 22 décembre 1883 [1. BARLES Sabine, L’invention des déchets urbains – France : 1790-1970, Paris, Champ Vallon, 2005, 297 p ].

Auto-citation (je suis trop prétentieuse) :

L’espace intermédiaire qu’est une poubelle est celui représenter par la boîte, le contenant. Lorsqu’on décide de jeter une peau de banane, on la met dans la poubelle et on la fait disparaître dans son conscient des objets présents dans la maison. Pourtant, la poubelle est toujours dans la maison, mais l’existence de la peau de banane a été déléguée aux services de gestion des ordures ménagères.

C’est là l’espace intermédiaire, une poubelle opaque, une boîte à ordure où ne voit pas ce qu’elle contient, et ce qu’elle contient tant qu’on ne la voit pas, elle n’existe pas aux yeux donc n’existe pas tout court.

Ainsi, ce qu’on ne veut pas faire exister aux yeux de quelqu’un ou de quelconque (robots, ordinateurs) est caché. C’est ainsi qu’on se fait tous avoir avec des mots de passe en clair à travers les réseaux mais qui ne nous inquiètent pas car des étoiles s’affichent à la place des caractères.

J’utilise cette analogie pour qu’on comprenne bien qu’on a l’habitude et surtout dans le numérique de rejeter et de ne plus faire exister en masquant une donnée. Rappelons nous de cette simulation d’erreur 404 par le gouvernement tunisien. Facebook censuré par le gouvernement tunisien sous le régime du Président Ben Ali aurait du apparaître avec un code 403. Seulement, connaissant les usage des internautes habitués à une erreur 404 pour une page non existante, le gouvernement a décidé de faire passer un code 403 pour un code 404 et ainsi passer de la notion d’interdiction d’accès à celle de la non existence de la page de destination.

Ce n’est pas car nous ne voyons plus vos requêtes qu’elles ne sont plus enregistrées

Le Not Provided n’est qu’une boîte à laquelle le marketing n’ont pas accès. Nous savons tout de même que la boîte contient un certain nombre de proportion de ceci ou cela. Aujourd’hui, on annonce un passage au 100% Not Provided par Google en permettant à toutes les pages cliquées depuis les résultats de recherche en protocole https qui correspond à la navigation privée. C’est de cette manière que la donnée de la requête de recherche est filtrée pour que nous autres personnes du marketing ne sachions rien de la manière dont une personne est venue sur notre site en faisant une recherche.

Seulement cette boîte a une clef, et on la prête à moitié aux personnes acheteuses de publicité sur les services de Google. En effet ces données, comme pour les résultats naturels, permettent d’orienter le travail de mise en avant de pages, de produits, avec tel terme ou un autre, etc.

Pardon pour ces plus de 1000 mots, en fait je pouvais résumer pour article en : on cache les données à qui ça nous arrange pour pouvoir rassurer les utilisateurs mais en vérité c’est pareil qu’avant.

Si ça vous intéresse :