Privacy #02 - Le moteur de recherche

par

Sans s’en rendre compte, la qualité des moteurs de recherche nous a permis de devenir de plus en plus productifs. On ne peut plus passer une journée sans avoir à chercher un truc, que ce soit au boulot ou à la maison.

Combien de fois avez-vous entendu ou dit “As-tu cherché sur Google ?”. Peut-être même que vous n’avez jamais utilisé autre chose que Google. Et c’est bien normal, son omniprésence ne laisse que peu de places à l’existence des autres moteurs de recherche.

Tout outil disponible sur Internet dispose d’alternatives gratuites et libres de droit. On ne le répétera jamais assez. C’est la même chose pour les moteurs de recherche !

Dans cet article, on va regarder de plus près le fonctionnement des moteurs de recherche et proposer quelques alternatives à Google pour utiliser plus sainement ces outils.

La pseudo-gratuité

On insistera à chaque article s’il le faut : si une société comme Google propose gratuitement un service, c’est que vous êtes le produit. Un outil ou une app peut ne rien coûter, mais elle vous demandera de créer un compte, ou au moins de renseigner votre adresse e-mail.

Une des meilleures méthodes pour collecter ces données est une nuance de la porte dans le nez. On vous demande de payer une certaine somme, ou de donner votre adresse email. Mais le système ne s’attend pas vraiment à ce que vous passiez à la caisse, sa vraie volonté étant de récolter votre adresse (qui sera de toutes façons connue si vous payez…).

Pour illustrer le propos : Comment vous manipule-t-on par le Non ? - XP Horizon #8

On vous recommande grandement toute la chaîne d’Horizon Gull, qui explique parfaitement bien les différents biais et méthodes de manipulation utilisés dans le marketing et au quotidien.

Une adresse email semble peu de choses par rapport à 2€ non ? Nous ne sommes pas habitués à payer notre usage quotidien d’un ordinateur ou d’un logiciel, donc pour se rémunérer, on collecte et revend des données. Tout le système économique de Google est basé sur cette théorie, et avec quasi-32M$ de revenus au dernier trimestre : ça marche bien.

Principe de base d’un moteur de recherche

Le fonctionnement d’un moteur de recherche semble évident : vous rentrez des contenus, ça tourne et pouf, vous avez des résultats plus ou moins pertinents.

La pertinence des résultats est calculée selon tout un tas de critères bien plus secrets que la recette de Coca-Cola. Chaque moteur fait sa sauce avec les sites et pages qu’il connaît et fait sa proposition. Les résultats vont ainsi différer d’un moteur à un autre, pour une même recherche.

Recherche "Microsoft" chez Google
Recherche "Microsoft" chez Qwant
Recherche "Microsoft" chez Bing

Mais en vérité, il se passe plein de choses intéressantes pendant ce temps-là, plus ou moins liées à votre usage passé. Ci-dessous, quelques cas qui vous ont déjà peut-être fait tiquer :

J’ai commencé à taper un mot et on me propose très souvent ce que je veux rechercher !

Ce système d’auto-complétion est bien pratique et permet de vous faire gagner du temps. Spécialement quand vous effectuez beaucoup de recherches. Il est aussi très utile pour les moteurs qui évite ainsi les fautes de frappe les plus courantes, en conditionnant la recherche.

Mais là où c’est pas mal, c’est que si je commence à taper “Mic”, le système devrait me proposer logiquement un mot assez générique, susceptible d’être recherché par le grand nombre. Mais non, il va me proposer “micromania” ou “michelin”.

On appelle ça une recherche “prédictive”.

Grâce à toutes les recherches effectuées sur Google, le système va appliquer une pertinence relative à l’usager. Comme je suis un joueur de jeux-vidéos, “Micromania” semble bien. On parle de Michelin dans les actualités en ce moment, donc c’est aussi pertinent. Mais en aucun cas je n’aurais une recherche générique.

Autocomplétion de "Mic" sur Google

Les publicités qui s’affichent sont toujours pour ce que je viens d’acheter ou de consulter

C’est probablement un des automatismes les plus criards de la publicité automatisée. Les sites posent parfois des encarts publicitaires, qui génèrent une pub automatique, via Google Adsense par exemple.

Google Adsense va alors se souvenir que vous avez recherché un aspirateur sur rueducommerce, et donc va désormais vous proposer des aspirateurs de même gamme, sur d’autres sites.

Toute publicité dépend désormais de votre navigation. Pendant longtemps, on a affiché des publicités relatives aux contenus du site, mais les annonceurs se sont rendus compte que cela marchait bien mieux si on affichait des encarts spécifique à l’usager. Un cookie publicitaire et hop, le tour est joué.

Ça marche aussi avec les vacances ou les voyages de manière générale.

Mon collègue et moi ne voyons pas les mêmes résultats, on tape pourtant les mêmes mots clefs !

Et oui, mais vos recherches passées sont - elles - différentes. Votre recherche demande la même chose, mais vos profils d’usagers vont nuancer la pertinence des résultats à afficher.
La liste des résultats peut drastiquement changer en fonction de la pertinence que prennent vos données dans le calcul.

Une recherche d’actualités va par exemple être forcément orientée sur votre ville ou même votre quartier. Grâce à votre adresse IP, obtenable gratuitement et sans votre consentement, on peut savoir votre localisation avec une assez bonne précision.

Essayez : https://www.ipfingerprints.com/

Grâce à ce profil, les moteurs peuvent établir une “bulle de filtres”, qui permet de conditionner votre recherche et les résultats associés sont directement dépendants de votre usage d’Internet.

En gros, le moteur vous sort un site que vous avez déjà consulté. Et vous enferme dans une sorte de circuit personnalisé pour que vous restiez en terrain connu. Il crée ainsi une illusion de pertinence, puisque tous les résultats sont bons.

Les réseaux sociaux en abusent également : on voit bien plus les posts des gens qu’on a déjà “liké” ou partagé que les nouveaux.

En savoir plus sur les bulles de filtres : https://fr.wikipedia.org/wiki/Bulle_de_filtres

Ce qu’il faut retenir, c’est que chacune de vos actions peut être utilisée pour déterminer un profil. Cela ne coûte rien, c’est un robot qui traque tout et qui va ensuite affiner les futures pages et recherches en fonction de ce qu’il connaît.

On ne peut pas contrôler comment le moteur de recherche fonctionne et nous espionne, mais on peut en choisir un qui ne traque pas nos actions…

Les moteurs de recherche existants

Voilà une liste des différents moteurs de recherche, plus ou moins connus. Sur chacun d’autre, nous avons recensé leur part d’utilisateurs, leur déclaration officielle sur l’usage des données personnelles. Certains ont même fait du non-usage de vos données leur fer-de-lance, comme Qwant ou DuckDuckGo.

Nota : Il n’y a que des moteurs disponibles dans plusieurs langues. Par exemple, Baidu est très utilisé, mais essentiellement en Chine, le moteur de recherche Yandex est également très connu, mais en Russie..

Nota 2 : On omettra également les pseudo-moteurs, qui sont en fait basés sur d’autres. Ask.com est basé sur Google par exemple, ou bien AOL Search sur Bing.

Intitulé

Création

URL

Part de marché 2018

Usage des données

Google

1997

https://www.google.fr/

92.86%

Oui

Qwant

2013

https://www.qwant.com/

< 0.2%

9.7M de recherches en 2017

Non

Bing

2009

https://www.bing.com/

2.41%

Oui

DuckDuckGo

2008

https://duckduckgo.com/

0.41%

Non

Yahoo

1995

https://fr.yahoo.com/

1.82%

Oui

 

Pour en savoir plus sur les différents moteurs existants : https://en.wikipedia.org/wiki/List_of_search_engines

Statistiques d'utilisation des moteurs de recherche (92% pour Google, bim.)

Retour d’expérience : Qwant

Depuis quelques temps, j’essaie personnellement d’adapter mon usage d’Internet, conformément à mes valeurs personnelles.

Je ne souhaite pas que des robots traquent la moindre de mes actions sur Internet, et tant bien que mal, je passe sur des outils alternatifs, plus respectueux de ma vie privée. J’ai désinstallé Google Chrome et suis repassé sur Firefox (on en parlera dans un autre article) et j’ai aussi changé de moteur de recherche.

Depuis Décembre 2018, j’ai donc dit au revoir à Google Search, pour passer à Qwant. Qwant est un moteur français lancé en 2013. Son principal argument pour attirer des usagers est qu’à la différence de Google, ses services respectent la vie privée et n’établissent donc pas de profil de recherche.

Page d'accueil de Qwant

Un peu sceptique au début, cela fait 10 ans que j’utilise Google, changer est super compliqué et au bout de deux semaines, je vais m’énerver, craquer et revenir sur Google.

Et bien que nenni. Non seulement cela fait 2 mois que j’utilise le moteur quotidiennement, mais je n’ai également pas ressenti de perte de productivité, dû notamment à une mauvaise pertinence des résultats de mes recherches.

Le moteur propose des publicités qui sont décidées en fonction de votre recherche, et pas du tout de votre profil. Ils ne tracent d’ailleurs rien qui serait associée à vos données personnelles. Les seules données rattachées à votre compte sont liées à la configuration du moteur (thème, langue, filtre adulte…).

Leur indépendance est établie, même s’ils ont toutefois un partenariat avec Bing, le moteur de Microsoft pour compléter ou valider les résultats qu’ils obtiennent.

Pourquoi Qwant et pas DuckDuckGo ?

Question que je me suis posé sérieusement. Tant qu’à changer de moteur de recherche, pourquoi ne pas passer par DuckDuckGo, dont la réputation de respect de la vie privée n’est plus à prouver ?

Et bien pour une raison très simple : Qwant est français. Leur siège social et de fait, juridiction sont basés en France. Grâce aux récents changements sur la vie privée en Europe - la RGPD - choisir un moteur dont la législation impose le respect de ma vie privée me semblait primordial pour garantir ce respect.
DuckDuckGo a des serveurs dans le monde entier, mais sa législation est Américaine. Et bon, on va pas se leurrer, c’est pas ce qu’il se fait de mieux en matière de protection des usagers…

Ce n’est toutefois pas la seule raison. J’aime l’initiative et l’état d’esprit qu’il y a derrière Qwant. Ils proposent Qwant Junior, pour offrir aux plus jeunes internautes des recherches garantissant leur sécurité.
Récemment, ils ont sortis Qwant Maps, basé sur OpenStreetMaps. Et comme je souhaite dans un futur proche arrêter d’utiliser Google Maps (difficile quand on a pas d’autre GPS…) je suis de très près l’évolution de ce service.

Bref, après 2 mois d’usage quotidien, je recommande chaudement Qwant à toute personne souhaitant utiliser autre chose que Google.

Le moteur de recherche est un des outils que l’on utilise quotidiennement, de façon personnelle et professionnelle. On a l’habitude d’utiliser des moteurs performants malgré leur apparente gratuité.

Bien évidemment, ce ne sont pas les seuls outils à utiliser vos données personnelles pour amortir leur service. De part son omniprésence, on parle énormément de Google mais il existe beaucoup d’autres systèmes qui profitent également de vos données, plus ou moins à votre insu.

La prochaine fois, on parlera des navigateurs et de leurs fonctionnalités de stockage des mots de passe et d’autres choses dangereuses comme des cartes bancaires (oui Google Chrome, c’est toi que je regarde !).