Interview de Sylvain Peyronnet, chief scientist chez Qwant et chercheur d’IX Labs

Mathieu Chartier Référencement 0 commentaire

Introduction

Je suis honoré et enchanté d'accueillir Sylvain Peyronnet sur ce blog. Il me tenait à coeur de faire intervenir l'un des meilleurs spécialistes de référencement et d'algorithmie que nous avons la chance de pouvoir côtoyer. L'interview qui suit se déroule en 2 volets : l'un sur Sylvain, l'autre sur ses activités au sein de Qwant, le moteur de recherche français vraiment respectueux de la vie privée.

Je profite également de cette courte introduction pour remercier Sylvain bien entendu, mais aussi pour rappeler l'événement QueDuWeb qui se déroulera à Deauville fin avril et organisé par la famille Peyronnet. Vous trouverez davantage de détails sur ces deux jours de conférences exceptionnelles en fin d'interview, mais si je n'ai qu'un simple conseil à vous donner, foncez-y...

À propos de toi…

Pour ceux qui ne te connaissent pas, peux-tu te présenter en quelques mots ?

Sylvain Peyronnet, chief scientist chez Qwant et chercheur pour IX LabsTout à fait. Mon prénom est donc Sylvain, je suis passionné par pas mal de choses dont l’algorithmique au sens large, et son application au web et aux réseaux sociaux.

Point de vue boulot je fais pas mal de choses liées à ce domaine, chez Qwant et dans mes autres activités, dont les fameux ix-labs.

Quelles sont tes passions hormis les chiffres, les algorithmes et la recherche ? :-)

En fait j’ai l’impression que je n’ai que des passions, car finalement je suis toujours enthousiasmé par tout ce que je fais. En dehors d’une passion pour la science globalement, j’ai des centres d’intérêts plutôt « indoor » avec d’abord la sociologie, les sciences politiques, l’économie. Je suis un gros lecteur (sans doute bien plus de 200 livres par an, on peut dire que c’est une passion) d’essais mais aussi de polars et de SF.

En dehors de ça, j’aime bien bricoler et je suis assez joueur (JV, poker, etc.). Je suis fasciné par l’horlogerie et je ne suis pas fan de sport (j’en fait parce qu’il paraît qu’il faut, mais ça s’arrête là, sauf pour le golf qui est une activité permettant de réfléchir).

En quoi consiste tes missions dans le laboratoire ix-labs ?

Les ix-labs c’est un laboratoire privé qui a été pensé par des chercheurs un peu déçus du milieu académique pour pouvoir travailler sur les sujets qui nous intéressaient sans devoir rendre de compte. Je dirige le laboratoire et j’ai donc des tâches de gestion de notre petite équipe (nous sommes 4), mais mon premier job est de faire de la recherche et de l’ingénierie. Nous travaillons sur plusieurs domaines, mais globalement les trois quarts de notre activité de recherche à des applications en search et webmarketing.

Peux-tu nous présenter rapidement l’équipe ? La recherche et le web semblent être une histoire de famille… ;-)

Effectivement nous travaillons en famille. Nous sommes quatre, mais je vais commencer par l’extérieur de la famille avec Thomas qui a rejoint les ix-labs en septembre 2014. Il était auparavant enseignant-chercheur à la fac, et je le connais depuis environ 10 ans (il était encore étudiant). C’est un spécialiste des algos anti-spam et des systèmes de recommandation. Lucie et Guillaume sont ma sœur et mon frère. Lucie s’occupe de toute la partie rédactionnelle et de la communication/logistique liée à queduweb, sans elle rien ne serait possible sur l’événement ! Guillaume et moi bossons ensemble depuis très longtemps, pour du SEO, pour les formations, pour l’édition de sites, mais aussi sur des outils et problématiques algos diverses et variées.

Alors oui, nous travaillons en famille, surtout parce que nous avons tous une grande passion pour le web, et que nos compétences techniques (mais aussi nos « soft skills ») sont complémentaires. Travailler en famille, certains voient cela comme un risque ou une impossibilité, mais pour nous cela fonctionne, et même quand il y a des accrochages finalement ils passent vite, car nous nous connaissons bien…

(Pour voir l’équipe, suivre ce lien : http://www.ix-labs.org/equipe/)

 

Quelques mots sur Qwant…

Logo du moteur de recherche Qwant

Comment en es-tu venu à travailler pour le moteur de recherche Qwant ?

C’est un peu un hasard au final. Alors que j’étais encore universitaire j’ai croisé le patron de Qwant (au seocampus pour être exact) mais à l’époque il n’y a rien eu de plus que des discussions intéressantes. Quand plus tard je suis parti de mon poste de Professeur des Universités, je l’ai contacté et c’est là que nous avons commencé à travailler ensemble, d’abord un peu, puis de plus en plus pour en arriver à la situation actuelle.

Quelles sont tes missions au sein de Qwant ? Quel est ton poste exact ?

Mon poste exact est « chief scientist », je suis donc le directeur scientifique du moteur. Je bosse sur plusieurs problématiques, certaines proches de l’opérationnel, d’autres beaucoup plus prospectives. Par exemple sur le prospectif il y a en ce moment beaucoup d’effervescence autour des algorithmes de deep learning, et nous travaillons beaucoup sur le sujet pour voir si on peut créer un « edge » (avantage technique et concurrentielle) en utilisant ce type d’algorithmes. Pour des exemples proches de l’opérationnel, pas besoin de chercher très loin : comme tous les moteurs, Qwant doit lutter contre le spam, et donc la création de filtres est un de nos sujets importants.

La croissance de Qwant est-elle continue ? Comment se passe l’évolution du nombre d’utilisateurs ?

Là on sort de mon domaine, mais je sais que la croissance est continue et à titre personnel je me félicite de la vitesse à laquelle les choses se passent. ^^ Après j’imagine que si ça allait encore plus vite les chefs seraient encore plus contents. ;)

Après je ne peux pas trop communiquer là-dessus, et je te conseille de regarder les chiffres similarweb (par exemple), qui donnent une assez bonne idée de la croissance.

Evolution du traffic Internet du moteur de recherche Qwant de 2016 à 2017

Tu es tenu à une certaine confidentialité voire à un « flou » sur les technologies utilisées, mais peux-tu nous donner quelques noms et infos sur l’algorithmie du moteur ?

Effectivement je ne peux pas dire grand-chose. Par ailleurs il faut bien savoir que dans la chaîne de « production » du moteur, je suis à l’extrémité la plus lointaine de la mise en production, donc je ne sais pas tout non plus. ^^

Bref, certains noms peuvent être dits car Eric Léandri en a déjà parlé. L’algorithme Iceberg est un algorithme de calcul rapide de la popularité des pages. Il permet donc de quantifier quelles sont les pages les plus importantes (un peu comme ce que fait le pagerank donc). Nous avons des algorithmes antispam, dont au moins l’un a été baptisé d’un nom de légume (je n’en dis pas plus). Après, certains algos n’ont pas de noms, mais les technos utilisées sont connues. Par exemple notre algorithme de filtrage des contenus textuels pour adulte est basé sur des arbres de décisions qui analyse des critères liés au vocabulaire.

Ce qui caractérise les algorithmes que nous mettons au point, c’est le fait qu’ils ne sont pas basés sur des données personnelles. Comme nous ne faisons pas de tracking, nous ne pouvons pas (car nous ne les avons pas) utiliser les infos qui caractérisent une personne. Cela complique certaines tâches algorithmiques. Par exemple les moteurs usuels embarquent des signaux d’interaction utilisateurs, certains de ces signaux ne sont pas disponibles pour nous. Il faut donc faire les choses autrement, ce qui demande de la créativité ;)

Qwant est-il « intelligent » ? Utilise-t-il de l’intelligence artificielle et du machine learning, et pour faire quoi en général ?

Je n’aime pas tellement le vocable « intelligence artificielle » car il a des sens différents selon le gens. Pour les spécialistes c’est simplement une discipline de l’algorithmique, pour le grand public c’est comme dans les romans de science-fiction… Ceci étant, pour répondre à la question oui, bien sûr, Qwant utilise de très nombreux algorithmes de machine learning. Il y en a contre le spam, il y en a pour détecter les contenus et images « pour adulte », il y en a pour comprendre le sens des textes, etc.

Il ne faut pas s’y tromper, c’est une démarche usuelle que tous les moteurs emploient. Nous avons notre méthodologie spécifique (notamment en raison de l’aspect « no tracking »), mais nous faisons du machine learning comme les autres, simplement de manière un peu différente.

 

Question Bonus

Ton frère et toi (et la sœur n’est jamais loin !) êtes connus dans la sphère SEO, peux-tu nous dire quelques mots sur l’événement QueDuWeb que vous organisez à Deauville cette année ?

Logo de l'événement QueDuWeb

Oui, nous organisons QueDuWeb (https://deauville.queduweb.fr) pour la troisième année, et cette année la conférence aura lieu les 27 et 28 avril, toujours à Deauville. Comme les années précédentes, nous avons concocté un programme avec toutes les thématiques du web : du SEO bien entendu, mais aussi du neuromarketing pour le web, des retours d’expériences de startups, le référencement de sites wordpress, etc. Il ne faut pas avoir peur d’aller jeter un coup d’œil au programme, cela n’engage à rien : https://deauville.queduweb.fr/programme/

On approche de la date et il reste peu de places, il ne faut pas trop trainer en tout cas si vous voulez venir.

Merci Mathieu de toutes ces questions, et à bientôt !