Google souhaite depuis toujours répondre aux attentes des internautes avec efficience et efficacité. Nul doute que le moteur de recherche a progressé avec le temps et qu'il est de plus en plus simple de trouver ce que l'on souhaite (à condition de bien formuler les requêtes...). Dans cette démarche d'évolution, l'objectif ultime serait d'atteindre la recherche prédictive, à savoir des systèmes de "voyance" afin d'anticiper les recherches des internautes.
Dans les faits, cela semble compliqué à mettre en place, à moins de brancher des récepteurs directement sur nos cerveaux (et encore...). L'étape semble difficile à franchir pour Google, mais en couplant de nombreux systèmes, le moteur pourrait sensiblement s'en approcher, c'est ce que nous allons tenter d'étudier ici grâce à des brevets et un peu d'imagination... :D
La recherche prédictive de Google part de loin...
Pour ceux qui auraient un trou de mémoire, Google ne reste qu'un "robot", à savoir des ensembles de programmes qui génèrent les fonctionnalités d'un moteur de recherche. Si l'ironie est pesante dans cette affirmation, il est fondamental de se rappeler que Google est bête et méchant, il ne fait qu'appliquer une succession de programmes et d'algorithmes qui aboutissent au moteur puissant que nous connaissons.
Partant de ce constat, nous savons d'ores-et-déjà que la recherche prédictive est utopique en réalité, mais si Google apprend à nous connaître presque parfaitement, il pourra stocker moult informations à notre sujet pour passer à l'étape ultime, celle d'anticiper nos recherches (ou d'essayer en tout cas...).
Pour ce faire, le moteur a besoin de plusieurs choses :
- Des informations propres à chaque internaute stockées dans d'énormes bases de données (big data). Cela peut idéalement se faire par l'intermédiaire de compte Google (gmail, YouTube, Google+...) mais aussi par le dépôt de cookies par exemple (mais ce serait moins puissant et performant dans certains cas). Cela pourrait révéler à Google ce que nous aimons, ce que nous recherchons fréquemment, les périodes de recherche les plus fréquentes, etc.
- Des systèmes de récupération variés et puissants pour collecter ces données. Cela peut passer par des enregistrements vocaux (via la recherche vocale), des récupérations textuelles (via les champs de formulaire). Ces systèmes pourraient également savoir à partir de quel support nous nous connectons (PC, tablettes, smartphones...), etc.
- Des algorithmes costauds pour traiter ces informations. En effet, le souci d'une éventuelle recherche prédictive, c'est de bien connaître ses utilisateurs, et cela demande un grand (et long...) traitement d'informations.
Dans les faits, Google a déjà fait plusieurs pas en avant et Google Hummingbird, la dernière modification majeure de l'infrastructure du moteur, a bien fait évoluer cet aspect. Désormais, le moteur est capable de distinguer des recherches classiques (mots clés successifs à rechercher) des requêtes conversationnelles (phrases ou questions complètes auxquelles il faut apporter une réponse et non des résultats répondant bêtement à chaque mot tapé). C'est la première étape phare vers la recherche prédictive, nous allons voir que Google a déjà quelques brevets intéressants dans les tuyaux...
Des brevets dédiés évoquent la recherche prédictive
Ce qui est intéressant actuellement, c'est de savoir que Google travaille activement pour passer des petits caps dans la recherche prédictive, qui finiront pas le mener au plus près de son objectif initial : savoir répondre à tout, à tout moment, et avec précision.
Plusieurs brevets couplés peuvent fonder un système puissant et efficace en matière de recherche prédictive. Par exemple, afin d'améliorer des systèmes comme Google Hummingbird et la recherche vocale, le brevet Generating speech data collection prompts d'octobre 2012 laisse imaginer de belles perspectives d'évolutions. Son objectif serait de collecter des informations relatives à la parole en fonction des langues, des intonations, etc. Nous pouvons aisément imaginer qu'un tel système ferait évoluer considérablement la recherche vocale mais surtout l'enregistrement de données propres à certaines régions, au sexe (tonalité de la voie, etc.). Tout cela permettrait de passer un cap supplémentaire dans la collecte d'informations nécessaire à la recherche prédictive.
Dans le même esprit, le brevet Tailoring user experience for unrecognized and new users déposé en mars 2014 est très intéressant. Le système permet de générer en partie la base de données utiles pour faire des prédictions de recherche. En fait, l'idée est de suivre à la trace les comportements de groupes d'utilisateurs en fonction de leurs requêtes tapées mais aussi en fonction des types de recherches les plus utilisés et des domaines les plus visités. Par exemple, si nous tapons la requête "logo google", il y a de fortes chances que la majorité des internautes privilégient Google Images à la recherche web, cela donnerait une association logique entre les requêtes du type "logo [...]" et la recherche d'images, qui pourrait alors être proposée par défaut. Le brevet offre même des formules mathématiques (complexes) pour comprendre comment il souhaite constituer son corpus d'associations entre des faits, des mots et des groupes comportementaux. L'intérêt d'un tel système serait d'offrir des SERP différentes pour chaque utilisateur en fonction de son comportement, de ses habitudes, mais pour une même requête. Et si cela n'est pas possible, le moteur proposera des résultats propres à des groupes de comportements, et ainsi de suite en remontant vers la recherche non prédictive.
Le brevet Predictively presenting location based search types (octobre 2014 pour la dernière version) va aussi dans ce sens mais en se basant cette fois sur les supports de recherche. En effet, l'objectif du système est de repérer le type de support utilisé (mobile, tablette, etc.) puis de géolocaliser la recherche. Ainsi, en fonction de ces deux informations, l'interface d'affichage serait adaptée aux besoins pour être la plus efficiente possible. Prenons un exemple (décrit dans la figure ci-dessous) : si un utilisateur se connecte via un mobile et prend une photo avec son appareil, Google pourrait automatiquement géolocaliser l'information et fournir des résultats propres à l'image prise ou la localisation environnante, tout cela dans une interface adaptée au support. Ce n'est qu'un exemple d'application, le brevet en décrit bien d'autres, mais l'idée est alléchante. :D
D'autres brevets de Google décrivent d'autres systèmes similaires permettant d'améliorer le corpus "big data" nécessaire à la recherche prédictive. L'idée générale du système final est décrite dan le brevet intitulé Predictive analytic modeling platform de décembre 2014. En effet, une fois les données suffisantes collectées (plusieurs Teraoctets dixit Google lui-même !), les algorithmes du moteur de recherche analyseront en temps réel les requêtes afin de faire correspondre d'éventuels modèles prédictifs. Si un modèle est trouvé alors les SERP seront adaptées à ce dernier, que ce soit en termes de résultats purs ou d'affichage.
Des amorces de recherche prédictive ?
Je n'ai pas pu citer tous les brevets que j'ai croisé au sujet de la recherche prédictive, sinon vous auriez décroché depuis longtemps à la lecture de cet article (ne me dîtes pas que vous avez déjà lâché ? :D). La multiplication de brevets sur les deux ou trois dernières années prouvent bien que Google Hummingbird et Google Instant Search ne sont que des bases que Google souhaitent rapidement dépasser pour aller encore plus faire les prédictions de recherche.
Le constat que l'on peut faire après l'analyse de certains brevets est qu'il n'envisage pas la recherche prédictive telle que nous l'imaginons. En réalité, le moteur ne cherche pas à deviner ce que l'on veut chercher comme pourrait le laisser croire un tel système (Google n'est pas dupe et ne rêve pas encore de science-fiction pour son moteur de recherche, mais peut-être que cela viendra ?), il souhaite juste offrir des réponses plus adaptées et plus rapidement. Les premiers objectifs sont simples :
- pouvoir déterminer des groupes comportements et de les associer à des supports de connexion, des types de données ou de recherches voire à des requêtes-types.
- adapter l'affichage des SERP selon ces informations afin de répondre plus rapidement aux requêtes des utilisateurs.
J'ai noté deux brevets récents montrant l'évolution souhaitée de Google Instant Search, cela va dans le sens de l'efficience rêvée par la firme. Nous pouvons d'ailleurs imaginer des évolutions possibles du système d'autocomplétion prochainement (par exemple, Google pourrait afficher les meilleurs résultats des différentes options proposées dans les SERP avant que la recherche soit confirmée, etc.).
Une des premières évolutions (citée dans un autre brevet récent) a été dévoilée récemment par Presse Citron. Désormais, Google Instant Search peut répondre à une question (grâce à Google Hummingbird) avant même que la question ait fini d'être tapée complètement (dans certains cas propres à chacun). Cela signifie que des premiers corpus de recherche prédictive se mettent en place, permettant ainsi à Google de déduire la fin des requêtes et donc de proposer encore plus rapidement des résultats...
La recherche prédictive a donc pour but de nous proposer les meilleures SERP possibles selon nos propres usages mais aussi selon ce que nous utilisons ou recherchons. Si le Google omniscient vous dérange, vous n'êtes pas prêt d'être débarrassé... :D