Google améliore son correcteur automatique avec des suggestions de marques

Mathieu Chartier SEO 0 commentaire

Google a toujours utilisé un correction orthographique automatique dans son moteur de recherche, avec une phrase présentant une alternative à la requête tapée quand cela lui semble judicieux. Cela est toujours le cas, mais il semblerait que Google ait étendu la correction aux marques ou aux requêtes les plus populaires.

Le twittos John Doherty a rapporté ce phénomène sur Twitter le 3 février 2016, remarquant qu'en tapant juste "Pint" dans le champ de recherche de Google, le moteur lui proposait "Pinterest" comme alternative. Habituellement, Google affiche des termes "proches" quand il s'agit de correction orthographique. Ici, il présente directement la marque Pinterest, soit parce qu'il se focalise sur les marques, soit parce que Pinterest est la requête la plus populaire quand on commence par "Pint". Reste à déterminer quelle est la vérité là dedans... :D

Pinterest dans le correcteur orthographique de Google avec la requête "pint"

Ce système est d'autant plus intéressant que la correction orthographique ne fonctionne pas ainsi habituellement. Dans mon propre moteur de recherche PHP (ou dans son alternative WP Advanced Search pour WordPress), j'ai programmé un correcteur comme la technique l'impose en général, c'est-à-dire avec une analyse syllabique (métaphone), voire avec la distance de levenshtein. Ainsi, les corrections restent sensiblement proche des mots originaux. Google avait un peu ce même principe jusqu'à présent (enfin je pense, je n'ai pas la tête dans son code...), et il arrive parfois que le correcteur se trompe dans ses suggestions (normal, l'analyse syllabique ne peut pas toujours être parfaite).

Avec des cas comme celui de Pinterest ou de Facebook (voir après), on peut se demander si Google ne va pas plus loin dans la correction. Selon moi, il s'est constitué son propre index correctif, avec un algorithme de pertinence (quoi afficher parmi toutes les possibilités). Ce moteur de calcul cherche sûrement les vecteurs les plus proches de la requête à corriger (notion sémantique), voire les recherches les plus populaires. Ce système d'affichage des marques ne semble fonctionner que lorsqu'il n'y a qu'un mot dans la requête, donc cela confirmerait ce que j'ai dit précédemment, il s'agit sûrement de requêtes populaires mises en avant.

Sur Google.fr, je n'ai pas vu ce type de corrections, mais sur la version NCR de Google (sans géolocalisation), cela fonctionne même en français. Pour la requête "face", Google affiche "Résultats, y compris pour Facebook". Si vous voyez d'autres cas similaires, ne soyez donc plus surpris...

Résultats corrigés par Google pour Facebook (avec la requête "face")