C'est devenu une rengaine, Gary Illyes, un des porte-paroles de Google, publie régulièrement des astuces pour les référenceurs sur Twitter. Intitulés DYK ("le saviez-vous ?"), ces tweets spécifiques au monde du SEO permettent de rappeler ou d'apprendre certaines précisions sur le moteur de recherche. J'ai pris le parti de vous présenter ces DYK sur ce blog en mettant en avant certaines informations ou rappels, et comme cela continue, je me vois bien obligé de garder le cap. ^^
Gary Illyes a tout d'abord donné quelques précisions sur l'usage des cookies par Google dans un tweet du 20 mars 2017. Il a reconnu que le moteur n'utilise pas les cookies des sites web en général, sauf si ces derniers sont obligatoires pour accéder aux contenus d'une page, etc.
DYK Googlebot generally doesn't make use of cookies, but it can if it detects it cannot get to the content without them? pic.twitter.com/UtEMg8g10n
— Gary Illyes ᕕ( ᐛ )ᕗ (@methode) 20 mars 2017
Le second tweet présenté ce jour est assez marquant puisqu'il concerne les exact match domains, à savoir les noms de domaine spammy qui contiennent plein de mots clés (exemple : construction-maison-individuelle-75-Paris.fr). Gary Illyes précise que les exact match domains ne posent problème que si le contenu de la page ciblé est spammy ou de mauvaise qualité, ce n'est donc pas "sanctionné" dans tous les cas de figures. Cette nuance est importante et explique sûrement pourquoi de nombreux domaines de ce genre persistent encore dans les résultats de recherche. Voici sa déclaration traduite de l'anglais :
Saviez-vous que les exact match domains ne sont pas intrinsèquement mauvais ? Ils ne sont pas bons si leur contenu est de mauvaise qualité ou du spam.
Dans un DYK du 22 mars 2017, le porte-parole de Google a rappelé que le robot GoogleBot ne fait qu'indexer le contenu, et c'est "l'indexeur" (pour reprendre ses termes) Caffeine qui effectue le rendu. Cela fait deux fois que Gary Illyes précise davantage le rôle de l'architecture Caffeine en relation avec GoogleBot, et on se rend bien compte que le robot n'est vraiment qu'un "simple" robot, qui parcoure des pages et renvoie les informations vers Caffeine, qui les traite.
Le tweet du 23 mars 2017 est très intéressant au sujet des URL canoniques. En effet, nous savons qu'en cas de contenu dupliqué (et dans d'autres cas), il est fortement recommandé d'insérer des balises <link /> contenant l'attribut rel="canonical" dans la section du code HTML. Cet attribut permet d'indiquer à Google qu'il existe des versions alternatives du même contenu et qu'une URL prime sur les autres. Gary Illyes a précisé que le rel="canonical" n'est qu'une indication très forte pour le moteur, et non une directive à suivre à 100%. Cela signifie que si d'autres signaux prennent le dessus pour une page canonique, Google peut tout de même la prendre en compte, etc. Par exemple, si une URL jugée comme un doublon reçoit des liens externes et se retrouve à avoir plus de poids que la page originale, Google ignore l'URL canonique...
DYK the rel-canonical is a hint, not a directive? It's a very strong hint, but it may still be outweighed by other signals pic.twitter.com/Aqkg4HmfnF
— Gary Illyes ᕕ( ᐛ )ᕗ (@methode) 23 mars 2017
Le tweet du 24 mars 2017 est déjà plus connu des référenceurs. Le porte-parole de Google a rappelé que la fréquence de crawl (les passages de GoogleBot) se calcule en fonction de la fréquence de rafraichissement des contenus (donc des modifications suffisantes dans les pages) et de l'importance de la page sur l'Internet. En effet, Google privilégie souvent les sites web qui présentent des sujets "chauds" ou d'actualités en termes de crawl, mais aussi ceux qui apportent régulièrement des nouveaux contenus ou des modifications dans les pages. J'estime donc ce DYK comme un rappel, mais toujours bon à prendre ! ^^
Le 25 mars 2017, Gary Illyes a rappelé que le rendu des pages web affiché dans la section "Explorer comme Google" de la Google Search Console est identique à celui utilisé dans les faits par le moteur. En d'autres termes, utiliser cette fonctionnalité revient vraiment à voir la page comme Google, que ce soit en termes de code source ou de rendu visuel des pages. Cela constitue donc un bon outil pour savoir si une page est mal lue, mal "vue" ou mal interprétée par GoogleBot, Caffeine et consorts.
Et enfin, terminons ce tour des DYK par le tweet du 26 mars 2017 avec une information sur Google Images. Gary Illyes a indiqué que le moteur d'images de Google possède un opérateur de recherche "src:" pour afficher toutes les images d'une source en particulier. Par exemple, si vous tapez la requête suivante, vous trouverez toutes les images indexées de ce blog : [src:https://blog.internet-formation.fr]. Pour être tout-à-fait franc, je connais beaucoup d'opérateurs mais je ne savais pas que Google Images avait celui-ci (au risque de passer pour un ignorant, je préfère être honnête... ^^).
DYK Google Image Search has a "src" search operator? E.g. [src:https://t.co/9EGtL34ivf]
Sunday project: what does it do exactly? pic.twitter.com/oqsSoJS025— Gary Illyes ᕕ( ᐛ )ᕗ (@methode) 26 mars 2017